QCon北京2023 参会见闻：大模型时代的技术人成长

作者｜曹洪伟

我目前致力于操作系统相关的研发，公司的目标是打造物联网时代的智能原生操作系统。如何实现操作系统的 AI Native 呢？带着这样的疑问我参加了 QCon 北京 2023 的大会。与 QCon 北京 2022 不同的是，身份变了，上次是分享者，这次是出品人，出品的专题是——大模型时代的技术人成长。

(资料图片仅供参考)

在大模型时代，技术人如何成长呢？划分为 3 个话题：

大模型时代的特点是什么？对个人提出了哪些新的要求？我们如何应对？

大模型时代新的开发范式是什么？通过新的开发范式，我们可以发现哪些新的机会？并如何去把握这些新机会？

对我们已有的业务，如何通过大模型为其赋能？在应用大模型相关技术的时候，我们又应该注意些什么呢？

三位分享的老师非常给力，三场演讲的效果在一定程度上达到了预期，因为现场还是出现了站票的同学。

大模型时代的个人成长

首先登台的是首都在线的吴锦晟老师，话题是大模型时代下的个人成长。

从国内大模型的发展开始，重点谈到了大模型的核心能力——涌现

Translation 60B

Math 60B

In-context Learning 130B

Chain-of-thought reasoning 130B

Knowledge combination 530B

Emotion Perception 530B

进而讲到了应该了解的一些常见应用场景——

面对大模型，对我们的技术体系提出了新的要求，例如：

每个人都是独立的个体，都应该根据自己的条件有着自己的思考。

如果时间充裕一些，随着技术成长相关话题的展开，我认为肯定可以给大家带来更多的帮助。

大模型时代的创业机会洞察

第二场分享对应着我们的第二个问题，但在会前我收到宜博老师的 PPT 时，我被惊到了，159 页的讲稿对于我们的专场 45 分钟简直是不能完成的任务。感谢宜博老师的大幅裁剪，现场的版本是精简版定制播放。

分享中以大量的落地场景开始，让我们了解到大模型不再是坐而论道，除了 ChatGPT 之外，基于大模型的应用已经在我们身边落地生花了。

大模型训练有三个要素：数据集数量，训练强度和参数，人与 AI 的协同模式同样有三种：Embedding、Copilot 和 Agent，但重要的还是开发范式的变化。

宜博老师深入浅出地讲解了大模型开发范式的 6 个层次，并以 LLMFarm 为例阐述了如何应用这一方式开发我们的 AI App。

其中的第一性原理是：AI First 就是没有大模型就不成立的应用。

大模型时代创业：

给高瞻远瞩的你三个建议

最后登台的是老朋友一乐，蓝莺 IM 在大模型火爆之前就已经是一款很不错的产品了，那么大模型又为这样一款 IM 产品赋能了什么呢？

一乐认真地分享了应用大模型中所遇到的挑战：⼤模型能⼒涌现需要⼤参数，以及胡编乱造的⼤模型⽆法解释，以及使用大模型服务的三种模式——PromptOnly，Embedding 和 Fine-tune。重要的是，指出了大模型应用中的常见错误观点：

进而，一乐给出了三点建议：

建议一：有出海的勇⽓，也要有冷静的思考

建议二：AI First，也要 AI Right

建议三：看得远才⾛得远，⾛⼀步看三步

蓝莺 IM 应用大模型的示例贯穿始终，包括让人眼前一亮的知识库联邦架构——

三场演讲，内容都是相当的充实，导致我只能被迫压缩互动环节，每一场分享都留下了些许的遗憾。

意犹未尽，青山不改，后会有期！