QCon北京2023 参会见闻:大模型时代的技术人成长

来源:   2023-09-09 11:30:03

作者|曹洪伟  

我目前致力于操作系统相关的研发, 公司的目标是打造物联网时代的智能原生操作系统。如何实现操作系统的 AI Native 呢?带着这样的疑问我参加了 QCon 北京 2023 的大会。与 QCon 北京 2022 不同的是, 身份变了, 上次是分享者, 这次是出品人, 出品的专题是——大模型时代的技术人成长。


(资料图片仅供参考)

在大模型时代, 技术人如何成长呢?划分为 3 个话题:

大模型时代的特点是什么?对个人提出了哪些新的要求?我们如何应对?

大模型时代新的开发范式是什么?通过新的开发范式,我们可以发现哪些新的机会?并如何去把握这些新机会?

对我们已有的业务, 如何通过大模型为其赋能?在应用大模型相关技术的时候,我们又应该注意些什么呢?

三位分享的老师非常给力,三场演讲的效果在一定程度上达到了预期,因为现场还是出现了站票的同学。

大模型时代的个人成长

首先登台的是首都在线的吴锦晟老师,话题是大模型时代下的个人成长。

从国内大模型的发展开始, 重点谈到了大模型的核心能力——涌现

Translation 60B

Math 60B

In-context Learning 130B

Chain-of-thought reasoning 130B

Knowledge combination 530B

Emotion Perception 530B

进而讲到了应该了解的一些常见应用场景——

面对大模型,对我们的技术体系提出了新的要求,例如:

每个人都是独立的个体, 都应该根据自己的条件有着自己的思考。

如果时间充裕一些, 随着技术成长相关话题的展开, 我认为肯定可以给大家带来更多的帮助。

大模型时代的创业机会洞察

第二场分享对应着我们的第二个问题,但在会前我收到宜博老师的 PPT 时,我被惊到了,159 页的讲稿对于我们的专场 45 分钟简直是不能完成的任务。感谢宜博老师的大幅裁剪,现场的版本是精简版定制播放。

分享中以大量的落地场景开始,让我们了解到大模型不再是坐而论道,除了 ChatGPT 之外,基于大模型的应用已经在我们身边落地生花了。

大模型训练有三个要素:数据集数量,训练强度和参数,人与 AI 的协同模式同样有三种:Embedding、Copilot 和 Agent,但重要的还是开发范式的变化。

宜博老师深入浅出地讲解了大模型开发范式的 6 个层次,并以 LLMFarm 为例阐述了如何应用这一方式开发我们的 AI App。

其中的第一性原理是:AI First 就是没有大模型就不成立的应用。

大模型时代创业:

给高瞻远瞩的你三个建议

最后登台的是老朋友一乐,蓝莺 IM 在大模型火爆之前就已经是一款很不错的产品了,那么大模型又为这样一款 IM 产品赋能了什么呢?

一乐认真地分享了应用大模型中所遇到的挑战:⼤模型能⼒涌现需要⼤参数,以及胡编乱造的⼤模型⽆法解释,以及使用大模型服务的三种模式——PromptOnly,Embedding 和 Fine-tune。重要的是,指出了大模型应用中的常见错误观点:

进而,一乐给出了三点建议:

建议一:有出海的勇⽓,也要有冷静的思考

建议二:AI First,也要 AI Right

建议三:看得远才⾛得远,⾛⼀步看三步

蓝莺 IM 应用大模型的示例贯穿始终,包括让人眼前一亮的知识库联邦架构——

三场演讲,内容都是相当的充实,导致我只能被迫压缩互动环节,每一场分享都留下了些许的遗憾。

意犹未尽,青山不改,后会有期!