文 / 郭添 

来源 / 节点AI 

6月12日,北京智源大会开幕。

1场主论坛、24场平行论坛,两天塞得满满当当——大模型、AI自进化、具身智能与人形机器人、智能体以及世界模型,基本把眼下AI圈最热的议题都包括了。

嘉宾阵容特别豪华:2位图灵奖得主、8位院士、40位AI公司CEO和创始人、30位30岁以下的青年科学家,累计200多场演讲。

这么说吧,基本上你叫得出名字的AI圈大佬,这两天大概率都聚集在中关村国际创新中心。

第一天聊的是大模型、AI自进化与智能体,现场嘉宾更是各种爆金句,我们帮你筛选了下最有看点的内容,看看他们到底讲了什么?

AI进步飞快,但替代不了人

第一天的开幕式中,两位图灵奖得主做了主题演讲,在我看来这算是给时下的AI行业做了一个总结,并且指引了未来需要解决的问题方向。

强化学习之父Andrew Barto则回溯了强化学习的心理学源头——80年代课本里的心理学家桑代克,到今天的世界模型。密码学先驱Whitfield Diffie提出了自己的见解:不要只盯着AI,要在动物智能、人类智能和机器智能的更大坐标系里思考。

最出圈的环节是王坚和黄铁军的对话。

王坚是中国工程院院士、阿里云创始人,黄铁军是智源研究院理事长。两个人金句不断。

当谈到中美竞争时,王坚说了一句很提气的话:"六七年前,我担心我们看到的是个游泳池,别人看到的是大海。但今天我可以说,中美看到的是同一片天地。至于谁离得近一点远一点,那是技术性问题。"

很多打工人关心AI越来越强,会不会替代人类?王坚的回答很干脆:"我坚定不相信。狗的鼻子比人灵敏很多,可我们从来没觉得有什么威胁。"他自称是,无药可救的乐观主义者。

神经网络、强化学习,这类核心技术本身就是模仿人类智能本身的,王坚抛出了一个很有意思的观察,“我们说大模型有幻觉,但hallucination这个词本来就是用来形容人的,我们今天讲所有大模型的问题,找出来看一看,原来都是来形容人的。”

虽然国内大模型技术公司的创新能力越来越强,对话型的Chatbot,再到能解决实际问题的agent,核心技术范式大多都是美国公司提出来的。现场有个问题,我觉得值得深思,那就是,我们中国有机会提出自己的智能问题、技术路径和创新范式吗?

黄铁军的观点相对中庸,AGI是个人类的大叙事,我们作为研究者也好,开发者也好,企业也好,能够在这样的一个进程中,都有自己的贡献就好。

王坚更是沿用了一直以来的乐观,“绝对有机会提出自己的智能问题,不提出都是你的过错。”

谈及未来,若希望智能能普及解决更多问题,王坚最后说的一句话,我觉得值得单独拎出来,“Token太贵了。一定要让Token变得不值钱,就像一张纸一样。”只有技术普惠,AI才能惠及普罗大众。

大模型巅峰圆桌:模型能力还能涨多久?

AI会重构世界,这是毋庸置疑的,这不开幕日下午就讨论上了。智源研究院院长王仲远做主持,小米MiMo负责人罗福莉、生数科技创始人朱军、面壁智能首席科学家刘知远、南洋理工大学教授安波同台,就该话题发表观点。

比如,模型能力到顶了吗?

罗福莉的回答是没有。她认为当前最强的模型仍然是scaling路径上的中间产物,参数规模、数据规模、合成数据、强化学习,几个维度都还没走到尽头。朱军从视频模型和世界模型的角度补充:这两个方向也远没有到scaling边界,潜力还非常大。

AI Coding的发展从去年以来有目共睹。

对于此,刘知远的分析最有启发。他说代码大模型之所以能快速迭代,核心是因为代码任务完全发生在数字世界中,数据特别容易形成闭环。Cursor的成功就是找到了这样一个闭环。他的推论是:任何专业领域,只要能形成类似的数据闭环,AI都有可能快速突破。代码大模型的启示不只是写代码能力变强,而是它率先跑通了数字世界里的数据飞轮。

他还说了一句话,工业革命的标志是机器制造机器,智能革命的标志就是AI制造AI。

年初小龙虾横空出世,给大众普及了一波智能体,半年过去了智能体到了什么阶段?

安波的判断比较冷静:还在起步期,目前偏通用能力展示,未来更大的潜力在垂直行业。他特别强调一点——AI自进化不能完全封闭循环,必须有真实世界的反馈。“如果AI只在封闭环境里自我生成、自我训练,可能很难融合到真实问题中。”

罗福莉也观察到一个有意思的变化:上一代模型的能力上限是执行,指令清晰就能完成任务。但现在的模型开始从执行外延到解决更抽象的问题——设计实验、验证结果、规划流程。目前和顶尖研究员的差距,主要还在“提出值得验证的假设”,这一步,但这个差距在被更强的模型慢慢逼近。

大模型势必会重构世界,几位嘉宾基本达成共识,语言模型会先行,因为数字世界的数据闭环已经跑通了。接下来,世界模型潜力巨大,但还在早期,需要解决高效模拟、物理世界数据获取、真实世界奖励机制等一系列基础问题。朱军的判断是,先做到60%,不要一开始期望太高,很快就可能到70%、80%。

智源一个让人印象深刻的特点是年轻。新成立的行为世界模型创新中心,负责人陈博远只有22岁。悟界系列几个Leader都是30岁左右。

上午场中王坚一个激进的观点,我觉得可以沿用到下午场——“飞机飞起来30多年以后才成立航空系。如果AI是一个大变革,我们可能真的还远没有到成立真正意义上AI系的时候。所以对年轻人来说,这个世界还是非常早期的。”

既然这个世界很早期,年轻人如何应对AI 发展太快的问题?

罗福莉认为,要保持好奇心,极致使用AI,通过大量试错培养自己的判断力和品味。“AI进展太快了,我们每个人都需要不断思考,人和AI各自应该发挥什么优势。在这其中,最稳定不变的特质就是探索欲和好奇心。”

刘知远总结了三个词:敢为人先、能够坚持、持续自我否定。朱军说了一句很安慰人的话,如果你感到焦虑,也不用过分焦虑,因为你身边的人可能比你更焦虑。

安波最实际:选对方向比学历重要。"关键不是你是本科还是博士,而是你做的问题是否重要,能不能在一线真正做出东西。"

最后说一个好玩的。

智源做了一个听会智能体Soul Agent,如果你实在分身乏术,那就创建一个AI分身,你听A场,分身替你去听B场,实时总结嘉宾观点。如果那天在上班没法到场,也可以让分身全程参会。智源开放了2000个免费体验名额,每个人送1亿Token。

第一天的内容聚焦数据世界,智源大会第二天的重点将转向物理世界,即世界模型和具身智能。

智源会正式介绍正在研发中的世界模型悟界,以及全球最大的神经科学数据集,据说能用AI还原人的梦境,他们管这叫周公解梦。具身智能论坛全天,据说至少15家估值超百亿的具身CEO齐聚。如果你对AI进入物理世界这件事感兴趣,不要错过接下来的大会。

如果到不了现场,让AI分身替你去听吧——这本身就挺AI native(AI驱动)。