在中国AI行业,清华大学是绕不过去的名字。

  月之暗面创始人杨植麟、智谱创始人唐杰、百川智能创始人王小川、面壁智能联合创始人刘知远……不是清华的教授,就是曾经在校就读。

  在AI的另一条赛道具身智能领域,也有相似的画面,星动纪元创始人陈建宇、加速进化联合创始人赵明国、星海图创始人高继扬、银河通用创始人王鹤……也统统是清华的教授和毕业生。

  更耐琢磨的,是这些人之间的关系。

  杨植麟的入门导师是唐杰,刘知远的导师,是清华大学教授孙茂松,孙茂松所在的清华计算机系,拥有中国人工智能领域的奠基人张钹。

  这不是校友录,而是一张家谱,四代人,一条链,中国人工智能的故事,就是这条链的故事。

  大多数人印象里,中国的AI是这几年才热起来的,好像之前什么都没发生过。

  但事实并非如此。

  1978年,清华大学自动控制系教授张钹转到计算机系,给自己定了个研究方向:人工智能与智能控制。

  他紧接着就开出了一门新课《人工智能导论》,连教材都是他结合国外资料,一页页编印的。

  在国外访学时,张钹逐渐摸清,人工智能的发展,必须利用数学工具来提升算法效率。于是他又找到了安徽大学数学系张铃教授合作,俩人隔着大洋通信,用最薄的纸,写最小的字,只为节省邮费。

  1984年,张钹与张铃联手,在人工智能领域顶级国际期刊上发表了论文,这是中国学者在人工智能领域的第一篇学术论文。随后,他又成为第一位国际人工智能联合会议上发表论文的中国科学家。

  此后很多年,AI经历了不止一次低谷。上世纪80年代,专家系统泡沫破裂,全球AI经费锐减,研究陷入寒冬;90年代到2000年代初,神经网络被质疑,AI屡遭唱衰。每一次寒冬,都有人离场,有人转向,有人觉得这条路走不通。

  但张钹一直留在清华,带学生、做研究,从教授成为院士,守着AI一步没挪。

  2015年,已近八旬的张钹提出了“第三代人工智能”理论框架——主张将数据驱动的深度学习与知识驱动的符号推理结合起来,解决AI系统不可解释、不安全、不可靠的根本问题。

  这个框架,深深影响了今天的众多大模型,是AI理论中的核心原则。

  张钹种下了中国AI的根,但根要长成大树,需要有人接着浇水。

  清华计算机系教授孙茂松,就是那个浇水的人。

  作为清华的资深教授,孙茂松在计算机领域工作了46年,如果说张钹是清华AI的奠基人,孙茂松就是承上启下的那一代。他主持研究的中文分词系统CSegTag,是自然语言处理的基础设施,所有后来搞中文NLP的人都绕不开。

  但孙茂松的贡献,还有他带出来的得意门生。

  比如2002年开始在清华读博的唐杰,毕业后拒绝了大公司的机会,留校任教专心做研究,他搞出了一个叫AMiner的学术搜索引擎——用AI挖掘学术网络中的关系,谁和谁合作过,谁影响了谁,哪个方向在升温。

  这个项目看起来是个小工具,却拥有大模型的关键能力——数据挖掘与知识图谱。

  2019年,唐杰创立了智谱。目标很明确:做中国自己的大模型,对标OpenAI。

  比如2002年本科入学的刘知远,原本没有像样的科研经历、没有竞赛经验,成绩也不突出,但孙茂松还是认定他的钻研劲头,把刘知远招至自己麾下读研。

  刘知远走的是和唐杰不同的路——唐杰做的是云端大模型,拼参数、拼算力;刘知远的面壁智能做的是端侧大模型,拼效率、拼落地。

  这棵树,还能继续开枝散叶。

  在唐杰任教清华期间,他带出了一个名叫杨植麟的学生,从如何寻找重要的问题、如何寻找解决问题的角度、如何做实验、如何写文章、如何做展示——科研入门的功夫,唐杰都手把手地传给了杨植麟。

  后来,杨植麟去了卡内基梅隆大学读博,师从苹果和谷歌的AI大牛。再后来,他回国创办月之暗面,做出Kimi。

  从张钹到孙茂松,到唐杰、刘知远,再到杨植麟。从1978年到2026年,四代人,48年。每一代人都在AI的前沿上,每一代人都把方向往前推了一步。

  清华系AI能长成参天大树,除了薪火相传,还有三件法宝。

  第一,是教授亲自下场。

  唐杰做智谱,不是“教授离职创业”,而是以清华教授的身份,带着学术研究成果,直接孵化公司。GLM模型的基础,是他在清华的研究积累;智谱的团队,是AMiner项目的原班人马。

  刘知远做面壁,同样如此。他至今还是清华计算机系副教授,同时联合创立面壁智能,学术身份和创业身份并行。

  以及在具身智能领域,加速进化的创始人赵明国,是自动化系教授,早在2000年就开始研究双足机器人。

  创立星动纪元的陈建宇,本人仍然是交叉信息研究院助理教授,公司就在院里孵化,是清华大学唯一持股的具身智能企业。实验室的成果,可以直接变成公司的产品。

  这在中国科创里,并不常见。

  大多数领域,学术和产业之间隔着一道“死亡之谷”——教授做研究,发论文;学生毕业,去公司;公司拿论文里的想法,慢慢做产品。中间隔几年甚至十几年。

  在人工智能领域,清华直接把这道谷填平了。教授不需要离职,研究成果不需要转移,博士生可以直接进项目。论文今天发,模型明天上——学术前沿和商业落地之间,几乎没有时差。

  这也是清华系人工智能企业起步迅速的原因之一——智谱2019年成立,现在已是9000亿港元市值,月之暗面只用三年,估值就达到300亿美元。

  不仅是因为资本的推动,还因为技术从实验室到产品的距离被压缩到了极致。

  第二,是顶尖人才梯队。

  2005年,图灵奖得主姚期智从普林斯顿大学归来,创办了清华学堂计算机科学实验班,人称“姚班”。

  姚班的定位很直接:培养与MIT、普林斯顿本科生具有同等甚至更高竞争力的拔尖人才。2019年,姚期智又创办了“智班”——人工智能班,专门培养AI方向的领军人才。2022年,交叉信息研究院下设的姚班、智班、量信班合并,下设计算机科学、人工智能和量子信息三个方向。

  姚班20年,智班7年,交叉信息院750+本科生、237名博士。

  这个数字听起来不大,但含金量极高。姚班的学生,入学前是各省信息学竞赛的顶尖选手,入学后接受的是世界级的研究型训练,成为了是中国AI最精锐的种子。

  第三,是紧密转化机制。

  2020年12月,清华大学智能产业研究院成立,由微软前高管,中国工程院外籍院士张亚勤担任院长。

  见识过产业最前沿的张亚勤,回来不是为了教书,而是搭桥。

  智能产业研究院的定位很明确:用人工智能技术赋能产业升级。它不是传统意义上的实验室,也不是孵化器,而是介于两者之间的“旋转门”——大学教授可以在这里做产业级研究,企业可以在这里找到学术前沿的技术,博士生可以在这里同时做论文和产品。

  有人在网上提问,为什么人工智能的赛道,清华可以良将如云?

  回答的人有很多,但有几条原因,一定绕不过去。

  第一是学术。从张钹1978年定下AI方向开始,几代人的学术传承就没断过。张钹做理论框架,孙茂松做NLP基础设施,唐杰做知识图谱——每一代人都在前沿,方向始终没丢。

  第二是技术。CSegTag、AMiner、GLM,几十年积累下来的技术底座,让清华在大模型爆发时不需要从零开始。别人在找方向的时候,他们已经在方向上了。

  第三是产业。教授可以同时做学术和商业,实验室可以孵化公司,清华可以持股。AIR把这套产学研机制制度化,技术从实验室到产品的距离被压缩到了最短。

  这三条原因,让清华的AI血脉,可以延续不断,开枝散叶。

  AI这个领域,经历过太多次洗牌。专家系统泡沫破裂,神经网络被唱衰,深度学习异军突起,大模型颠覆一切——每一次范式转移,都有人被淘汰、有人掉队、有人从头再来。

  产业断了,就要重新找方向、重新积累、重新从零开始。中国有很多领域是这样——追了十年,方向一变,前功尽弃。

  但清华的人工智能没有发生这样的遗憾,它始终有人在场。人在,阵地就在;阵地在,积累就在。

  这就是为什么中国AI能和OpenAI同台竞技——不仅是因为算力追上来了,也不只是因为资本涌进来了,而是因为40多年来,一直有人不肯下牌桌,一直有新人上牌桌。清华AI这张桌子,四十八年没空过。