2025-12-15 14:35:56
754
临近2026,智能体、机器人的创新再一次掀起了一股热潮。那么立足现下,放眼未来,大模型和智能体究竟会有怎样的发展趋势呢?
12月9日,中国工程院院士谭建荣教授在中科金主办的《大模型与智能体产业创新峰会》上带来了一场难得的高密度分享,既有干货,也有一些有趣的猛料。
谭院士表示,要重视大模型,但千万不要忽略小模型。
他强调,大模型不是天上掉下来的,根基在“小模型”和建模能力。谭院士三十年前就开始做数据建模,而大模型之所以崛起,是因为长期的数据积累与建模工具链的成熟。“没有小模型,哪里来大模型?”
同时,谭院士,还给出了大模型的发展方向:从“越大越好”走向“精准小模型+行业智能体”。
他预判行业要转向“面向行业、面向产品”的小模型与智能体,而不是盲目追求参数规模。
此外,谭院士对于大模型关键技术也总结出了“十大关键技术”的演进路径:
初级阶段:深度学习、强化学习、模式识别、机器视觉
中级阶段:数据搜索方法、知识工程方法
高级阶段:自然语言理解、类脑交互决策、模型训练技术、模型蒸馏技术
这里,谭院士忍不住多次给 DeepSeek 团队点赞:并表示DeepSeek的突破主要来自“强化学习+模型蒸馏”。
同时,谭院士还点赞了科大讯飞在语音识别方面的贡献:“科大的语音识别做得非常好,去年国家科学技术进步一等奖,我本人也是评委之一,这个项目做得非常不错。”
对于智能体的发展,谭院士强调:必须依赖“云—边—端”协同:“单纯在设备端跑模型已经不够,未来智能体要在云、边缘计算和设备端之间动态协作。”
而对于目前一些企业用不好智能机器人的现状,谭院士指出:“有一条原因是共性的,凡是用得不好的企业,基本上缺乏对机器人开关、操作、维护、保养、编程的人,(员工们)不会。”
为此,谭院士团队研发了示教机器人,专门教人来如何操作、维护和保养,甚至他们还研发了一种“让机器人教机器人”的示教机器人,教机器人如何形成轨迹、位移、速度和加速度等, 值得一提的是,这个项目还争取到了科技部重点研发计划项目。
智能体技术要发展,就必须面向不同行业、不同产品落地。谭院士展示了他所带领的浙江大学团队的三个现实产业化案例:
核电站智能应急机器人、示教型智能机器人(机器人教人,也能“教机器人”)、多项机械装备数字化设计技术,已帮助多家企业实现转型升级。
下面是谭院士分享内容的整理,建议收藏细读。

01
大模型不是从天上掉下来的,不要忽视小模型
谭建荣:今天很高兴来到北京,参加中关村科金主办的“超级连接.智见未来”大模型与智能体产业创新峰会。这个峰会是我的校友华中科技大学喻友平为首主办的,我觉得我们同行之间的交流非常好,我把最近的学习、研究、应用大模型与智能体的体会向与会的各位领导、专家、来宾做一个交流汇报。
我来自浙江大学,华中科技大学毕业后分到浙江大学,是应用数学专业理学博士毕业,也是信息学部的首界国家杰出青年科学基金获得者。我主要从事数据建模与虚拟现实,数字设计与智能制造等方面的研究,对应的是大模型。
我们国家AI的模型有一千多个,这一千多个大模型肯定不是从天上掉下来的,模型从哪里来?几年前大模型出现,我就说要重视大模型,但千万不要忽略小模型,没有小模型哪里来大模型?小模型要布局建模,我的团队是国内最早从事数据建模的,数据建模这个池我三十年前就想过。三十年前我们从事CAD等,积累了大量的数据,这些数据要重用,要建模,没有建模就没有模型。
我培养了出了几个博士生,博士生的博士论文题目,跟申请国家自然科学基金的项目,70%是建模相关,包括建模的理论、方法、技术、工具、软件以及建模的应用。大模型一个重要的工作是建模。
02
把大模型落实到智能体这个载体上
现在人工智能搞得轰轰烈烈,人工智能主要包括三大部分,第一是数据,数据是人工智能的语料,所以我相信华为云、百度云、阿里云一定都很好。因为人工智能第一步是数据,第二步是算法,算法是核心,第三是算力,大模型需要大的算力才是大模型。而这三者,我个人认为要有一个载体,既包括软的部分,又包括硬的部分,就产生了智能体。
智能体也包括数据、算法,是人工智能的载体,英文名是agent。agent这个英文单词直接翻成中文可以翻译为代理,我们现在叫它智能体,叫得好听一点。人工智能的智能体要落实到载体,这个载体有哪些?现在常见的载体就是智能机器人,还有无人智能驾驶汽车、无人机等等,都要用到智能体的技术,把人工智能代理落实到载体上。
人工智能2022年美国OpenAI公司率先推出了ChatGPT,掀开了生成式人工智能新的一页。因为生成式人工智能可以生成文本、音乐、视频甚至可以生成解决方案。这个解决方案就要落实到智能体上。非常可喜的是今年春节我们中国杭州推出了DeepSeek,使得中国人工智能技术也处于国际前列。
03
生成式AI在很多场景已经超过了普通人
生成式人工智能为什么是颠覆性技术呢?过去我们也搞了人工智能的很多场景,搞得轰轰烈烈。但过去的人工智能应用场景,基本上都通不过图灵测试。但是现在的人工智能,不仅可以轻易通过图灵测试,而且无论是用ChatGPT还是DeepSeek写文章,比一般的秘书写得好。
当然我个人要加一个括号,比优秀的秘书写得还要差一点,比一般秘书好没问题。可以轻松通过图灵测试,这句话什么含义?这句话说明用智能体写的文章,放在我们面前,我们已经分不清这篇文章是人写的还是用人工智能写的。
为什么用人工智能写的文章,比一般的人和秘书写得好呢?因为一般人、一般秘书头脑里的知识有限,头脑里的数据更有限,利用生成式人工智能,可以应用大数据,不仅应用大数据,而且应用大模型。
04
模型就是定量的知识
我们今天讨论大模型和智能体,数据和模型到底是什么关系?这个问题我已经摆在那儿,很多人未必能精确回答,即使能回答也蛮含糊。
我个人认为,数据还是一盘散沙,我们的任务就是要把数据的联系找出来,要把数据的隐含的规律找出来,要把数据隐藏的价值挖掘出来,挖掘出来的东西叫做知识。知识工程是人工智能落地的一个重要途径。
人为什么是智能的?有智力?因为人有知识,小孩的智力差一点,因为很多知识没学到,年纪大的人智力会衰退,因为很多知识忘记了。所以知识工程是实现人工智能的主要途径,其中包括知识的获取、知识的成熟、知识的共享、知识的进化、知识的应用。知识这个东西,你应用知识的时候,本身可以产生知识,这就是知识进化。我应用你这个产品去产生新的知识,知识在不断迭代、不断进化。
我认为,知识可以分为两类。第一类定性的知识,第二定量的知识。我理解所谓模型就是定量的知识,大模型要几百万芯片卡对几百亿参数进行训练,训练什么东西?实际上就是训练它在各种场合下的定量关系,所以它能写文章。前面出现一个词,后面有一个衔接词,可能有几百个,但是他通过分析可以找出哪个是对的和错的连接,帮助人工智能的生成。所以一般来说,大数据大模型还要用到大的散列,对几百亿参数训练,就要用到几百万张芯片卡。
05
人工智能的十大关键技术
人工智能基本的关键技术,我总结了十大关键技术,这也是大模型智能体的关键技术。
这里列了四个人工智能的基本算法:第一深度学习算法,第二增强学习算法,第三模式识别算法,第四机器视觉算法。其中深度学习算法和增强学习算法是人工智能最基础的两个算法。深度学习是多重反向人工神经网络的搭建。而增强算法方面,最近DeepSeek的研发者梁文锋,也是浙江大学的校友。他最近在《Nature》发表了一篇文章,DeepSeek主要采用了两项关键技术,第一项是增强学习技术,第二项是模型蒸馏技术。所以深度学习和增强学习算法也是智能体最基本的两个算法。
这四个基本的算法,也是人工智能的初级阶段。
中期阶段是数据搜索方法和知识工程方法,也就是大数据。大数据对人工智能的促进是非常关键的,1956年提出人工智能后,相当长时间是坐冷板凳。为什么人工智能火起来了?有人认为是大模型挽救了人工智能。过去人工智能的技术路线是开发专家思维。开发专家的关键技术就是要强调因果关系。90年代,三十几年前,我开始学人工智能,90年代学人工智能怎么学法?当时有一个开发专家系统的数据软件,要写程序,写几万句,甚至几十万,几百万句全都是“因为这样,所以这样,否则应该是那样”的语句。而在自然界、人类社会和工程领域,有明确因果关系的还是非常少的,找出因果关系非常困难。而大模型,随着华为、百度、阿里巴巴,大量应用当中产生的大数据,不强调因果关系,而是关联。从大数据终找关联关系,人工智能的大陆从大数据通向智能发展再通向智能体。所以数据搜索方法和知识工程方法,就是利用大模型使得人工智能可以万法皆成。
而人工智能高级阶段是四项技术,首先自然语言理解。科大讯飞是语音识别,还不是语义识别,科大的语音识别做得非常好,去年国家科学技术进步一等奖,我本人也是评委之一,这个项目做得非常不错。使得汉语言包括其他语言的识别做到了国际领先的水平。语义识别是人工智能的成果,自然语言理解还是通用语言,生成文本,语言大模型,也是自然语言交互的典范。
人工智能很好,但任何技术都存在风险,人工智能同样存在风险,而且风险很大。大模型、智能体都有风险,风险在什么地方?其中技术上的风险,就是会出现幻觉。幻觉什么意思?有时候用DeepSeek,用ChatGPT写文章,大部分情况下写得很好,但有时候它会胡说八道,为什么胡说八道?就是幻觉。
自然理解是一个非常复杂的逻辑,特别是中文的逻辑不是太容易。我们过去中国人到美国、英语国家去生活,那必须要通过托福考试(1万词汇量)。第二要到美国、英语国家做研究,要GRE考试(2万词汇量)。现在很多人要到中国留学,中国也搞了一个汉语水平考试,中国人感觉很简单的题,老外都做不出来,因为语义理解有差。这个题目叫“张三跟李四在讨论王二的问题,这个时候王二进来了,张三就说,说曹操曹操到。”选择题有四个,张三刚到、王二刚到、李四刚到、曹操刚到,老外基本都回答曹操刚到。所以自然语言的道路很漫长。
另外一项关键技术是类脑交互决策,跟计算机交互,使计算机跟人脑一样聪明,这是我们现在生成式人工智能追求的目标。围绕大模型产生了两项关键技术,一是模型训练技术。ChatGPT 中的 GPT,就是生成式预训练模型的意思。第二模型蒸馏技术,通过蒸馏不必要的信息、不必要的关联都去掉了,蒸馏就变成瘦的模式,是一个轻量化的模式,不需要像原来想象的那么大的算力,当然一定的算力也是需要的,但可以大大节约算力。
06
大模型也要“精准”
瘦的模型,这个词第一次跟我们理工科发生关联就是精益生产,理论方法是在美国学成的。美国汽车工业学会总结丰田公司精益生产的基础上又提出了“准时生产”,连在一起就是精准生产。精准生产传到中国,管理学界的人非常感兴趣,理工科的人非常感兴趣,文科的人也非常感兴趣。现在我们国家服务中小企业,要精准。
同理,大模型也要精准,大模型要落地,就要开发国内智能体,开发面向行业、面向产品的智能体。所以我说大模型非常好,但不要忽视小模型,而且大模型起步点就是小模型,不要一下子搞大模型。
07
智能体不能只停留在端侧,要云边端协调起来
而智能体,它是设涉及人工智能、机器人学等多领域的概念。Agent,作为基于本体的智能核心,负责具有感知、理解、决策、控制等核心技术和工作,能够获取信息、理解问题,并作出决策,最终控制本体完成任务。所以智能体技术,是基于深度学习、强化学习等先进算法,能够处理复杂的数据,提取信息,并提取控制指令,这是智能体的基本概念。
大模型和智能体现在看起来,需要云、边、端协同发展。比如具身智能的智能体,过去我们理解附到端上,但现在看光到端上还不够,还要边缘计算,还要云端协同控制。
所以,大模型和智能体,特别是智能体需要云、边、端协调部署,可以同步协同,发挥各自的优势,对智能体能够发挥更大、更智能的作用。
08
智能体的产业化的三个案例
我的团队也从事这方面的研究,包括智能体、智能代理、智能机器人的研究,我们取得了很多发明专利也发表了一批高水平的论文,但要产业化,这是大学老师的短板。好在浙江大学政策宽松一点,允许老师和学生一起办企业。我跟毕业的博士生一起办公司,开发了核电的应急管理智能机器人。
浙江省是核电大省,最早的核电站就在浙江。后来又搞了三门核电站,当时是世界最大的核电站。核电站需要核燃料,核燃料发电后成为核废料,核燃料上料,核废料下料,操作、保养、维修过去都是人干,难免辐射。
机器的典型应用场景就是人进去不方便,有危害的地方。我们就开发了核电站应急管理智能机器人,做核电站管理机器人的团队很多,我们这个团队是做得最早,做得最好,得到了工信部的认可,2020年成功在上海证交所上市。
另外一个智能体的应用,示教智能机器人,我调研了很多机器人应用企业。很多企业应用很好,但也有一些企业应用效果不够理想。原因各有不同,俄罗斯大文豪托尔斯泰说幸福的家庭都是相似的,不幸的家庭各有各的不幸。但有一条原因是共性的,凡是用得不好的企业,基本上缺乏对机器人开关、操作、维护、保养编程的人,它不会。
我们开发了一个示教功能的机器人,机器人教你怎么操作、维护、保养。第二个示教,买了一个机器人来不会用,我就让机器人教机器人。教机器人什么内容?教机器人如何形成轨迹、如何形成位移、如何形成速度,如何形成加速度。
我们获得了科技部的重点研发项目,现在科技部重点研发计划非常难申请。863+973,现在863没有了,973没有了,只剩下重点研发计划。我们争取到这个项目,完成得非常好,完成得好就要产业化。
产业化有两个条件,浙江民营企业家,特别是温州的企业家到处在找产业化的项目,我们找到一个温州老板,成立了浙江图睿机器人公司。公司第一年卖了一百台,第二年卖到300台,第三年卖到500台,卖到500台时,发现场地不够用了。杭州地方政府给造厂房,提供支持。这个项目被工信部列为向“一带一路”重点推广的中国企业。
这里谭院士还提到了这个示教机器人的产业化进展,他展示了领导访问视察时的一张照片,并提到:“旁边戴眼镜的小青年就是我的硕士生,他在硕士期间参加了我的重点研发项目,毕业了他就跟我说,老师你把专利授权给我,我去把它产业化,这个示教机器人就是他开发的。”
2025年7月8日国务院国资委党委书记、主任张玉卓考察杭州炽橙科技公司,这张照片是我在向张主任汇报,汇报后,张主任非常高兴。
除了这三个案例,还有超大型低能耗大型空分装备设计制造技术、高档数控机床数字化正向设计的关键技术,大吨位深拉伸液压装备设计制造关键技术等等,成功帮助一批企业实现了数字化转型。也欢迎在座的各位领导、各位专家,有机会到杭州来,到我们浙江大学来进行技术交流、项目合作。我的报告就到此结束。谢谢大家!
内容来源:51CTO技术栈
https://mp.weixin.qq.com/s/togSO1lm_fQCCUparRGw_A