传媒教育网

标题: 大模型LLM的未来发展 [打印本页]

作者: 刘海明    时间: 2024-7-4 21:13
标题: 大模型LLM的未来发展
以LLM为代表的大模型显然暂时占据了当下AI潮流的鳌头,作为AI的新突破,其实也算属于婴儿期,那么未来会如何发展呢,不妨大胆猜测一下:
       1. 大模型随着更新换代,比如ChatGPT,应该越来越聪明,减少目前的诸多缺陷,比如借助内部的外挂手段,如检索LLM的增强生成Retrieval Augmented generation-RAG等。
       2. 响应速度会越来越快(如GPT-4o,响应速度达到人类级别,200-300毫秒),实时交互体验逐渐变好,加速应用的发展。
       3. 多模态的LLM(文本、图像、视频、音频等),对于物理世界的多通道信息的理解与输出控制,能够使得大模型更加聪明,综合能力更强(想一下,几个瞎子摸象)。
       4. 大模型的外挂时代(APP)即将到来。LLM外挂具有多种形式,小的,如各种基于LLM简单吐字的应用APP,如助理。大的,如各种利用LLM粗糙大脑的进一步精细化,应用具体化,如专业垂直模型、生产服务机器人、自动驾驶、自动系统、专业数字人等。
      5. 大模型个性化及专业化,产生能够应用到个人、教育或企业业务的专用垂直模型(如医疗大模型、科研大模型、物流大模型等)。未来,大模型内也可以包括大脑+小脑(个性化+专业化)的形式,而不仅仅是改变LLM内部参数的方式,或者加外部外挂(小脑)的形式。
      6. 大模型可以越来越小,从而嵌入手机、IOT物联网设备、机器人、无人机、无人船、无人车,可以采用“外脑(云端部署)+本地大脑+本地局部小脑”(如强化学习RL或传统优化控制方法MPC、甚至PID等)从而更加敏捷地控制具身智能的外挂体。
      7. 大模型随着初级的百模大战,会逐步过渡到生态大战,一个可能的结果是:Token免费使用,从而从生态赚钱(互联网的搜索引擎就是一个前例)。
      8. 大模型的算力恐慌未来会被新的计算技术突破,如量子计算的突破,得到缓解,并带来新的突破。
      9. LLM数据恐慌问题,或许通过LLM-Agent对物理世界的社会模拟、自然模拟一定程度缓解,也就是通过Agent在虚拟世界的交互,加上(部署在物理世界的海量基于LLM的智能体)对物理世界的交互与映射,在一个基于LLM-Agent的数字孪生世界,产生机器智能体自身对于物理世界的认识、知识规律的理解,作为LLM基于人类积累的网络形式知识的学习(training)补充,而进一步产生机器自己的新的混合智能。
本文来自罗汉江科学网博客。
, S) a" Q* ^9 u; V2 Z- ]5 [) j( e链接地址:https://blog.sciencenet.cn/blog-451666-1440853.html

% p* i( f1 J! N
]来源:人机与认知实验室(公众号)
编辑:李佳
链接:https://mp.weixin.qq.com/s/DeZNN2tkvoY1sQr-q3oYow: H) O& I5 P0 k

: w7 O- I5 D- B: s2 @( `




欢迎光临 传媒教育网 (http://47.106.15.148/) Powered by Discuz! X3.2