传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 41|回复: 0
打印 上一主题 下一主题

大模型LLM的未来发展

[复制链接]
跳转到指定楼层
楼主
发表于 2024-7-4 21:13:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
以LLM为代表的大模型显然暂时占据了当下AI潮流的鳌头,作为AI的新突破,其实也算属于婴儿期,那么未来会如何发展呢,不妨大胆猜测一下:
       1. 大模型随着更新换代,比如ChatGPT,应该越来越聪明,减少目前的诸多缺陷,比如借助内部的外挂手段,如检索LLM的增强生成Retrieval Augmented generation-RAG等。
       2. 响应速度会越来越快(如GPT-4o,响应速度达到人类级别,200-300毫秒),实时交互体验逐渐变好,加速应用的发展。
       3. 多模态的LLM(文本、图像、视频、音频等),对于物理世界的多通道信息的理解与输出控制,能够使得大模型更加聪明,综合能力更强(想一下,几个瞎子摸象)。
       4. 大模型的外挂时代(APP)即将到来。LLM外挂具有多种形式,小的,如各种基于LLM简单吐字的应用APP,如助理。大的,如各种利用LLM粗糙大脑的进一步精细化,应用具体化,如专业垂直模型、生产服务机器人、自动驾驶、自动系统、专业数字人等。
      5. 大模型个性化及专业化,产生能够应用到个人、教育或企业业务的专用垂直模型(如医疗大模型、科研大模型、物流大模型等)。未来,大模型内也可以包括大脑+小脑(个性化+专业化)的形式,而不仅仅是改变LLM内部参数的方式,或者加外部外挂(小脑)的形式。
      6. 大模型可以越来越小,从而嵌入手机、IOT物联网设备、机器人、无人机、无人船、无人车,可以采用“外脑(云端部署)+本地大脑+本地局部小脑”(如强化学习RL或传统优化控制方法MPC、甚至PID等)从而更加敏捷地控制具身智能的外挂体。
      7. 大模型随着初级的百模大战,会逐步过渡到生态大战,一个可能的结果是:Token免费使用,从而从生态赚钱(互联网的搜索引擎就是一个前例)。
      8. 大模型的算力恐慌未来会被新的计算技术突破,如量子计算的突破,得到缓解,并带来新的突破。
      9. LLM数据恐慌问题,或许通过LLM-Agent对物理世界的社会模拟、自然模拟一定程度缓解,也就是通过Agent在虚拟世界的交互,加上(部署在物理世界的海量基于LLM的智能体)对物理世界的交互与映射,在一个基于LLM-Agent的数字孪生世界,产生机器智能体自身对于物理世界的认识、知识规律的理解,作为LLM基于人类积累的网络形式知识的学习(training)补充,而进一步产生机器自己的新的混合智能。
本文来自罗汉江科学网博客。% l" r6 [9 ?: F  ]$ u  y. Q! Y
链接地址:https://blog.sciencenet.cn/blog-451666-1440853.html

0 L3 c3 f8 U) w( x0 e  d. F
]来源:人机与认知实验室(公众号)
编辑:李佳
链接:https://mp.weixin.qq.com/s/DeZNN2tkvoY1sQr-q3oYow
6 v' v1 _. c) L* U. Z6 t5 V& A

8 z  V  C# O1 }0 x4 a. e& v5 g
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表