【案例】 文心一言今日官宣,GPT-4提前“炸场”:凭自己能考进斯坦福ChatGPT热度还未散去,其开发商OpenAI就发布了更强大的“王炸”产品。3月14日,人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4,据报道,该AI在功能和一致性方面取得了前所未有的成果。
当人们还在震惊于ChatGPT对它老前辈AI们的革命性时,OpenAI已经用GPT4革了自己的命,令许多人感慨:“自然语言处理从业者要转行了”、“机器视觉不存在了”。01. 多模态能力——文本+图像文本处理上,GPT-4支持的输入文字上限升至2.5万字。在测试的26种语言中的24种中,GPT-4优于GPT-3.5和其他大型语言模型的英语表现,甚至囊括了拉脱维亚语、威尔士语、斯瓦希里语等资源匮乏的语言。
图为GPT-4的语言精准性(图中Mandarin即为中文普通话) 图像处理上,GPT-4支持用户上传图像,并能描述内容、指出图片不合理之处,并进行解释,能满足分析图表、解释梗图漫画、拍照解题等实用功能。 图为开发者演示视频中,测试者在白纸上画下网站草稿图,上传给GPT-4,就可以获得网站的HTML代码。 02. 可操纵性与创造性:用户体验更自由在官方演示里,GPT-4可以扮演“苏格拉底般的导师”,不直接给出答案,而是通过问题拆分来引导学生独立思考,也可以是“莎士比亚式的海盗”,测试中,GPT-4很忠于自己的个性,它甚至可以扮演直白、乖巧的AI助手。03. 为敏感、安全而努力在ChatGPT发布后,关于“如何让人类灭绝”等问题的回答一度令人惊诧,对于一些敏感、禁止内容,在GPT-4上有了更好的处理方式。GPT-4在面对禁止内容的请求时,响应倾向比原先降低了 82%,而 GPT-4 在响应敏感请求时,如医疗建议和自我伤害,其符合政策的概率提高了29%。尽管这难以完全规避各种不良的敏感、禁止请求,但监控机制确实比前代更加完善了。04. 自我训练与预测能力提升GPT-4 更新的一大重点是建立了一个可预测扩展的深度学习栈。主要原因是, GPT-4 在抵达用户面前,已经接受了大型训练,而训练量过大导致它无法进行广泛的特定模型调整。然而,基础模型的回答可能与用户的期待南辕北辙。为了尽可能保持一致,OpenAI 依然使用强化学习人类反馈 (RLHF) 来微调模型的行为。OpenAI团队开发了基础与优化设施,支持在不同规模下预测行为。 以上种种能力优化,促使GPT-4在模拟律师考试取得了前10%的成绩(它前辈GPT-3.5的成绩是倒数10%);做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800),获得了英伟达AI科学家Jim Fan“可以考进斯坦福”的高度评价。 但遗憾的是,在发布GPT-4时的论文中,OpenAI写道:“考虑到GPT-4等大模型的竞争环境和安全影响,本报告没有包含关于架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法或类似内容的更多细节。”这也引发了人们对openAI是否愈加封闭的猜测。 GPT-4的用户体验如何? 到目前为止,这项新技术不是免费的。OpenAI表示,人们可以在其订阅服务ChatGPT Plus上试用GPT-4,每月20美元,人们可以直接从原来的ChatGPT入口尝试使用GPT-4,但由于担心滥用,目前只支持文本功能,暂时无法上传图像,且每4小时内最多处理100条消息。 GPT-4的数据时间也停留在2021年9月,也就是说,在那之后的事,它可能无法回答。当你想问它,2023年3月15日发生了什么?它会告诉你,它无法预测未来,并且这超出它的知识范围。 开通plus功能后,用户可以选择三种模型,OpenAI给出了不同模型的区别。 可以看到,GPT4生成速度比较慢,但推理能力拉满,简明性最强,更有创造性。 基于GPT-3.5的ChatGPT常常爆雷出错,但GPT-4提供的信息会更加准确。 对GPT-3.5和GPT-4提同样的问题,但答案显然不同: 例如:让GPT-3.5和GPT-4列举泰山名人 ChatGPT-4: ChatGPT-3.5: 注意,如果你同时使用多个模型进行提问,需要排队等待。 为了观察它的创造性,我们让GPT-4与GPT-3.5同时以“春分将至”撰写中文歌词,可以看出,GPT-4确实更有文采一些,并贴心地区分了verse(主歌)和chorus(副歌)部分。 AIGC竞争白热化,文心一言能与之抗衡吗? GPT-4的刷屏霸榜无疑把压力给到了即将召开“文心一言”发布会的百度。 2023年2月28日,百度官方宣布:百度计划于3月16日14时在北京总部召开新闻发布会,主题围绕文心一言。 文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品,被外界誉为“中国版ChatGPT”。文心,是指百度文心大模型;一言,是文心大模型上的一个应用。 自ChatGPT问世以来,关于AIGC领域的科技比拼一直备受关注,网友也对国内相关产品的发展充满期待。与GPT-4相比,文心一言有哪些看点呢? 3月14日,百度方面表示,百度智能云已经通过三大动作全面升级云服务能力:去年12月发布国内首个全栈自研的AI基础设施“AI大底座”、今年2月升级AI研发运营一体化(MLOps)能力、3月百度阳泉智算中心完成升级。据透露,“文心一言”背后的算力基础设施均由百度智算中心支持,后续百度多个智算中心也将为“文心一言”面向产业的规模化落地提供底层支撑。 此前百度创始人、董事长兼CEO李彦宏也表示对文心一言未来的发展充满信心。“百度的文心大模型是中国市场非常本土化的大语言模型,这意味着百度现在正在研发的文心一言,将比国外开发的模型更适合中文和中国市场。”
[参考文献] [1]GPT-4全网首个测评来了!逻辑性、创造性,你想知道的我们都测了[DB/OL].清元宇宙.2023-03-15 [2]业内|GPT-4来了:10秒钟做出一个网站![DB/OL].纸上谈兵.2023-03-15 [3]文心一言发布在即 百度智能云升级三大配套云服务[DB/OL].新华网.2023-03-15 来源:全媒体探索 [color=rgba(0, 0, 0, 0.9)]编辑:吴氏垂心
|