传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 212|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】) R  @( U1 E, P
0 y# F9 n! T# h% }* {' ~+ O* [( i
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京


9 _2 O9 D7 G+ _. K0 T4 ]! I
新智元报道  
编辑:编辑部
- I2 P; R/ z$ C( w$ V4 n/ j
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。  `5 A( r7 P' T/ z; g
" ~% {: i4 S1 ~+ v; l

! T* K; l, f, W* {  G* n  GPT-4又双叒叕变强了!
, {2 e: Z9 ^8 q" u' p  K! W* @

4 S' F: l: A2 L  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview4 J0 M1 L. U# B, m5 k
5 x- g7 ~  _: v) y
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
; n& b" m$ e  {' j% x% g3 S, I. ^: W0 p  Z! S' d+ ]& P
0 ^3 r, q& P* O( `, W

4 n! e5 S, t/ ^8 c3 M; P( ?
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。6 c& ?8 F# h4 D( W! _

8 A. d1 a5 g; k$ W5 X  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。* J# J# C# u% ^( L" }  o7 q

2 {3 T5 U& q0 s6 P  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
- X. [: i; E# ~2 ~# i% R0 N

+ y5 T8 |) l; ^- P2 A7 [' ?( l  两个新一代embedding模型:
: i. W# O* }8 s
, Z+ P1 O( V8 _/ [& K8 h( _
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。* I. T% R! l! a- n/ R1 c
  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。# }5 A) M+ O. E; Y! i: I% k
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
3 Q. [# T$ q8 W1 {7 Z1 R+ j% d% Y# h# `+ U/ A

  ?+ R. c* s$ Z" j9 a" S7 x
- \" }0 k# k/ D; H6 p
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
) O* b! I) T4 T0 o& T. o
8 l+ Q# @9 m! }0 e; Z( r2 G
  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。# g" `3 F- c  T0 _' K
2 Y0 p# `, A& l
  新模型还修复了一个影响非英文UTF-8生成的漏洞。& I& }- J$ |: X% f7 J; ?" E0 A# A' w
  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
9 T, s% n9 ]6 l5 p! e8 }& ]

* u- S+ U( {! V4 s  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。5 Z& F; i5 m* q  y. i. d

) K4 y% u5 H# ~! H# I* {  p
5 x% d3 y( \* @  ^" M0 r6 Q/ x- z
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
6 _4 g. |9 k* }; p! L

) F8 g2 P& ]/ E0 B4 W  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。3 L8 \+ s8 K- u: t3 K( ^' F6 W

/ I# U; T; U# x5 ]! P* [  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。" B* N3 h8 `, W$ O& C# K0 s
  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。. {% `1 t1 z8 Y2 T
( E$ ^: E& p! g* L1 F$ V: d1 D
  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
2 j" z" n7 C) H1 T  j( L% R5 G8 d; U, v$ q

; y* \5 f% W! D& x3 s
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。1 u2 X) K3 C2 ~+ r( U' R: w% g
$ u) p9 J( f: V
: j  |2 G3 K& \, u: P! d
/ N$ N, u4 D% v
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。5 Y! V% L6 C9 p1 @# ]
  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。* B/ V2 c, K% |0 B, Z: W4 p& F1 d

% b# W8 y* P( L" W0 b1 e6 R  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
, s2 X( _  a4 C: Y$ X  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。! z& |* R; B8 I, H; p

7 i, E* y4 I) O7 T% ?  o) D

0 [( n0 @+ S! t# a, `* ~  - 性能更强
  L7 i1 [2 X0 v

  a& y7 A, P+ `4 d  z  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
; R8 U$ Z& w% Y# O# X+ u) }0 T+ P6 @  O9 x# ~7 a0 u1 F4 _  m

/ Y; y0 @9 D5 U  - 价格实惠
( w# s1 Z% z- S5 e7 ~; H

& n1 h1 \. C. H! L" \  _; x+ N) ~  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。
- [  t1 g6 i2 g0 y0 Z

, m, u- ?4 I# \: \7 _% f$ b5 L# e  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
& u; O% m; j( K; B% `9 V0 X* F: x3 S, |3 I/ G" s  Q4 y7 W; M, K
/ v1 p1 I) f' n& y' t
「大」文本嵌入模型:text-embedding-3-large
4 U2 D1 p: H7 c
% ^! z$ x9 S2 @- }& K7 H( p/ C
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
- V6 \+ z. H. ^  C9 Z  text-embedding-3-large是OpenAI目前性能最强的模型——. F. A3 ?8 H; l" F( s: Q1 O
9 @( N( P& y) U' l1 S
  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。% r- @& P: _8 K1 |/ r! K3 @& J
7 C- V3 O2 |1 _$ h/ x6 N
, D! ~; f- p8 G$ v; u; |5 m& T( q6 c9 [

$ C7 y# @2 P, p0 Y5 Y: X% F  text-embedding-3-large的价格定为0.00013美元/1k token。1 b. D" K$ t& T
$ t. H2 V% P( q: R! ]) ]1 Z3 f
) ^" U7 v9 l/ l6 `8 r/ n

; p6 _# w7 q9 T3 X/ V9 S1 g
% g2 E% Y( ~- J* X4 C" u, @
  灵活调整嵌入向量
2 P1 S* a- G: L2 Q$ K& E
! a( n7 H8 I' j% e
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。
, w9 e* e! w7 }+ A* S+ J
: {/ Z6 |+ u( x- G6 p% ^
  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。
+ _; a6 J7 n- Q6 ?+ W% H0 h) x% K# q  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。; z' x$ ]& g8 d4 z- L
. _, U; R; V, [1 q6 [3 s' c
  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
9 O* {$ p4 e' c, V  这种做法极大地增加了使用上的灵活性。
( J- e. x  o3 C( X7 r- i6 g

" c! b8 |: M' y* Z- F  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。
  w) h9 q& J" p1 \) Y/ F4 _" A* s

% s; v; L( m8 [- ~5 r! i

1 ~. h2 _( z# X; L, d$ p
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。- ?- X% k( N  O) U' F1 _) F6 U

; b. _% C$ a, V* W9 @  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
+ \2 \. @. y  Q- |, O

" f* y, i, N( U' ?0 a  f/ Q% N8 h) A  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
# M" e1 X' W  W$ M. u9 k3 X2 ]! h, r. |$ m' x9 \
; G  y2 P" l- N* P; \) m8 m0 Z
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
' L5 j+ @( p  @5 c! n2 d  r

3 U- Y' Q7 S% T  G  首先,开发者可以直接在API密钥页面设置不同的密钥权限。9 x4 v* Q1 \5 e

; E% T7 F+ b' r3 t& D  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
' b* {' p8 f0 n! k# ]& ]$ o  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。8 k( M4 o& S. N9 u& @
8 K1 J) G; S: P  }$ B: M! G
  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。6 C5 l! W- S9 n+ ^
4 N, x6 H0 a' D
0 G/ i% e$ x3 T, j; b
3 A. v. B- I8 |5 Q6 C! n( p3 O
, w8 H) P+ J, p9 Y# V; `; M2 g- s4 I9 }
来源:新智元(公众号)+ a! Q* Z" M# F5 m* J
链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg
1 K  h! a8 {: ~编辑:李梦瑶1 S+ F5 z" C9 y7 L2 A
3 |9 H5 g2 t# A- w' d

1 O* H1 l9 [1 p# m- l6 W
! ]8 X: h8 @; s2 o4 M/ Y
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表