【案例】0 C- F$ N6 j0 x
- |0 e$ ?, U4 W0 h) X# G4 [
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙 新智元 2024-01-26 12:18 发表于北京 " F& |6 r, m3 t* V
新智元报道 编辑:编辑部
' n) {" `! O7 Y4 k" p 【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。/ v# p+ j7 `) ]6 G1 @3 [% {8 N
$ u* P# ]6 J) E/ m' v. H: f. s2 y
2 `* u8 w1 N) e/ I& t: _* j GPT-4又双叒叕变强了!
' B. z# X$ z3 l2 m/ I- u/ w t4 D
今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。/ u0 Z; m5 Z( ~5 `, E6 w) T
2 F& N7 L' [3 z- k- Z 不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
( x, V }- f2 g; d& B2 O1 N8 `" g3 `. J" \" W
0 V6 ?; o% \' D; r9 |# X
- Y6 j+ ]& y# H( C
与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
& G: h) t# u s7 z" r4 Y( h! a) p# ^
- GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
7 B* Z" K) y e- B2 g* |9 B9 S. n
+ \7 X: n# ] G - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。, w d3 P! r/ T! F+ G3 _& p! r! x
. H2 t; [8 [5 }! k" J! G5 B
两个新一代embedding模型:
# B; E" i6 C& n U) d
: K6 b6 {7 \( M - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
; B0 G+ k+ E) B5 T* p6 R! I* o - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
8 k5 B. j1 T; ]2 g 最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
: v% G5 R4 ]' l2 S
1 s7 `4 @& K- A% X- }
) N( O% s j; m* o- F6 Q h7 Z
. J( a( M' ]8 X- I+ N- |0 v GPT-4更强了,变懒bug修复 自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。6 ?! @& |1 E4 b1 v; F( K0 y
# v r4 }& k! f0 R) W' ]+ U 最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。* B/ t. i& M0 B' v/ B
! X" ]3 ~% w" O* _
新模型还修复了一个影响非英文UTF-8生成的漏洞。
) a6 `8 p; b% F- y* h3 d 对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
0 w; V* W+ \3 O4 S9 N8 }$ J- m
8 d! G. d( Q, S! H- d# A7 C% s t 在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。" |) s6 r5 N6 D" n+ T
$ ~0 K3 U+ m0 V5 }
9 R- m4 \+ A; V( C- m6 R
GPT-3.5-Turbo喜迎「降价增效」 下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
, l; y8 v2 [0 I6 C" z2 R2 }- E& {; S
) x. c9 n$ ] B* [( x( A- m3 L 在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
( _! k1 `: }5 e9 _7 {/ ^" r" s3 S; B- C+ y
新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
0 y! K: p- P( k7 w+ \( d 此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
( l/ k& H0 |' Y- @: T! r( q
0 X. \" [9 @) s, ^* j7 b 在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。- l/ p# U# c7 Y4 r1 C
: E6 [% v; P9 J- c1 n
! a3 S3 @+ D/ b' L" Y 全新嵌入模型2连发:性能大涨价格狂降 OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
" T5 g0 m6 q& |; ?% G8 n9 v u: c% a/ O/ J8 k
& f* B1 W" h: G* J5 A# V$ @! M2 P4 B# E- B; \2 h1 K: O+ D# N/ c: j$ ^
所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
& O6 d5 w0 h S) f5 `2 D( }/ t 通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。$ ^; E5 L: f# s6 @, s& L
7 G$ O) K+ _) K t! D
嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
5 f% n+ o! e7 m) { 「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
5 H8 C& l; Y$ S0 o4 y. i
- v1 E3 w- a7 l" ~/ I5 X
8 m$ O1 \# @3 h! H. H2 z' O9 l - 性能更强7 e# C' v+ U/ b9 K6 a6 I
" u' H+ g8 I2 ~0 V, E$ X% }7 T9 x
在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。, r" w. r- O" X' j! j& j
' b& D/ Z9 V+ G1 X
. r. u) Z; x" u% @) s - 价格实惠
& A) _7 Z4 `2 V# w' k/ I
$ c. d- `' Y! z8 O text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。% F% d' ?2 s+ H1 b* v- F0 ~% R! g
) ~' _9 Y1 T' K# s& [3 @ OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
9 Z& R7 s' w& l' _5 b: g x/ N# Z9 ^- h) I0 a
) d: T! b* x k7 J0 D" |* }
「大」文本嵌入模型:text-embedding-3-large) ^+ `4 e K- G4 G
' l3 L9 A( K0 V8 Y
text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。% v5 r- R* S2 n+ m4 Y
text-embedding-3-large是OpenAI目前性能最强的模型——
6 L" M+ }1 s; z+ S: q: k k8 _
( Y" J) r3 z! j% j 与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。, o) b- \/ w+ k2 I! O1 \" f: G0 X
@0 W# ]" o1 a$ L. F% [5 ?
: @' W* @9 G5 F1 _) e/ k4 m( Y# Z# o0 U5 e
text-embedding-3-large的价格定为0.00013美元/1k token。
- g0 Q' h( T, o. o2 x4 z" I3 |/ g" C( L+ P! P, m5 V
" o9 J. t l, s: a/ r1 D) m, M, z0 s7 A9 A7 Q
' a; D' F+ l* ?' y! ~0 N
灵活调整嵌入向量* ?7 H! C# f9 H5 d9 N4 V
5 L+ a0 e7 c( U' S' }+ l
相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。
( `+ }4 Y7 d8 \' T( n5 W
( i' a. A% m; Z4 f+ ? OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。 k0 b9 o+ P J. z1 S7 e7 w
具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
4 ~1 o. H! m, Z0 d' s: i% H% Z9 J1 \+ [& p# c* ~, n& \0 t8 b+ i
例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。: J: [: [2 Q3 F
这种做法极大地增加了使用上的灵活性。# P" x6 D$ r& s. F& H; E1 u
( r& H9 v$ [: ] 比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。. C4 h$ p) Y9 @4 g* z
: ~% P5 W* n0 H' w# }
5 J d% ?% Y. N
" A+ \- M+ A& z# H1 e6 ?4 {" I 迄今最强的内容审核模型 OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。; E* U8 E2 E/ J( u7 Z
- s+ a% S) a- r3 N
作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
0 v: c. _) E8 B Y' {/ e) v$ f
" Y w5 Q3 ^& F5 g8 H- } 此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
6 D' A+ ~; E$ G& I2 r z& m$ R
: E; O& e, _* r8 H! {* C API后台更新,更好的API密钥管理 OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
Z6 Q- f3 F6 B5 k; \
7 s: m9 F; K5 h+ a 首先,开发者可以直接在API密钥页面设置不同的密钥权限。/ K; H' T% J; [3 |$ j
7 w% Y3 ~& l. u8 U( k
举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
' _4 e# e( U/ M! G) J 其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。 m6 r9 L7 S( `2 A
1 B" U3 c! ?- y M" V( x" E
在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。$ f7 x: n V) G$ L, q+ ^1 E
8 L1 n% |" `: k2 v/ x4 x+ a& \
4 h. s8 i6 i' Y
" H1 o: u/ E, @$ U& w
6 A' e; m. A& U7 l' K4 F * ^& P1 w0 y, W( ]8 I _) J% N) a2 f
& y2 C4 V! s- T$ H9 k e/ ^6 T
. \3 V" N% s. @4 @/ p! q |