【案例】
$ s5 b. v2 l2 D/ Z1 P: N( h
" U, _+ `6 \5 C3 OGPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙 新智元 2024-01-26 12:18 发表于北京 % J$ R5 \2 A* f) \
新智元报道 编辑:编辑部 2 p, O& @- W9 E5 ]
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
; p+ b' }+ ?: q. ?9 Z; F0 W
7 [8 _, `# R& n! [& L' R: [* m( G* G
GPT-4又双叒叕变强了!- g, t5 n% k5 c# i, G z
7 z7 d* x" z5 S+ s% U- i& V* p 今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。1 J# g6 w) Y% B+ f4 W# g
2 u) h+ q3 A: W4 r/ l5 N) m 不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。+ A4 E) ^) U* W; D. f- Y
. z$ J( r( u7 D
# u0 x* x# D: V0 `+ T6 h* [# y
9 M. u$ s) K9 C# d
与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。, b1 P8 _$ V6 m+ {
! G7 e0 ~; ^; t! s0 P c5 z
- GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。/ D* V( f4 V! w: \! j+ t8 k
6 P/ A$ z" t& q" }
- 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
+ ?' E* j" J' Q$ |2 H& ]- ]# H7 n
两个新一代embedding模型:
0 ]: \( [6 T. f/ A1 n( R5 t% D" x/ D$ E
- text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。. X$ g+ H( ^4 r& i6 f' S
- text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。0 I: r7 k# P' S) H7 v1 Q D
最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。: U1 G; B; u" v9 D. Q. S! |
@2 W3 t/ f+ v
3 `- Z5 d3 K7 p0 L
$ y4 m) Z0 R+ X* t, p7 h/ P4 K+ i GPT-4更强了,变懒bug修复 自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。 G/ H. s0 q( D# x
]6 U$ v2 v9 ?: l0 U
最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
; F( c6 o3 v# v$ y" _; r! p
1 x4 E) u+ R2 ^. G 新模型还修复了一个影响非英文UTF-8生成的漏洞。
% @# K/ `! E: G) k4 u 对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。0 o: a3 J' C) B& c k) B* K
+ R: W# u( W3 d& ^ 在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
+ m: {' d) Y% k9 y3 o4 }: L; P4 N) z2 {
9 j' S) l0 W; ~1 E7 W- J
GPT-3.5-Turbo喜迎「降价增效」 下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。4 w; a! n+ O; S/ ]
1 J. t1 J. O' L9 O+ ?$ j A# J 在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
: M/ O( J# X* ?& X a4 f* d- p
T! ~7 a$ \. X0 \: [ 新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
2 h( O/ f9 B1 Z. l: B: r 此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
9 H: z, x. P. G+ B/ O) O& V! v+ c# W: D/ l2 e& S5 \9 l
在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
* r2 T( u" P$ F6 B1 s9 f6 i1 g) x+ M q$ i3 V, B
, w, R3 U7 A5 H 全新嵌入模型2连发:性能大涨价格狂降 OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。2 O- X3 _! c+ y" b
6 _& n4 g6 z8 |) _0 g6 X' V
% b7 D. r9 z: f+ H# k& d9 K
' q( T! B. a5 B3 U$ K) L 所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
& I7 R3 M' w _ 通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。
! g% B0 o2 O. w' ]6 J9 R1 ]- E& c# X+ u
嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。5 |; _& I4 k5 _' \& o4 v+ ^2 n
「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。0 o5 ^/ r% U' U9 e) c9 |1 O% U
0 Q) C$ D" c$ B" U- p: Q0 H
9 m* P" |+ f1 F$ z; U. k' Y3 E+ s - 性能更强
% l+ E) q( J) X# d5 X% H% k D( A6 X6 y" Y5 ?
在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
, D$ N% y0 G# a
, k) v+ e7 J- V( n8 f% \! U
+ b! r! M6 p! ^& b. n - 价格实惠: g5 J/ O; I* m8 G# w3 F# H$ o
+ Q5 T! h. g' e- `, p6 K$ G
text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。1 k2 t5 ]2 L; t% V1 z
; Q( s/ B6 [8 ]$ x
OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
% j/ r# I4 A* }
% e& N% r0 y3 t, N
" I, F4 u4 J6 }6 a; h* u9 b! O「大」文本嵌入模型:text-embedding-3-large
8 [/ ^. g: E8 N$ o. t& i+ @6 {' P) m) S4 o2 q
text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。4 W, ]7 m6 i& A9 a+ G6 W3 \% r
text-embedding-3-large是OpenAI目前性能最强的模型——
) u; ?5 J4 m$ m& ]' @' T% q# [( L
与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。 v Y: W% W5 [; \
% U6 f: D8 G1 U+ t( |
' F. t" O- w+ G, X7 e$ P c4 ?4 E* t7 L9 E* o( }% ~+ z% M
text-embedding-3-large的价格定为0.00013美元/1k token。 p4 C6 o1 m8 g3 f! L+ h3 ]
6 l; J+ T" ^$ {$ P
& D) l. T' l3 y/ i5 d! R/ o
( ~$ z p! l. {' M& V* U: a. G% D& M" h6 K
灵活调整嵌入向量
; ^9 y: R) l) C. J9 E1 i( W
1 e/ G, @4 n' W; l1 B 相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。4 A" Y( F) H' s/ w2 D& T- A8 Y1 E
3 b* T7 ~" T% f! d2 F7 ` OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。
5 L/ x+ P2 K- j. R+ I$ P 具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。5 O6 Q% G$ Y( }$ X
8 r1 C6 e j7 a1 F1 R8 _+ N
例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。# w0 S8 G K# K4 w
这种做法极大地增加了使用上的灵活性。7 i: |& }+ s8 j4 j" i/ q6 e
2 j* `. I/ f) g 比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。
* F+ }+ i$ x- {" i8 r V) v+ M8 C i7 P; `9 W8 E( X7 @% {
; p" Q" |1 U' z/ Q! J# E' @/ f
) G2 { ^& y( Y- j9 m- s8 p6 C 迄今最强的内容审核模型 OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
- }- _' a2 n- e0 p; ]. c h: l) Z( e! h2 K7 V' f
作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。- S; l" Z$ D, Z- l0 v, A
" A% A; Z2 y8 D5 ?5 \
此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
" K! b% l5 v1 F$ ~ Y1 ^% I- k( j
: a. z4 r! o; ~2 _; E$ I: p: g0 C( }* X1 n" @% D% R: n
API后台更新,更好的API密钥管理 OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。3 d$ r- J. D* Q l$ x1 m
8 ?* p& I* E' _4 ?. Z I; s- z 首先,开发者可以直接在API密钥页面设置不同的密钥权限。
& l0 @& I+ |2 R8 S) J+ b5 ?* O& x( d5 {. a- h- ?
举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
0 O- w' ], a: ]( w, B 其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。$ i) N0 V3 M x1 ~! C$ J
! V7 _% X# {! E9 }2 w! U" _: F 在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
; S1 M# j+ M G" d4 Z4 ~9 V) G; m1 f6 R9 o% A# ?# \
; Z: F. G6 e# ]0 a3 `: c7 F2 E9 {7 H' W7 q& I) R
3 z& i. j% T) U: A7 o6 d5 N" K4 s / t+ h( i& W1 t9 r: U3 f
& X! P$ k+ g4 ^. i: q5 q
& W" E& o# d9 _4 T7 N7 o5 c |