【案例】
, ]1 w) ^( ~) N( c* f! D g3 _- G/ Z5 ?0 I
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙 新智元 2024-01-26 12:18 发表于北京
) m* F, C; \* P9 D新智元报道 编辑:编辑部
- p8 v+ ^6 o: e7 {9 y0 | 【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
& `3 N2 y- P. `, N; j4 F' h8 N' g8 z7 t
! I2 R1 f! e6 N& e# s& r: x GPT-4又双叒叕变强了!1 _1 F. _& A+ I, \
: W) V0 l0 ^) ~9 v [6 \
今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。; O# H0 b* c$ H
* A8 C; c. w* q1 e9 U( M& W% K: v
不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
! @* p6 M6 G: E6 o7 t' [) m2 o) b' a! V% k
; q/ ^: E, p s8 C6 k7 A3 i7 [3 F- y4 A% O0 w$ I* K: |
与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
+ {3 y' e& U6 @. S; v0 L& C' w
! I. m1 h2 J+ ?( `3 \3 e4 X* L+ F - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
" F1 P$ g1 B- b6 O& G, u& `" G/ d( v" T9 ~
- 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
8 M! D9 H7 q9 z7 n) N: e- a# ?7 |' i2 L! K
: }8 C% d C- \" d 两个新一代embedding模型:6 ~9 Y2 T; r4 Y# ?, g% m# P
% p* J1 y* F' w0 O0 s3 ]( ?( N - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
( R, Z& s' m3 z: u" }7 j, x! m; F - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。. `; l. M1 P6 [ H' \& b0 i% n
最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。# U* B& r/ b1 t& E+ d4 z5 A
) X- e- @% e) j7 N" |6 n
7 h1 ^9 h) _' Q: L" ^
1 z( q* d5 j6 K+ C2 S) K C, C6 L GPT-4更强了,变懒bug修复 自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
! o' K3 O: Y) `& [ W& M3 t; n1 }/ G( x' K' i
最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
" o$ O! @3 k7 P/ T6 [- v& I/ T
& f; ]- r3 J9 w5 V/ b 新模型还修复了一个影响非英文UTF-8生成的漏洞。: w2 |1 D+ ~! {+ @ |' J& z1 J$ F
对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。/ F; }; G/ y/ C Y+ ~2 I
; G7 v% b( y6 I6 q! B+ T 在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。" @7 _- s6 K) M/ k4 U' X1 k
! p6 O" v+ k' M e# y6 u7 M- a7 \# H
# Q' v. {2 y( {2 \8 ^ GPT-3.5-Turbo喜迎「降价增效」 下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
/ ~& U$ k( D, y/ R8 e, ]
8 Z" Q; b) g! A 在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
4 ?) g+ M6 G h5 U+ d0 a0 i7 F
; K+ }' s# u1 Y 新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
# E9 E+ e8 P1 |' z+ [& B/ N7 E 此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
. _' Y z- ]. A5 I6 Z
, v1 C' h6 C5 B' r3 O- d 在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。/ D$ M- H2 ~9 d0 O5 x0 K
0 P. N1 l& h( e( J- S. V$ [6 h3 E! A- Z
全新嵌入模型2连发:性能大涨价格狂降 OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
/ d* G! r& P! j
" O% Q# `& F4 o/ p. [
! Y7 @1 q9 _* W& W6 _4 ?1 y
% I3 `- B: d. [/ V% I) z 所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
) N J+ L& ~- x 通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。
" {% a5 C% N3 Z7 J* Z G! m- E. u4 e2 l9 R1 }& @) b$ `
嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
" u$ Z( n$ |' G* @- D& m" d4 j$ ~ 「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。6 ], V* Y, W& p; T. t/ y
0 _& \+ v) i9 w0 Z! d! e8 C4 S
5 A3 Q7 c. f4 T1 D) C
- 性能更强
1 z: N4 u% _- e. O# a
3 M8 H* l2 C5 k; _0 J& N. N 在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
; r5 @) [; g" A0 V! {* d5 @- N, J% E0 ]! f* i
' T: @2 d2 d/ s! \# u* f" C
- 价格实惠
F" P+ [; T: r# i3 b8 H0 }1 [
& X1 n E, R5 [, z" J8 N text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。7 ^$ N" Z' \, d- l* O0 K
$ a4 q. L* d* e3 N9 Y5 n# d
OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
7 V+ h6 z1 `4 ?2 C* g, B9 v2 V
3 d9 _# ?/ }2 t. n
「大」文本嵌入模型:text-embedding-3-large$ v+ i4 {8 l% v& n2 P
/ H: F) `! E, R
text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。+ d- N3 F2 K1 `. j
text-embedding-3-large是OpenAI目前性能最强的模型——1 p4 J' e" K% }4 W
- M1 F2 z! s/ R: p- R& h
与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
9 c: ]4 n1 ]8 ^ E+ k# b2 E% \9 U8 S& }7 y- `
) Q/ H0 Z* Y& P9 N% j' ^9 S- g7 B
3 ]8 V5 ?4 _2 i$ f text-embedding-3-large的价格定为0.00013美元/1k token。
, w3 e4 R4 m9 [$ S; S3 A) \2 p: [3 _5 T) V
{" a+ A" u; L8 f/ a- O+ p
; l6 M. p" A2 k) x3 }
0 h+ D' K9 J7 S( c9 b 灵活调整嵌入向量: H9 Z; y' j5 T
: v0 d6 J/ b* M6 ? 相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。7 Y' I5 o5 }- g
; Z% ]' [5 X: Z1 b& J* s) Z' V; v8 x* Z7 B
OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。3 t/ J* k8 j/ @) g( R
具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
2 y% S0 N* q, i. O
% r# k: `0 t6 I% `% h* p! L 例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
- Q( p' v7 z) Y8 G9 _! K& p 这种做法极大地增加了使用上的灵活性。0 s" Z; O: c* {; i! B9 d
' O5 Z- F' U) n9 e6 Z$ Y 比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。/ w4 d! ?$ P* N7 N7 C E7 T/ t
7 Q: N# f" b# \: O- {, Z9 A
0 A+ ^1 t2 }9 q0 ?1 n& I
( J. G+ [' B2 ]" N8 O# Y. P 迄今最强的内容审核模型 OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。9 ^# n9 I" U2 X0 k) g" \3 n
% L& Y* T6 e& S% u
作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。' |) w) t @% ~" X/ ^) D
! z9 N8 p# ~1 E& w 此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
S8 n1 l4 r$ _7 s P/ [
. F' u s" Q2 G( i {0 N* ~! X8 O8 J3 m
# H' Q0 d! Z2 ~ API后台更新,更好的API密钥管理 OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
! q7 J( o3 q7 H0 n, Z+ b6 A& Y$ Y5 {8 p8 v
首先,开发者可以直接在API密钥页面设置不同的密钥权限。
8 O) k+ I4 \# K! l; d5 \+ x1 A3 D2 K z
举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。1 S4 T, ]( \; K0 D, A( d5 D3 H
其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
0 S1 P. W) ]8 U( r+ @, k" M
* c2 ]' \6 c0 y) R 在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。7 v: K+ u' C6 t8 F# B
7 i! n4 T/ _$ X4 P2 B/ v+ W( e- i' y% q- {6 I" {! O( t# I9 M
2 w5 @! \8 @ s9 x# }6 m& n/ ~( i7 M& F1 f: Y# H! s$ ]# k. `* J
3 V3 g% ]/ M) h# v& k) v5 y% H6 U- H8 z
& J! T3 O$ y8 b! C( X# H% _
|