【案例】
' |; N" p- T4 E* a7 l$ }* K5 v) ?8 u2 Y+ O, `& c
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙 新智元 2024-01-26 12:18 发表于北京 " v) R6 x3 k; u/ C& I" ]# y
新智元报道 编辑:编辑部
3 e6 m6 c1 k) {! V: G& z 【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。6 {* |/ X8 l0 L0 H G
1 ]+ g+ K5 Y' X4 n: B; Q
' l$ }7 x' G% V$ x) l GPT-4又双叒叕变强了!
0 H$ Q! k g/ j# R: A! u8 M/ Y, v( _
今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。
: p) q1 e/ q" _8 R; t
- Y% g2 B3 ~$ @( k4 L6 p 不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。/ j9 Q9 g4 e v; {
% `: k: B, o% u* `' X
. @7 }# }7 K) v% M+ o }7 y" R* x& O- c; d
与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。# m7 f% X* q, ]7 Q0 y' N
& a; z9 A( b5 e. ?* m
- GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
5 d6 F) m0 E) F6 j. n& b0 u( U0 w# v8 g. n
- 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
9 x" N9 d: s, l+ Q2 L5 A: Z/ q4 i a7 s7 B
两个新一代embedding模型:
|( S# o4 h- d% o# U( y
9 `2 B! t9 A$ d# q8 g, G Y - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
5 N% M3 n6 [/ P9 F - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
. ~8 `7 `* d h4 a: P/ D- r8 w$ H 最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
+ s1 C4 z) l& l( h9 s
( |. e; c F' O+ C) n, b" }% W6 O
% i6 D. c o* S9 Y, C& Y
1 H: q, d+ D7 X0 C# c2 C# u GPT-4更强了,变懒bug修复 自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。. I- P5 y' I4 s4 y
$ t( R U! `$ c, \7 | T, b8 G
最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
: j( ]/ P' m2 z& W1 O* k! Y/ @" A: [1 z7 @7 [9 ?
新模型还修复了一个影响非英文UTF-8生成的漏洞。
S9 G7 w' b2 {8 i, u" l3 [ L 对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
0 ]# e5 d) j/ q( w# h3 [3 k8 P1 ]* [# `# i$ O& Y8 r% k
在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。6 [2 P* V: x6 b6 N8 K
, ~; a- e3 x$ U1 F: p Q- Z$ t: m+ F9 R$ l7 H6 f5 I! V9 z
GPT-3.5-Turbo喜迎「降价增效」 下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
; L+ i K& z5 ^. y9 v8 Y- k) Z2 E
, y/ f2 x4 Y' x! L3 a5 ` 在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
2 ^0 u$ [" D- k: @3 B& N9 \
1 _# T. R" q( o1 X3 X 新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。 D) f3 d; \) m' k! T3 e, w& e
此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。5 K C3 j" ^( n
% ~/ f2 F T! D. f 在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
' @/ A2 H9 J8 P6 ~* ^1 D' m P$ A2 j3 U; i8 U$ L b V0 h
2 S4 F. I, B" j2 I3 ]
全新嵌入模型2连发:性能大涨价格狂降 OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
. i- I! y$ l+ G3 p: n" p" @/ \6 t$ t; ]; }
. U0 d6 W, C5 {
7 T5 a# `" H7 z' E3 _/ U 所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。8 S4 G1 q" y, W& k' U2 c# I u" a
通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。
3 h2 u9 [2 @) b. S1 w5 D4 ?& ?) V' {) N+ \
嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。$ l' E, D$ N7 A; I+ u
「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。; Q0 }$ k4 f% P* F4 _
" R K9 K) G. ^3 R+ T5 F" z# j W! b! d4 R( ^6 B
- 性能更强6 X: x5 Q* w- m1 D0 h- U
$ [3 J) R; h4 N; q 在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。( Q2 _, ?9 k r( x: h$ k+ {" P4 h
1 o" s9 ?( j- V3 H/ z" C
. {3 D9 K! z" k8 C4 C. z P - 价格实惠) ~ ^! f( {# w$ U
5 A, F% x- F* Z( J+ |/ |
text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。
% Z3 ~8 ^6 l/ ?/ J+ f- f7 b& J; |! l, P
OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。; r: ^ H# ~5 p. }
% v* T; `% s" t+ J. n7 T5 O L" J* X3 E
「大」文本嵌入模型:text-embedding-3-large
8 M2 t" T! _! y1 |) J" f! k9 Y
text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。( f9 V/ K) `! Q. z" Z% h. [
text-embedding-3-large是OpenAI目前性能最强的模型——( `( O+ j5 v7 R6 z
- T9 }" @7 I( _% A3 O. U
与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
" ]! w% Q! d7 }7 ^: ?+ ^8 I) Y' M8 |8 O0 |6 B; o& `
* ]$ o7 R. Z; H# m' {% j# F
3 w0 i; e: l) u8 [! g+ n/ T text-embedding-3-large的价格定为0.00013美元/1k token。% U, ?# ~1 K3 Z R6 Y7 M
% T8 E8 `7 [. @1 U8 I' p [
) `; X- w# e c4 Y* m+ B% P0 E! b! A7 u! p
8 z2 `' q- N% H
灵活调整嵌入向量3 H ? f7 E! Y! V6 s. f/ \
. Y+ H2 r* U) S" W
相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。: S& T) m: H& w* |& [
; a& g! Q: P+ c9 g9 y o2 ^# |
OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。
O4 X* M. q. Y( W5 K: ] 具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
( ]8 B/ k; H. d. j
# F1 I; q1 U5 ]7 |8 V. ? m 例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
) ]% J+ P! U, T# {; e4 K 这种做法极大地增加了使用上的灵活性。
& {# d; h* @4 t; r! W0 i4 S
0 \$ g! f% T( A5 N$ z7 X 比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。4 ]; f; m* [3 Q% F+ K, y( @
0 i c: y( F2 \6 V1 z ], N' L3 l
# M D \; `- B& I7 i! U( b$ b
! z H& y8 f% c H( m1 z/ q 迄今最强的内容审核模型 OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
( z/ s3 l H% z1 h2 O1 @4 ?2 u: m, i( ?; t: x. |
作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
3 q# a1 k; w( Q7 ^1 {8 V$ \. i8 ?8 H a- Q" |# o; p
此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。0 k& M8 B6 g1 `4 p( g
& |0 r% d7 g4 X3 h
& v, h4 p" Z4 d' c, Q API后台更新,更好的API密钥管理 OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。& A1 j, @+ G2 l) l, _( y2 R
( {7 ~# V- \% F$ k 首先,开发者可以直接在API密钥页面设置不同的密钥权限。
$ K/ l( I, D3 a6 R2 B+ J3 r3 ?' f q4 n) [( x3 Q3 ] ~8 {
举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
! s+ s# F" `. H$ \% J8 k F0 p 其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
& H# z% m: {0 L7 }! p" ]8 q
+ b" \ w5 ]# Z% p& O. d# ] 在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。% r8 C9 i( D0 A/ m7 H& o; h
; ~% |% C) A; D1 t- U; f
$ v7 g+ {' j) A2 P6 T9 X w+ j
, K) I I; B' j8 t& o+ K/ i7 n+ j
+ s+ c* m4 f' I! @ W$ } 1 P1 ~$ c( u1 y4 o$ z3 b, \2 q
/ c& U: Z' D! [9 y H
3 Q# d3 K* X# p: m |