【案例】: A6 o) X1 Q4 S9 y( l4 p
8 h" Q! |: f4 a8 @- m2 H6 EGPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙 新智元 2024-01-26 12:18 发表于北京
/ g! d4 \/ C) e( }0 ~8 n" i新智元报道 编辑:编辑部 / W( I: w& a, V* A, D
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。* g% ]4 Y" J% j0 V! {) @ T5 _7 C
6 ]7 A0 _3 z( r' x, W7 u( k
0 T9 T: l: O0 j GPT-4又双叒叕变强了!$ Z k9 O, I/ g0 J
3 n4 k9 E/ P4 y' L
今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。7 u2 w2 {6 |0 z3 P) y( q5 o
z, i1 r3 x( \+ J8 \ 不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
7 \) Z4 M% e+ X3 N4 k/ D% ]& i
" A/ D8 Z$ R- ]; [
% y6 m- I2 X% a1 f4 v
. x. a7 Z# k% a* N( p 与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
6 A( _- m$ f* S/ Z. F+ f# r0 i. @1 J5 u6 `. _
- GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
1 O: `/ v. J: U; J- W E0 J, ]9 p
- 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。9 `6 n9 I1 g( N
& j: K7 i% \( K2 l- F 两个新一代embedding模型:2 V5 P" G1 \- C& P: ^* |4 Q
+ [# `5 G- q+ b) ]- i# X. r G - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
6 L9 u) j" Z# F7 S; R9 V - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。* }2 U: c c, F3 }
最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
+ [7 [0 u1 ^7 S0 d. `% C, ]% V: z x8 [: C% y9 f" D
9 h( M1 l2 c" U2 u
- [: v6 [; K4 K1 q" { GPT-4更强了,变懒bug修复 自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。1 V6 S1 Q6 T: n5 r, ?
% E8 {& K( X x* W, a, U* C
最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
3 [# m8 d9 h6 b! J1 Q# m# d3 ~6 K. w8 {" j0 g
新模型还修复了一个影响非英文UTF-8生成的漏洞。, A: c( x9 W9 W, }& ]( i. f% B
对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
1 h* w8 z9 n9 X2 O$ o+ g; h/ C$ R" B: z9 P# N8 v
在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。) j4 u/ `0 V+ ~4 c, P& M( j
7 s4 Q9 v6 H9 a7 [ P/ \' `0 a4 u! T: E& g: ~; j" t4 W
GPT-3.5-Turbo喜迎「降价增效」 下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
8 U9 W8 t; K7 @; [6 n$ G2 m# D7 P" p N+ V2 u' _8 [$ Y
在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
" x2 P5 z. G& t! l" L6 r
9 C% J+ e; P' K# ^ 新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。' k5 K7 m2 C% B% E1 l' P2 {- H* V! {
此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。# v+ }. }8 a; z' X0 W* @& f
$ @, z" l8 s/ H& f
在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
1 w5 `. p3 j! F$ j3 t# V! b5 R3 G2 M" E" ]/ n% v1 |- }- _
/ y& Y }' n# W2 m8 d
全新嵌入模型2连发:性能大涨价格狂降 OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。: ^0 x% E/ W E' ?
o& Q; _3 X7 L& E
. F- u$ Y/ P6 q
, d' L# W3 U# [; h0 `+ W. C: |
所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
% e* {+ k+ K8 `1 i6 _+ x$ x& u 通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。
' [- m4 u8 k, [
0 A3 A Z$ T0 @: O9 D6 g/ H 嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。( k8 ?: R2 Z" s9 Z" `
「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。5 t2 E9 c! v. |
4 I& m6 l v( m1 Y( k; }9 ` D7 G, J) o7 f* m/ @" @7 @
- 性能更强
8 T3 y% Y5 e' _7 X. k; q2 L6 }1 M& a% v" ?% b' I: Z$ c+ i
在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
# U- ~( F7 b0 P- J& F1 C# W/ S) [
; Y) n0 I+ y3 f- P% _3 b
- 价格实惠
4 A* U( ]/ X. b: `; w% Z9 g* c d! _+ x2 m7 l
text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。. Q6 i9 h( ], J7 l* |8 @) _" R5 t; f
/ G/ i8 ]3 I. Q& f OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。1 M6 d1 W) K( a4 O/ \
4 Z' V/ e4 W; d4 G$ ~! |
. C* @6 I/ k+ {- Y5 @「大」文本嵌入模型:text-embedding-3-large
6 L- \. g9 w4 ]2 D6 O# K, c% n& ] Z B( B; k' J3 @, L( X
text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
/ q) [( ]* B% D2 F text-embedding-3-large是OpenAI目前性能最强的模型——
* I0 q& a3 i2 u) Y5 z6 y; d4 O4 x/ {$ ^4 i. m& X" r7 u
与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
# F( R. {: m4 i7 {/ V% D3 |3 z! N9 f: y
1 e( @$ o$ H) Z4 i
3 N( f) K: _2 c4 V! l/ D6 K! T text-embedding-3-large的价格定为0.00013美元/1k token。# J9 D6 i) `& L" s. b, x( w
; I- a, x0 P8 p+ ~( @" H
# Q# w$ x5 o4 } K: [" @6 f; k
* b0 _: V! A3 E2 X$ H% {7 z8 q) c
* n, R" s& i0 J0 j: h3 v8 x 灵活调整嵌入向量+ i0 k# k$ l" b$ D$ O4 P; B. }
1 M4 i& N; A1 N9 S 相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。 V: z5 Z' Q: N! b) }
: Z# ?/ [2 |! ?+ w, z& N! T" G3 z
OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。6 r+ R" G9 N- @4 F$ O! |3 X b
具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
0 N$ k5 y) j4 ` l4 s) ?7 t% q
% V) Q* F( s& E+ s0 o( D: G 例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。) p& U% \" q; q f
这种做法极大地增加了使用上的灵活性。
+ V% X% O. L2 D
: c& k% @' W9 Z1 L 比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。
# F. j; l0 Y& Z# J2 L4 f
8 T9 H2 t' R' e7 B6 N* s
" _# s! Q4 w: e, R3 b k% z! I
1 s- D/ ~$ I8 g/ t 迄今最强的内容审核模型 OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。0 u4 {. Z/ x5 P' ?3 T
' ^0 ]# u3 S [2 Z3 S2 A
作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
b- l {" {" G, b8 P& s0 a3 x2 I4 c K" N4 b3 w9 m
此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
, ^% b( i: x x; k2 d6 W, L& a0 J) `1 O7 B3 x+ E0 X
$ V9 M( N2 j ~6 {6 m% c- S
API后台更新,更好的API密钥管理 OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。% w6 V2 M( r, t2 w% q) X+ t3 ~# o& S
5 U$ V, w+ H3 E2 T7 ?( }
首先,开发者可以直接在API密钥页面设置不同的密钥权限。
3 X5 ]9 q; x1 G( p
! q* j+ D% h: \; a# o7 v8 y1 D 举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
3 P4 f4 T2 r4 r$ B0 A 其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
) a$ X. t+ _0 J/ K0 `8 K- ^& U, B0 H% b3 ^" Z) Q+ M/ w9 M
在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
( a6 J" D8 f( E
) k% [1 Z8 L4 ?, I! ]2 M3 d- E! U7 f) P$ Q. B
, e7 ^; W4 ^$ E7 |1 x8 F: U7 H2 S- p5 {+ d# r+ l0 f( Q9 B" P
$ _+ _2 K: H0 k2 K: A
5 @) b6 q6 f* p: e# \1 |* k! {- b" z: I/ t
|