【案例】
( k/ J) F/ q4 D$ n+ Y
1 r3 c/ x n4 f; yGPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙 新智元 2024-01-26 12:18 发表于北京 2 B6 r; R) v: R1 M# a4 w& E
新智元报道 编辑:编辑部 * z1 f& i( h3 j1 ^; ]1 @; ?. S7 T
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。: ?) ]* p& Y7 b4 P m+ Z
" m+ E, x/ h/ [* K7 z0 `' K7 A" F, \6 z% r
GPT-4又双叒叕变强了!
* ?' j7 u: \: V# D! E; `( }" K$ w" n9 C5 K; [; n2 o
今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。3 x' b; E4 S4 n; }# {1 g& t# f
, {9 j _. ~9 q4 {! `" K5 a. x
不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。! L4 i1 |$ }; Q! B& e" F
+ |5 q& I3 I5 p) e' B- Z# ?7 P
: G+ i% `' l0 Q' P# Z
# T) d3 o* ^# E3 t
与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。4 ?$ f {3 T4 b! n+ T
8 A8 N% o$ u4 x' c* t+ E% n - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。: C6 |. q3 ~' ^' i
' F' d& N' y( u% }4 n7 K - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
% w" Z9 l" O' u# v6 l* d& I4 @% A4 N0 ^2 R) M0 e
两个新一代embedding模型:, L0 N5 V3 _& R. b
( z& y4 n& q; P1 `3 W - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
0 c) w: O3 B9 |% k5 ~ - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
, B" A& z( o6 K! O7 e! W3 [7 a2 R 最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
; _# M; U) g, {9 Z8 G- k0 M% \
4 t- X; Q. {# x* S4 b8 _! [( |' K
: D, m& [# | H
8 Q; g- d1 @+ f1 h2 P* @! w5 f GPT-4更强了,变懒bug修复 自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
7 c d3 v- d. _0 x+ O: C% }: u: v! m& s/ W) \. G
最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
/ {7 Q5 b, ^0 [4 T: y! Q9 e3 x
新模型还修复了一个影响非英文UTF-8生成的漏洞。0 n* H- L; ] r, v; } h
对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。7 y% f! |8 K" t
0 S0 B; c. G; t- E 在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
+ ?2 W: g- i& K5 K" n2 }5 w. R
0 ~' ?/ k0 ~# W8 w9 H6 D7 L! Z( B6 j GPT-3.5-Turbo喜迎「降价增效」 下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。' F3 ]. @+ y% {5 z1 r- l
7 a9 Q* S$ l) `- n
在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
4 i" S5 B7 k( \/ B! Q7 ]8 e
) H( i. I. ]6 e: F8 H" {1 H 新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
* H5 ?% d/ g0 e/ _ 此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
0 s, z) G k3 i2 \
7 A/ Q) ~ U; |+ X5 d 在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
2 A! P# E; A4 n! C& b7 V/ L
/ F& I$ _ b% s2 k, j7 k K. q$ ?4 H8 P- L7 K5 w8 V g8 o0 y# c8 o
全新嵌入模型2连发:性能大涨价格狂降 OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。6 ^9 N( A. O# e& g0 b# Y8 p9 A) C
4 q* Z' }' q$ u9 H; B% p C+ d; e0 x+ O
2 q% c4 i2 B1 g+ _
所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。5 |1 P+ U$ G5 G- I9 ~
通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。
8 s6 G# c8 J# V, P8 z7 C$ K% `6 H3 H* ^0 T
嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。( x, c( X6 `& X% S& C: v) J
「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。) q, B$ F; [' g+ u9 k- z
9 e3 u' `+ |) f. V$ e
, A7 J0 {2 W( E - 性能更强# m% E3 P, z; e$ s- i! u
; X# S7 A+ f0 Z! u, i$ A8 n7 X 在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。1 o" d! \$ _$ a5 H! B( e# |, ^+ D
, C! o( b! ?3 u, e! B# ^/ g0 q$ J
/ O& X9 V3 C$ R3 ` - 价格实惠. _ Y% \3 H j" S+ m
* p- I+ u4 k# c8 ^' ~9 M; h7 u# Z/ y text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。
6 `7 Z2 ` ^5 C: _$ Q3 Q# V; B2 g7 z) ~/ r) J3 ~8 }/ C; u
OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
( V5 h/ Y, ~, b8 F4 j e9 L. A# D- R
. Z2 M0 W4 g8 _- r
「大」文本嵌入模型:text-embedding-3-large0 i0 ?. c. ~# Y+ Q; F; H
, J; P3 F- d) L( Q
text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
& J+ h* f$ S0 s6 |% {0 C text-embedding-3-large是OpenAI目前性能最强的模型——' }; o0 _ m+ ^( z
0 T3 K0 u+ M6 |! U$ _9 {& a 与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
: @; T c9 U3 | R" S ?* J8 R7 \( w. n) K) q3 S
# N. \8 K' [) f5 H$ ^( A
* v3 Y- S' I/ x. y1 \8 \: G text-embedding-3-large的价格定为0.00013美元/1k token。% c, U4 r4 A g9 P
" J) |. {% S8 @/ J& Q& C3 R6 r: c% _9 d0 A: a& v# E7 _. W
: W5 f& z/ M" T: R3 b) N: k) n7 l: `9 ^4 ^' a* h' R
灵活调整嵌入向量" y7 w( i, u9 I( B9 `# ]4 |
4 ^& P* ~; O: W; h! N( f1 i
相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。# o9 W- Y3 d* l3 S
+ v h2 ]" g7 o, H& M6 q OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。; i+ Z r0 W* j
具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。: R6 v$ r$ z* V0 b% v- O8 H
9 t5 B/ U, s0 ^# Q 例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
1 `$ S4 ?. @ _7 _8 P \& Q 这种做法极大地增加了使用上的灵活性。9 s! s* o( g+ ]5 c+ r& E
7 I7 C, Q# L( s/ t2 T& x$ K
比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。
$ E5 j" D6 t5 g8 p' R% T- j- w I+ Z9 O7 f
! x: ~0 ~1 b0 B" I
$ N7 Q, B: R, j% a$ O0 ~: w3 j- }7 u 迄今最强的内容审核模型 OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。8 v9 K# _$ [* p% K M! W& s
v) ^& ^& E3 I1 H+ c
作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。4 Y6 G) M" C5 v1 B$ V1 u6 F
7 c9 t2 B( m/ G# Z8 C8 f5 L: a
此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
" J( |# l; l- h( @* s) {( T, J5 h
; ]1 Q0 T0 |$ h API后台更新,更好的API密钥管理 OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。+ @9 X& ]& P9 J
: V' \& ~+ Z \& N0 |. I% V6 b3 U0 j 首先,开发者可以直接在API密钥页面设置不同的密钥权限。9 o. B5 Y$ C( K2 F" |, E0 ]
Z- o1 Y6 V! D( L# Z
举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
, h4 O0 b0 I4 ?6 ~7 Y 其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。 R* I$ A5 @/ ^, I
" T+ h G$ b, N z: a% u! ? 在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。6 G# B) Q; G. g, L/ g/ f m$ ^
Z9 D) G+ w7 C5 z
! T. Z8 m1 V. ^& C1 ] r; D
+ ]* k, O# \# b
6 g( ]" z1 |) }. _$ Y
+ M% P) V3 r+ e
: \7 r: z# d3 h" O0 }3 q7 b
$ i( {4 p q1 W# R |