【案例】& y: Y: \( M% K# B9 _: r
3 Z6 J5 p4 o4 u+ F0 Q
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙 新智元 2024-01-26 12:18 发表于北京
4 r8 p4 t5 |1 k! v9 [/ }8 v$ o新智元报道 编辑:编辑部 Q/ H, D4 X+ L; S
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
2 I% _( \6 D! T2 e( K4 x4 U7 j; W# y5 Z: G+ s1 [
, _" L3 E+ C+ I9 q m2 X; _8 j# b7 i1 r GPT-4又双叒叕变强了!+ {. d' M5 i# ^
9 g, P( w2 t! x3 x! n$ [4 n1 G( `
今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。
% A- `$ H0 n2 r# g: J8 Y) B" N, c5 y( y I* A
不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。3 P% b' u L8 ^
3 W/ H0 z' q9 z# \1 s5 w, Z/ |
* f. _" y: p1 ~3 N0 \
" Q, @9 N. O& h8 g8 ? 与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
) C t, A5 I$ s9 @+ o$ A5 n' B8 n' J$ w& ~/ m$ A- T7 c c4 @
- GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
, ]7 E8 n: o. ?$ u/ x% W
- R- O s. S( M/ J2 s$ O7 @9 { b - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
0 e2 G P7 i5 z" o5 x, F% }6 E! X8 m$ ^
两个新一代embedding模型:
2 y$ `: ?. g+ [! o. z, |. M- q
" F0 o& K* e C3 o* z& M) N0 l - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
$ g- K9 G% L4 c - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。2 G, U$ j7 W" H7 V3 @
最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
# E! V& m0 E; ^
0 \" R9 q- |' ]4 l5 a4 L4 K, A- K8 H( [) ]. S8 |) C% D. n I+ i* d
* H: }& y, l; E3 T1 i2 U
GPT-4更强了,变懒bug修复 自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。 Q' M5 z- Q4 a5 ]
5 e3 d0 e2 g* A+ Z
最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
! h! J+ r3 `0 O- x+ ~" }! u, D* [
新模型还修复了一个影响非英文UTF-8生成的漏洞。
# U# A! C$ _. O, p" n0 p 对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
( i7 {9 c s, |, | k1 x' H9 N7 k. @0 F' ^& E v2 u
在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
; z. r, s- N& Z1 d8 a* E7 `
3 M! P# E, X1 B }5 {3 m$ \; B/ k6 i* I
GPT-3.5-Turbo喜迎「降价增效」 下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
5 Z* R) g2 f. i( j v3 [4 d
6 u7 E6 D% |8 Z& ^/ I 在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。7 j! Y3 N0 f# K" ~, q$ I0 T/ [
# L1 s' T! c, D# m
新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。0 R: ^0 G1 v( \
此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
7 D% j5 M+ D0 f6 E$ O
3 ]: m% Q. N8 {; i2 K7 O$ v/ {9 f0 B4 Y. ]( | 在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
5 Y+ X; ]% V: \( k* M3 h) {9 E1 q2 D/ |7 ~' V! ?+ B5 ~
3 L, c- S% a; c- K7 E7 K! q0 D 全新嵌入模型2连发:性能大涨价格狂降 OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。; o; o2 R2 i4 w4 E R7 t
* k2 T" F1 q7 P" v# m
9 m" C) \* f. R9 f& O5 x: f# P+ I1 ]' b1 l3 n: @) L# j4 t
所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
, r6 u5 t6 _- d) A/ Q" A' k 通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。) t2 ~( Z6 k8 _1 p. T
! d+ Y; t0 i- c 嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。" Z! D) C) D% W! K- Y5 i$ p( e
「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。, g* K H w1 f( Y% S t3 s
% O) u, S0 Z0 s- z( k4 k! m. p( `# o: T8 Z o
- 性能更强+ w# V# Y3 U8 C+ u- P
* P3 c& P$ j! E$ E8 M$ S `7 ^ 在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
" l; ~2 D! `! n5 M( d Y" H0 Q
, @# r2 g0 I% {; S4 ^2 b, z. z% `1 F5 x
- 价格实惠
, r+ O) e8 j! b6 k. k, X1 a
. @5 M) U4 ]5 G text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。% u6 Z( `- J# Y: L4 s+ C
3 y# M' R( R6 O, v: { OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
" H( Q) s. Z1 ^1 _9 Y$ D/ z8 k7 t& l2 u+ ~. s5 e/ {5 K
; Y, u. j9 c& x7 l
「大」文本嵌入模型:text-embedding-3-large
3 B, ~1 k3 i( q. x0 L' v
% K% `6 |5 a2 `. J- H/ t text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。/ h' i' ^" o" d6 z1 j& L. G& y. P+ \
text-embedding-3-large是OpenAI目前性能最强的模型——
t% z. O* {# k* n9 _, e) B9 u3 k9 E4 [
与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
4 N# i8 o1 y$ Z/ h$ }* F8 K+ ^
' |: A$ P) f4 c
, k1 B) M: h& l( L S( D& T+ c) P3 p1 g+ I0 ^ u0 R3 C5 `& I
text-embedding-3-large的价格定为0.00013美元/1k token。/ D8 v6 X: E1 p! i; f5 i- N
; y3 m' S1 ?7 O, E$ ~
- {1 R8 A8 e' A( ^2 j
8 e6 z. J6 l0 E! M @! N3 [
" [% }7 f: p! r5 {* R 灵活调整嵌入向量2 h$ d0 U& H- I' n; l% W, t9 ]
- T' Z. b4 o v; Y1 K- a 相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。7 U5 H2 ^* q1 Z+ m
' y W) S: \7 B/ F0 B; V( T OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。 C* b% ?7 J9 m# d) [
具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
: G& I% X5 G) ?9 [7 j$ c" c
( ~# }& ]3 ]% W; h! C4 k. a* m 例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
# q# Z% ^$ \3 @ 这种做法极大地增加了使用上的灵活性。
' A- b2 I2 b1 X) _5 t8 n" |: t8 ]/ `! b6 Q2 B( \0 `
比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。+ y: {) q% z2 ?* }& _, J9 v Y
; O$ u2 m9 F* h8 }
1 W" o; f* a* \4 ? p. e
E4 q" \4 G+ \* {: B* K 迄今最强的内容审核模型 OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
T- Z4 z3 V: D* h6 y- e
. S8 A |" J i1 e- |& U/ |! g% X 作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
' S6 A3 c3 e* L7 ^$ J6 s
% w( a9 s1 v* r6 E 此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
# G$ c4 ?3 F( g/ p8 w B7 I' _: U
) u9 W* _& L# ]2 B6 Q- [" j8 P- F4 b, d9 `3 d+ Z
API后台更新,更好的API密钥管理 OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
6 e5 b/ U/ P% H- f2 Z# n" G
- [' X, ^/ \ [4 S3 h+ X2 Z 首先,开发者可以直接在API密钥页面设置不同的密钥权限。. W6 M+ g7 V3 Z# D9 G
+ C4 h, B& ~+ k
举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。$ P. W6 E' m, ~: g9 {. ^8 o
其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。8 W7 {8 L( o6 z. A6 L0 H
* R* J! Q& w3 `* E" d7 o# ~ 在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
7 S) U7 p& s. \% j; C# [5 Q) Q3 |- V/ s; q7 e L3 e
- L+ v9 S7 K) H; E
; q) z. r# A' b3 s* t8 b
8 Z. O! c4 m; f3 Q; e* {# g( P 7 j5 ^. n. f- X7 I
; A) v1 C) B. z! w
/ U* d4 S4 G. v% Y' Z |