传媒教育网

标题: GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙 [打印本页]

作者: 刘海明    时间: 2024-1-26 21:52
标题: GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
【案例】, l/ z- v0 Z3 k4 j  u  k

% j+ ~' B* }2 j/ R5 ~" F0 [
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京

; \* P+ D0 F) a0 X& i2 I  t( G
新智元报道  
编辑:编辑部

' v" O* _. y) z/ R5 I7 j
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。) s+ X/ L) o  b

& p" @) r2 P$ |  e
6 X8 e! U: `" k. }: ?% K, q2 {
  GPT-4又双叒叕变强了!# c, L' g5 c/ N

) \+ H% D% T9 C; j: P; Z% D% S  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview
3 x" H8 D+ U& L

2 \3 o' v/ A4 b8 i* s6 |1 G8 c  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。4 N" w3 b  d0 w8 D0 D+ x

* }3 s9 _, j% ~2 j2 B
9 y) D& ~8 A4 C- q* P3 r: Z  Q

) V5 ^1 [& W# z) u
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。, U# J) F0 ]' }* y8 P8 m) ^6 C

! J( _, U. G7 Y( W- I  L0 p  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。' z( }3 C9 R6 V6 p4 s  C

2 t* A5 {1 B# C: t  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。* b5 J! O& i9 q& B# e& _* _
" O2 w" ^6 r# k! v0 j
  两个新一代embedding模型:
* T5 s& S, u8 _5 [  M

0 e3 P: K' W& H  Y( G, G  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
3 W: ?# {' b, z% f( j* j1 @& U0 Y  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。5 p7 f; D* B' A- d
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
1 S; d' V3 P- `+ L3 H3 l) s! A  C9 j
* _4 v. ]' m9 p! y* H

# ?7 m, {' z/ x; {* C( N6 s
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。4 _4 p9 H& K0 }% U3 P3 Z* p& ~2 Q

  J. v4 x/ D% o0 d5 n( O# q  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。, m  G/ q6 n6 n# `. F
6 X% U1 y) K. Y. m- P0 u  @
  新模型还修复了一个影响非英文UTF-8生成的漏洞。( j' t8 g0 ]) @! l
  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。& L! K4 R  p0 ^3 D
8 A+ Q+ `9 [* ]% s
  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
2 T; b; O, i' D
) V4 B% d. L" s% \' U8 w1 [
  C/ g4 z  G% t- W2 |5 c; c; u
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。1 E; V% D9 D! ^0 A# P
6 D. d7 Y, g" n8 T+ w7 |
  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。! W( O- ]4 o) @, k! r, ]9 `

7 l2 C' q# ^. R6 Z/ ^  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。" L# l, I3 P+ e* f# t4 M- \' q
  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
, O0 Z$ n. E8 Z5 y, W# \: F) t- ^
" M3 o$ e& `  ~1 t9 [9 e1 L- c
  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
0 m  f; F% M8 u, K7 K
3 K, S0 S% L5 S5 q

' w; s+ J+ y: P8 n4 ~8 U/ u
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
( R/ A* B* r) R
, h$ _$ d4 \* \/ I2 q0 a

* r6 y; b3 o- ]3 f
( g0 @7 H( }& s2 S
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
4 @# K8 ]0 e4 N# f* x" N  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。" e) I$ Q- Z- x9 _1 [' h7 P3 E
& F* W! S" S, N5 n2 Z, ?$ v+ @
  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
6 n, w8 q" w3 A) }6 K  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
, f2 `/ |/ P2 ]) D# f3 X0 F: L) }; {

- I" o5 i+ ~. E( b  - 性能更强
2 M0 ^3 x, S1 N7 E: m

! r# X0 J# B: }- k  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。# |& X+ Y8 d$ O

$ B9 N1 |- R5 O2 n! _1 c3 \

  x0 M' y; W9 u$ ?; y  q# d  - 价格实惠0 x  o& g5 \( J* q/ F
# i9 V3 z! G* J8 ]3 L0 |
  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。
- J4 q1 V3 F# o, }
% z( L7 A( W: |* t  `( b6 {
  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
8 }+ w2 V, N. U8 V" w7 w$ w' B8 T. I4 ?
  q$ s) H( A4 {+ `
「大」文本嵌入模型:text-embedding-3-large
5 Z: G  m2 ?% i5 h

! g1 l5 d& P4 e' a# H0 Z7 n  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
, L. J5 V7 R6 ]2 _/ b0 W: J! z  text-embedding-3-large是OpenAI目前性能最强的模型——
9 [# K: Q4 u* t+ {$ m; b( ~# j

! S( P3 z  q. y( P  j6 m  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。. q* g: J$ [0 ?/ r( a+ h9 j

, f8 ?, x/ h' w0 u4 K( E9 P
% z6 F, ~5 s1 P& c' x& `1 G. r' ?
% M" S# {6 x. {) M8 `+ ]& Y2 _
  text-embedding-3-large的价格定为0.00013美元/1k token。, K/ m6 g$ j, l5 a$ ~9 a
& ]5 g  J5 V. @+ ]3 Y' w
- k2 l* i0 }6 Q9 m3 P* Z4 N

" T- S9 n: a/ j* V$ l) \2 A% h
% m7 j/ _9 Y' r' y
  灵活调整嵌入向量
1 k" B; q& ~8 f
5 o7 I* W3 w0 Y  Q5 g" u% ?
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。8 U! d+ s3 ^9 ]; w" i" e

  X  \9 ]% G0 V, n' C5 r& Y  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。. i& A7 ~7 Z2 E
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
% Q0 m9 ]1 S7 D5 Z. v, ~7 R2 ]1 m& k

1 L. P- \/ Q( Q2 N. F3 r  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
4 S% p$ ]2 J( n' W8 A, e# \9 J  这种做法极大地增加了使用上的灵活性。& L; D+ c' p" V6 S; c

# t! b, a) R4 b: D1 J4 u  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。* ~! U( L& S5 I+ j6 c) Q3 |  j2 j

% p$ \8 B. T( K

# h! u6 c. K8 E) K3 ~# q

/ k8 z  f/ z( m: }
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
, J) E  Q- E: M1 u- C/ q
0 `$ ?3 f' z/ }) S9 }: N7 d
  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。: r( B% @' n( ?9 k8 A" E! b
2 _: ?# g" j1 W" m6 y
  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
* ]6 V3 j7 J* b9 g1 ]1 }. i6 `. Z
8 P# ^% \* v, R
% E2 g: @8 M) f& v8 F
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。% W! R, i% f5 M! e1 ^
& r# {( P) U9 V* s9 {3 N
  首先,开发者可以直接在API密钥页面设置不同的密钥权限。, _! T1 D" d  x1 Z5 d) _4 D  N

' s3 G: E: z& Y$ b; G; l, Z: U1 [  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。! x8 w- L8 }, ~' |5 Y: ]$ v6 c" [
  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。. ^& a# v, L  n& v6 K7 ^' d  U

, {( h' g! l9 ?1 q* x, T  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
$ Z1 I, H8 P+ G9 i
6 s5 a: _. o: d) [

5 E7 W4 x$ D9 T; T" p# F. e

- A6 l0 J& A; l9 y- v& D" b' D( Z. K+ J; w
来源:新智元(公众号)7 H/ ~: _6 X; |$ j9 u$ Y& }
链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg4 P1 L8 d9 X2 v9 j# v- c* x. N
编辑:李梦瑶
# f8 ~* U, D' p9 w0 H! E; Z

& k* {- `- _2 r' @& X. D2 V9 D

% L5 V. q* k7 F- \4 g




欢迎光临 传媒教育网 (http://47.106.15.148/) Powered by Discuz! X3.2