传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 429|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】
; o% u/ p4 F" p$ E$ ~" _5 i+ H0 S! v8 k) L( e2 f
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京


3 E2 U6 A4 B4 a( M0 `
新智元报道  
编辑:编辑部
+ c! \5 T& z; T, e
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
  m0 v$ B6 Q8 y+ V- v
( k! m, L& y2 Q  {4 w. a' ^! ~

3 s+ n# a, \7 k. _6 h6 U$ {- O  GPT-4又双叒叕变强了!5 B% L+ |: c3 l9 K: r

( u! w$ z4 ?& P# u& ?- N  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview
" I9 D' r6 }; F4 W5 b- P, f, B8 Q

1 T+ C! y/ L/ Z+ Q+ j6 S! m  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
7 _% k: D/ l' @$ n9 F! D
+ z3 _  ]# X. b% z2 K  Q0 Y
+ B/ Z: ^0 n; n) k. |

4 q/ B5 Y) B9 O4 [/ U, C
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
2 S& X7 X: f" M- F) Q4 ^$ v

2 F; J# b0 |0 }: B+ t+ h$ l  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
! }8 _' N" V$ w0 X
. G! k! c) _0 i* X
  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
7 w+ O  A6 g$ @; G

8 w! ]4 D. N$ B: s3 b  两个新一代embedding模型:
% X' Y' p  h# P, r- Y
* t" {, C. C1 |5 p# G8 j1 y1 O
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。, z* v  _5 n& a
  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。  j( i' F. Y( S" b9 }/ U- c; V
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。  i7 Y* k' O5 c, \+ k; F
  v4 M. ^" E- }" ^7 O
& h9 M5 l6 u  u( [' t9 S# ~

7 y( ?0 Q' U! t5 ^$ c2 J' t3 H" @
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
5 R: O! k4 Q0 |/ o9 M
* L$ [7 E# n0 e  k, p$ O7 h
  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。* P4 _5 ~* F4 a$ \( T2 P
7 X; W  c. o# w. O0 \
  新模型还修复了一个影响非英文UTF-8生成的漏洞。
; Q2 {, e2 O( b* c% B; Q, c  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
# w: S' c" g8 ~
* |7 I. P3 P0 D. E3 X
  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
, r7 U' k  F  Q( a# N9 U/ V1 ^( d6 |1 o) {' K

. e  J1 l1 a0 G6 W7 K' Z
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。; T* A! c: p' m; @

$ _" S) [/ J) I) e; X  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
- c* M0 L0 j7 }8 b0 `% e
* Y; e- {0 ]* H' A$ e
  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。2 Q% u- U3 s$ n4 |6 e
  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
$ L5 B* L1 _  }" r; K' [
. t) V5 O" O2 G
  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
, E+ h0 u' e+ _2 a, z' c$ |: ~- q$ b
. k+ G# {; z: o. i; c+ _
3 i: i+ L6 B: V2 Y
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
2 f6 Z. t$ H, P. J* A4 L8 B1 r. y9 M& {
+ u( l3 q* g1 h; ?8 I2 Z. E
8 R) L# P% _5 `0 b
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
1 a% c, ~; d4 I( l- l4 _  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。2 _' s5 y. E2 S+ T7 C/ F5 p* [

( X$ j$ U* n; d2 n  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。0 }. |- I( W" {7 M; n
  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。: y% A" x1 d+ M  L
' A% ]/ Z$ ^" `4 }! {0 n% r. V8 ^

$ U# F+ P; Y* {& n" h  - 性能更强
8 A# z/ I7 s, Q6 x: u; Y/ [

- S8 S3 h5 E: g4 l/ s  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
" \3 e2 b) T1 Q3 O; D
. }+ h+ x$ U7 k* D0 i" K* r  p) ~

) G6 B  @" `1 W% O" T  Q/ s. W  - 价格实惠
- Y3 W! O' e8 @; o- g0 i5 @5 B/ I" j
7 T9 b7 e7 k) |# ?. w$ C2 [/ }
  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。4 d8 M* ]& a$ L7 q$ k* a

% h- o+ H: z8 A  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
- f5 g2 {! N' Z$ [- w5 G# A$ C  z/ G+ `9 F5 o  z

* h, s+ C. V8 j5 |' _「大」文本嵌入模型:text-embedding-3-large
6 z& r/ H9 r1 B6 |* B; Z
3 I: Y/ ^$ _0 H) V& `
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。& u, M3 d2 t. j% t) b
  text-embedding-3-large是OpenAI目前性能最强的模型——
1 T" [* q& x, Y" l8 a
) u/ S) e* @- D
  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
1 E: W* J& ^0 n+ E1 w9 a

" ~4 X+ i/ v! m2 y, f: v2 k& j/ C2 Y
2 S  }: M6 k; q
  text-embedding-3-large的价格定为0.00013美元/1k token。
" f1 J) h2 m( l, `6 A6 D  x7 h  ?/ o5 f6 t5 o
8 v$ F9 t: E; N( C& z

& q; L$ ?7 o' d6 i6 ~6 W4 C4 t. n7 \4 G! \
  灵活调整嵌入向量
/ C. D3 F6 n/ V

+ M7 E8 K! u1 e9 ~3 P  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。
" ^$ L  M) f. |! ~2 n
3 A0 B" ?& `7 N% }3 m
  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。+ ~. j! r& Z$ T
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。3 [' U3 |) q* n

+ B/ T3 x: _9 ^& `" R3 m& {* a& ?  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
& U# N- D( \! C# N8 R# V  这种做法极大地增加了使用上的灵活性。
# c- W) A1 q1 r0 ~6 B, |
+ O/ x# R# X8 D8 U2 I( f
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。
# j, D* n- X" @; D# S
; Z& _) m/ Z2 B* J

* V1 n+ h2 o$ N
" ?& z* a* w/ O3 \% d
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。. T( j% a% E# {* G- C+ b2 b& O! E/ P

* ~0 ^6 S3 W, n$ i  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
* ^8 r3 D. ]! t8 x' p. f

! E  H+ f* `5 W4 d4 |8 R3 ?; ?! S  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。2 k% N2 T1 S# Z& z! X9 H+ P3 F

2 \7 y$ U% _  [( G, r# r

, b7 r) u0 D0 _. n
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
* `* i( _- N$ l* ^# z. w

8 b4 f2 ~' l1 j8 a0 J/ E  首先,开发者可以直接在API密钥页面设置不同的密钥权限。
6 t0 c4 [, {+ x3 E4 ?. @

- H- {, j+ Y( o$ z# |8 P- N# c( V# p  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
% e0 l" o9 F3 `  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。7 Z; w: n8 E, t2 x  D" h' w1 P& Q

& D" i7 L" A  E  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。5 r' K) y: ]( ^* x3 X% }

* N  }$ J. n, X- _6 D
! U8 d2 }9 l- K1 p
7 U. S7 ]  g% y! Y& C/ T& X( l3 q
# ~1 b2 }2 i0 `" N
来源:新智元(公众号)
( H/ y( O( K, ^4 Y0 A. r链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg
8 y+ j, _2 H2 g9 Q( A* v编辑:李梦瑶
0 }: C! b8 e0 _9 I: M

$ Q3 m' V: s, j2 @6 \8 |
. @) S" E; T  N- g! P3 N* f' Y/ O+ z2 H) e% X$ u: A9 M; M" ?
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表