传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 426|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】0 C- F$ N6 j0 x
- |0 e$ ?, U4 W0 h) X# G4 [
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京

" F& |6 r, m3 t* V
新智元报道  
编辑:编辑部

' n) {" `! O7 Y4 k" p
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。/ v# p+ j7 `) ]6 G1 @3 [% {8 N
$ u* P# ]6 J) E/ m' v. H: f. s2 y

2 `* u8 w1 N) e/ I& t: _* j  GPT-4又双叒叕变强了!
' B. z# X$ z3 l2 m
/ I- u/ w  t4 D
  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview/ u0 Z; m5 Z( ~5 `, E6 w) T

2 F& N7 L' [3 z- k- Z  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
( x, V  }- f2 g; d& B2 O1 N8 `" g3 `. J" \" W
0 V6 ?; o% \' D; r9 |# X
- Y6 j+ ]& y# H( C
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
& G: h) t# u  s7 z
" r4 Y( h! a) p# ^
  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
7 B* Z" K) y  e- B2 g* |9 B9 S. n

+ \7 X: n# ]  G  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。, w  d3 P! r/ T! F+ G3 _& p! r! x
. H2 t; [8 [5 }! k" J! G5 B
  两个新一代embedding模型:
# B; E" i6 C& n  U) d

: K6 b6 {7 \( M  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
; B0 G+ k+ E) B5 T* p6 R! I* o  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
8 k5 B. j1 T; ]2 g  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
: v% G5 R4 ]' l2 S
1 s7 `4 @& K- A% X- }

) N( O% s  j; m* o- F6 Q  h7 Z

. J( a( M' ]8 X- I+ N- |0 v
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。6 ?! @& |1 E4 b1 v; F( K0 y

# v  r4 }& k! f0 R) W' ]+ U  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。* B/ t. i& M0 B' v/ B
! X" ]3 ~% w" O* _
  新模型还修复了一个影响非英文UTF-8生成的漏洞。
) a6 `8 p; b% F- y* h3 d  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
0 w; V* W+ \3 O4 S9 N8 }$ J- m

8 d! G. d( Q, S! H- d# A7 C% s  t  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。" |) s6 r5 N6 D" n+ T
$ ~0 K3 U+ m0 V5 }
9 R- m4 \+ A; V( C- m6 R
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
, l; y8 v2 [0 I6 C" z2 R2 }- E& {; S

) x. c9 n$ ]  B* [( x( A- m3 L  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
( _! k1 `: }5 e9 _7 {/ ^
" r" s3 S; B- C+ y
  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
0 y! K: p- P( k7 w+ \( d  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
( l/ k& H0 |' Y- @: T! r( q

0 X. \" [9 @) s, ^* j7 b  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。- l/ p# U# c7 Y4 r1 C
: E6 [% v; P9 J- c1 n

! a3 S3 @+ D/ b' L" Y
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
" T5 g0 m6 q& |; ?% G8 n9 v  u: c% a/ O/ J8 k

& f* B1 W" h: G* J5 A# V$ @! M
2 P4 B# E- B; \2 h1 K: O+ D# N/ c: j$ ^
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
& O6 d5 w0 h  S) f5 `2 D( }/ t  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。$ ^; E5 L: f# s6 @, s& L
7 G$ O) K+ _) K  t! D
  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
5 f% n+ o! e7 m) {  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
5 H8 C& l; Y$ S0 o4 y. i
- v1 E3 w- a7 l" ~/ I5 X

8 m$ O1 \# @3 h! H. H2 z' O9 l  - 性能更强7 e# C' v+ U/ b9 K6 a6 I
" u' H+ g8 I2 ~0 V, E$ X% }7 T9 x
  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。, r" w. r- O" X' j! j& j
' b& D/ Z9 V+ G1 X

. r. u) Z; x" u% @) s  - 价格实惠
& A) _7 Z4 `2 V# w' k/ I

$ c. d- `' Y! z8 O  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。% F% d' ?2 s+ H1 b* v- F0 ~% R! g

) ~' _9 Y1 T' K# s& [3 @  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
9 Z& R7 s' w& l' _5 b: g  x/ N# Z9 ^- h) I0 a
) d: T! b* x  k7 J0 D" |* }
「大」文本嵌入模型:text-embedding-3-large) ^+ `4 e  K- G4 G
' l3 L9 A( K0 V8 Y
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。% v5 r- R* S2 n+ m4 Y
  text-embedding-3-large是OpenAI目前性能最强的模型——
6 L" M+ }1 s; z+ S: q: k  k8 _

( Y" J) r3 z! j% j  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。, o) b- \/ w+ k2 I! O1 \" f: G0 X
  @0 W# ]" o1 a$ L. F% [5 ?

: @' W* @9 G5 F1 _) e
/ k4 m( Y# Z# o0 U5 e
  text-embedding-3-large的价格定为0.00013美元/1k token。
- g0 Q' h( T, o. o2 x4 z" I3 |/ g" C( L+ P! P, m5 V

" o9 J. t  l, s: a/ r1 D) m
, M, z0 s7 A9 A7 Q
' a; D' F+ l* ?' y! ~0 N
  灵活调整嵌入向量* ?7 H! C# f9 H5 d9 N4 V
5 L+ a0 e7 c( U' S' }+ l
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。
( `+ }4 Y7 d8 \' T( n5 W

( i' a. A% m; Z4 f+ ?  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。  k0 b9 o+ P  J. z1 S7 e7 w
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
4 ~1 o. H! m, Z0 d' s: i% H% Z9 J
1 \+ [& p# c* ~, n& \0 t8 b+ i
  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。: J: [: [2 Q3 F
  这种做法极大地增加了使用上的灵活性。# P" x6 D$ r& s. F& H; E1 u

( r& H9 v$ [: ]  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。. C4 h$ p) Y9 @4 g* z

: ~% P5 W* n0 H' w# }

5 J  d% ?% Y. N

" A+ \- M+ A& z# H1 e6 ?4 {" I
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。; E* U8 E2 E/ J( u7 Z
- s+ a% S) a- r3 N
  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
0 v: c. _) E8 B  Y' {/ e) v$ f

" Y  w5 Q3 ^& F5 g8 H- }  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
6 D' A+ ~; E$ G& I2 r  z& m$ R

: E; O& e, _* r8 H! {* C
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
  Z6 Q- f3 F6 B5 k; \

7 s: m9 F; K5 h+ a  首先,开发者可以直接在API密钥页面设置不同的密钥权限。/ K; H' T% J; [3 |$ j
7 w% Y3 ~& l. u8 U( k
  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
' _4 e# e( U/ M! G) J  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。  m6 r9 L7 S( `2 A
1 B" U3 c! ?- y  M" V( x" E
  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。$ f7 x: n  V) G$ L, q+ ^1 E
8 L1 n% |" `: k2 v/ x4 x+ a& \
4 h. s8 i6 i' Y
" H1 o: u/ E, @$ U& w

6 A' e; m. A& U7 l' K4 F
来源:新智元(公众号)
+ V& J3 T0 t/ D/ R; W  R- {6 t链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg
- u) X' j4 b* v2 _, y0 v编辑:李梦瑶
1 I' q0 }3 M2 ~! {. A+ \
* ^& P1 w0 y, W( ]8 I  _) J% N) a2 f

& y2 C4 V! s- T$ H9 k  e/ ^6 T
. \3 V" N% s. @4 @/ p! q
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表