传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 68|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】
! q7 `' p0 {/ r
1 @5 ]& T; E5 g3 c+ v
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京

5 }0 G+ N& n; t/ U
新智元报道  
编辑:编辑部
' v3 }) c/ z% e
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。- o* u6 v; [" v% {2 `* L+ `. z

% m$ t( w% l6 v

4 }8 s$ _. i+ P" Q* r  GPT-4又双叒叕变强了!7 y+ g: n" K3 o3 _! A! M

2 {2 Z  \, d/ v  B, ]  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview) w8 V. B; J1 d2 H( E  _) c* b
0 m* f, P, t* ^
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。) X: B1 n9 h. j! \# u0 v
  e' M* }5 Y+ F3 F1 a) Y

& [1 ]$ ]5 z! y

% M' H3 ?5 ]+ v' |5 G4 {3 y
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
9 ]; ^9 m1 i; s, l: u4 N, C
, O) k: E, I/ ^) ^" _8 v
  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
9 `# r# g7 D( q; s0 K) @! B; a; C

. p6 B& N* }& F& u8 h  V. v: U  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。6 @8 Z2 |5 {8 \2 ?! t# P
) p# O8 c4 ]1 O# c% `
  两个新一代embedding模型:
2 U) m- M# C! \" E5 H2 _3 z7 l) I

7 O1 H' m3 o. I9 J- T. [$ f0 w% n  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
) b7 M0 G8 n( f1 g/ E  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。: Q8 a% _' X+ X8 d, `, m. Y
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。9 Z6 T2 \0 C/ J' i  s/ E
! ?7 l2 h4 N9 ~2 M$ N" F

; j- |0 E! t- E& W" N" w8 e
; @! s8 `5 n; K. U
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。* F* f/ e3 q% G0 |( P  {

7 }* F' v$ D$ `& y  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。! h5 @1 c% t; c  b$ h1 e

' C2 k+ w3 E+ w4 p# \- a( R; `( N  新模型还修复了一个影响非英文UTF-8生成的漏洞。+ T# U' {: S5 [
  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。1 f* f/ R, u$ R+ m+ r

- w, F0 c" |1 t! E" X  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。% B$ t9 s  c2 c) X5 T) i

3 T7 n2 T* R% L7 c2 R! d
! @" n% v. T* [: Q% w
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
+ [' g  O  Q1 y+ Q! ]! o, E' k

, Z" b4 q1 p/ G* S  [. `8 a% F; _  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
; S# U+ K# F" P1 M* Y$ }3 h* a

7 [9 ^$ @! S: E* K) f5 i; m8 Z  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
) @, z) x$ g5 Z. s9 Q$ o+ Z  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
& r* }* t  Q* H( K2 A# p( E
- ?$ ]! K1 z; M" }
  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。# [( i6 Q7 l: s9 x3 ^: a

1 Q9 d( E/ v% m! F  s0 C

5 e4 T. O  y2 H! W* `1 E
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
+ b% V5 y, ]4 o7 N
. O: `9 Q8 l0 O5 ?2 G3 S* x+ p
* W5 \3 D8 D0 M0 v* P+ z  x# Q3 s

. D; v5 V3 e9 i2 W6 X! ?7 V
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。: o' l% \/ C: V8 r/ h7 J& W- _
  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。
: g) Y% X' ~' \0 i
" [( K( f" A  B) w; w( \' y
  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
8 w" [# }' y! r4 D9 H  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。4 H7 X3 |1 v; f- L- B7 c6 O
7 V$ E0 a5 G$ J

$ v; w: @! `6 x8 A- B' Q  - 性能更强
4 ?: e, ~, H8 `; |% ~* H
; s  s; {0 |1 t. G; v
  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。, K1 M( M# U* z8 @; k; L$ P7 N

  w) C: i2 t8 s) R
" [" ]/ Z. F) N" t' ~3 ]  _0 t( G: \
  - 价格实惠4 C+ s  |/ y) K+ F! S/ G

. [' K2 n( _* v# D' |# U; a3 i3 Z  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。2 @6 h( v" @& L4 |' [/ \. G
  S3 t* y/ m( M1 r. }" _
  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。/ j$ M; r4 P3 ^( G1 B) f, O
3 w; |6 E' @8 P# j" }) S
# [+ f$ }4 S- W9 W6 p$ l
「大」文本嵌入模型:text-embedding-3-large
! K. R* p9 B) o5 x
  X) E; ~  E% \" k/ R$ |. C% j) T% T: {
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
! {1 T4 E1 _( j% L! I+ h! G! Q  text-embedding-3-large是OpenAI目前性能最强的模型——
- T( @. O! G/ F6 T

$ O0 R4 D0 b- Y/ l, J0 S  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。, o' N; Y3 w9 `5 ]' z: r4 Z

- S4 H1 |  T$ m6 O& k1 J/ r( S5 _' B- h3 {

8 V5 k6 c7 ?! C+ ^  text-embedding-3-large的价格定为0.00013美元/1k token。
+ G6 j+ E5 ]/ B
0 S4 O8 h% \% u! e$ G) {
( C+ w" L. m! l# H0 g+ f- G9 h  J" |

3 _/ R( G/ g# w+ O; ~( B% M3 X8 ~4 z7 u/ |6 S# U+ f# Z
  灵活调整嵌入向量
. @) g  [% Q8 Z( u

8 x$ @& @2 }  X7 N7 _+ |$ ]- m) I  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。+ n2 J+ ?% U1 X& f* \

3 ?% p5 g1 W% j& Q3 K  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。+ a4 Y# ^  N' N9 X7 M% w6 ]
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。# w9 T9 a8 n# A& [5 I

& g; e( \1 Y5 l! o7 e9 D; X  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
# h0 O; n8 u3 m/ I+ l7 q( g1 E) h  G  这种做法极大地增加了使用上的灵活性。
, k% b4 B! q- I! I
/ p; @. E0 O: `4 y2 O  C# y
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。
8 ^# p) D1 w% w* h, G' Y  L8 w- t, [, A: V1 z
$ K. U& A0 }6 F0 w4 ?  K' E6 z( k4 |

0 R0 w3 H- i% {# U0 ?0 H& _( o4 P
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
/ I/ ?4 y+ N0 i6 S
, K, g2 |8 e7 C: P) p: W/ x
  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
8 Z  S' Z8 K- D# J# h  H& b

3 Z# c: j1 u. f' L2 {  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
/ ?, A. I; }# b- M$ w
9 v4 ]. A9 y- i0 m

$ K& h" E; [' A2 f; |
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
9 q; J! w5 a# M' E

; q* C  {! Z; V) o+ H( `  首先,开发者可以直接在API密钥页面设置不同的密钥权限。( @5 M7 J5 [6 l0 Y- d- ?7 k+ O

" u& z) R3 f+ [/ x+ U# A  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。0 V* P$ {. f1 K7 a- Y
  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。9 J- E( W1 H+ y. E
" P3 |0 Y8 B- S( @4 a; K7 G
  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。& \7 r( ?7 ?* T) i6 F: `! ^

2 X9 J- \, }0 X$ h" Q, C7 N

9 S" T5 _  g% O8 F. r' H

9 K( `6 l& W% L+ x! V1 i& l( o4 _( w8 t2 K
来源:新智元(公众号)
0 s; ^; R' N% U9 x  {0 r链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg
' d  h- o5 s4 @- X( D3 M& x3 t! G编辑:李梦瑶; h# ?  f! f' [' x2 K
% ^( I# A" \2 V" J+ i( K
/ g- l1 z( O' h8 g; H. t* P+ `1 C( {+ t

7 X) R! q! R6 W( D6 l  t
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表