传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 398|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】
" u  z& M& P+ R9 F  _3 ^; M0 P6 S/ }5 V/ ~6 d9 o* T
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京


4 G2 b" b( K% d3 {5 K. k2 m" W0 R* U
新智元报道  
编辑:编辑部

1 Q7 }0 X% j& L  ]' t  w
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。( `- J) G8 V8 C# ~
9 k& Q% b; U5 C* _3 }
8 ^  X& P! \$ J: ~7 q% n) @9 D: I
  GPT-4又双叒叕变强了!
, [+ @( N9 B9 y3 i: C  n# p
2 @  v# F" B0 N8 c6 S: S8 j
  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview7 ~$ a! L& V& X+ I  f3 E

: s" \0 K1 K& B$ R6 c9 \6 t  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
. h# ]$ `7 G2 {
& Z1 |- x' `# s% \7 J. \  b& T& ~* c
+ M0 o6 ], Q6 P- [# f; D- T' [

+ ?% U8 v. X. p! s  A
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
" x# x( ?" X& z. ?

3 y7 F, P9 r3 I* ~" d- A0 {  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
$ q9 I0 k* K  T; i  D3 u! q

1 v9 `* T' v" y  [( C- T7 G  E( w, W  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
! C" ]+ D; r  H9 A

0 R. ^1 f  w; s( K6 K  两个新一代embedding模型:
% M5 C7 g& {& K8 y4 V
0 t1 J' N; z: f4 G4 }2 o
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。2 i/ u1 O3 L4 S$ Y
  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。% @3 e! n6 b5 k3 R& A( d2 i
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
; P$ V( f# s/ T/ s0 Z
2 m4 u- b1 @: ^1 M) L
8 b% q0 _! i+ y) I4 P- P0 V' L, B) u

, l. N( K; j) v$ l1 V* z  S
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
) f7 `, o% o; \/ l$ G9 a6 q5 F1 r

$ Y) b" e) Z% C6 ^/ A4 n  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。! G: P6 z, |6 g9 J! a
( J$ F# e3 [% Y/ o9 N4 r
  新模型还修复了一个影响非英文UTF-8生成的漏洞。
: [* f$ P! n% ?& Z$ `8 v, \  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
: E# u# L5 k; p  k1 S! Y" `1 D! C

4 ?+ ~( t# z" S) A* b& i% M% l  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
2 V: c( X) ~1 R& i4 F! m
; g; C" l, e8 p. K4 X
, y6 a' p! m2 x- z" @/ d
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。- H( B( W$ G6 Z  M
& m7 ]( J+ g7 U2 C; C  n+ a
  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
& ]' [- \& P1 n$ ^/ w$ Z

) Y! k, o3 X6 Y1 w6 U  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。1 B* K- `# K! h- G/ e! `. J
  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。+ ~9 [, s( O, q9 S' F! v8 ?8 l9 B

! k, s% m- O  K) X1 g6 `! N9 a% d( h  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。! @/ A, Y2 ?* y% G8 E7 p  l
, T: j; e! t5 O

# e( f: t1 x# h0 e7 O% s
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
# K1 E5 g% C) g: L* M7 P
# Y* V' h) Q* M" p

5 I, ]; q% P" X1 d6 D. b

- M) Y3 D+ N& n( Z: e7 @
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
# V) D* ~4 }: U: ~4 e0 I  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。0 f' N1 D2 q  r' s: ?- k3 s. l
% N2 W' @/ s5 D7 {( a. ], u* q
  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。2 n. H/ q& {: r) h( b
  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
; h3 v" Z0 O  ]9 _8 `7 S+ n0 G# x9 m  t8 Q& F
2 D- g8 ]2 T7 w- C
  - 性能更强7 P5 f8 z" ~6 k

$ x& e3 C: p9 X, u5 b. \, u" V  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
- l( d. Y  J2 X0 Y4 A+ d1 Z9 m/ h# O: W! C3 p
+ S3 B$ u' _* w$ l# t6 |- m9 r0 j
  - 价格实惠$ \# r4 d. e! z6 n

+ Q9 L1 W  o+ \4 ]4 c0 |  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。# M/ H  p1 y8 x' _$ A
( m2 ^( D  _2 B6 v! L/ ~# A
  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
0 k3 {0 j' G- s2 o( ~! y
' f" @1 _) a  Y% l' U/ i  U

* n% h# k9 f3 J* G9 Y2 e「大」文本嵌入模型:text-embedding-3-large
. B! J2 h- }0 P9 K! w+ s! |, v! V
' \0 t& s# d3 ^; I% g
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
" \' i  F/ o7 h$ c7 c! D  text-embedding-3-large是OpenAI目前性能最强的模型——
" E) P9 c" b+ w; y4 q3 g) R1 K; b0 R( n, _

" E+ S5 F" K3 Y  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
4 A" B3 I/ K( F) w

! W* Y" N7 X8 u: q' W' }3 S8 L4 f: R5 N
  A; N" p: F% T7 n: Z& O: L
  text-embedding-3-large的价格定为0.00013美元/1k token。! j# ]2 a# a, H/ p. t8 e

5 L5 x% S  Y* l& {9 ?- |

" L4 M) z* G; ~( v( J  y5 ~

; m- y, h  L) S
; w/ |1 M, {5 m: y2 E3 O& l: k1 y
  灵活调整嵌入向量% W/ ^( w: `6 ]% V" V0 l9 Q3 U
" ~- W, u1 e" c$ A1 u- e! R
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。) t$ |; L9 C$ B7 k' M
: b) M8 V6 _% s; D
  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。+ \- J4 X% o; h5 w
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。# ~- s$ M4 X" ^( t6 M3 f

1 Z* G  P! L( V5 ~  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
( x8 d% Y9 f6 V' j+ u( }- e. O" p0 @  这种做法极大地增加了使用上的灵活性。
* T+ k8 C- q5 o

% `" i' G: g5 `, _5 q. m; n  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。( V# {$ f: Y0 A5 E! y
, y/ ?. A: E- G5 [  d0 u1 b

* O  W& j( V3 V4 h8 p* M& }& o1 B) d2 j

6 j: U% v7 ~5 G/ @
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。8 C! e  m  o/ w; C4 L5 s) i

2 P, U0 {; |9 v3 h; o; }" h  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。. V4 _# [  H1 w9 `( L
+ u% S% Z( Q+ [& G1 ^
  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
5 F" `3 }' n+ k1 C& M2 c0 ?3 y4 D; |' M: `' N
, y7 n# s, X, H2 J6 D/ h
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。& [) G, ~* t! a: X5 H: u

# |( t/ W; h4 ~9 L' i- a  首先,开发者可以直接在API密钥页面设置不同的密钥权限。7 N: k1 {; N" |9 W
4 W% Z$ q. T4 J* _: B1 x, Q  s
  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
0 j4 T/ n- E- Q, r: N  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
+ P0 }0 [" D  P1 e
  _- X# A. J& Q9 J( B; }+ e% Q9 r
  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
# z; H" F3 }( y7 h" G5 G9 h1 e: x/ i0 f% z- M" L4 ]* A5 j( ]( c5 H
, w. a5 m  P+ ?* \

; Z* Q% y0 P8 r% d$ j& R6 S" x! {4 {  |" S& N
来源:新智元(公众号)
  E2 N6 T* E$ R5 j链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg
+ J6 A, K4 |4 y9 K编辑:李梦瑶
) C; J! a. y, f5 t, {: c6 h  Q9 m

" D; Y3 W+ l: T- a+ f6 n% S
7 X5 t4 T" m& i5 P4 D) y% B" A$ A+ U! N: p) Z9 i: u7 p! c, L
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表