传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 40|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】
0 e+ u' p( n" @& \0 M  ^) ?# f/ O' [; T; B, C! a5 W1 |! k8 X; z
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京

% p% i6 O- f2 I, f+ i4 o
新智元报道  
编辑:编辑部

. D0 b% I- b/ N- S* f* _( e0 U
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
1 }- e! U, J4 ?& R5 a$ {
  R8 Q7 G+ g+ M, G' M- y

( [; g. J; D: Z% ]  GPT-4又双叒叕变强了!
7 G6 K/ e  I' S9 J; Q

( Y1 H% \5 E- [! @1 l  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview3 Q& H9 K! G5 u/ ^8 e
( w7 _: k# u# ~) H* P, P
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。5 f  x9 G. \5 ?+ G9 I# i

& S' R7 l- T7 @
/ o& S- e* E3 I, e7 P
: X0 U6 T6 g! Y) A  D9 w
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。( u9 o7 N; B& V9 h7 x" ]) h1 Y
( u' ^6 c! A0 I2 m. Y9 @, n) d
  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。9 J( J2 H! s- G6 v* {

4 n! M1 d8 s8 }8 @# j  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。8 [% v( P3 E- M& P" l

2 x( U" `& Y, h; R2 Y  两个新一代embedding模型:
- |$ z+ O; R8 p- \

. P: d" n) u" U1 R0 ^/ h% ?1 K  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
. _. _. E* z' g- j& {9 c  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
# s- k7 J6 e% C+ K( i0 b" Z+ V  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。6 v1 T! f& C6 I! g& |9 _( V0 `

* q! V. |2 t* |6 B% Z. h9 J5 k
( l: n1 X% N- `
5 l6 h2 {. X) I* E  O6 D3 u0 N
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。, {) P1 Q4 c  o& g$ Q/ M7 V

- o1 r4 k) I. S! Q& F  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。  o5 H2 \, Z& q
$ @( @5 n3 ~" [, Y) a. E
  新模型还修复了一个影响非英文UTF-8生成的漏洞。- c) F! u- S: I. w
  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
( q' i: O$ \1 z0 u1 s, V$ V8 J

/ Q: c6 l4 ?! m( G# w2 u' C- H& k  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。7 X4 T# ^: G4 l$ f/ Y( L
/ N5 G9 d9 Y- d* X- J

" z2 ]7 G6 B0 n3 T
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。9 f8 t4 U2 g4 z6 B- {* v

' s* P- D  A- _% p( _  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
, K. T7 Q' L+ a( I, ^

: q: @; C+ O: \! s% ^  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
& \. M+ r0 B+ o& Y8 i% f. O  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。# X& L( Q7 ~" l* {

9 U, q$ w( f5 v# E1 `) S  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
& ~3 ^. O$ A% s
0 ], P) z# ^# M
% X- h3 r0 Q6 h; u0 t; M
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。. {/ J- Y- q& n3 ]/ E# n

) w/ [/ f2 ~" W: A+ Q
  v% J( z1 m% T! v1 d
" ^2 r7 I! {% \- o
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
5 ]- U1 n6 q$ D3 M) `  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。
  B+ s0 I& v, q; g

7 ]  s, k" z: C- R" p  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
, S$ `' _4 C9 j4 g  N, ~) N  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。( d5 d% s: D+ B8 M; Y

1 G0 S  ^  g! D
4 }+ }+ l' [4 G5 p
  - 性能更强" g6 V) N: H" v: N' @
& `1 N8 }5 |. U5 h' A
  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
1 {8 s0 M# p1 z/ `- M2 }) M3 D9 J; T; q; |' j
+ J. n7 q! {2 h: M  y/ ]
  - 价格实惠
' ~" k8 T; c3 b, w9 n) e
$ [9 O# n! V2 s5 t% D4 n
  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。- j, E# K3 X8 b; o3 M- j9 k2 f* `
/ a+ b& h1 E- B% O
  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
& T" r" `' I7 ?6 w; G# O9 M! D6 L
" ^$ r: [5 A7 C2 x. q0 y
「大」文本嵌入模型:text-embedding-3-large6 D/ `2 g7 z! z3 Z

5 ?. G9 R% g0 _: D  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。9 p8 ~4 }1 |: J5 E
  text-embedding-3-large是OpenAI目前性能最强的模型——
  S; V5 W$ D* h; Q

- o5 [/ k& z  g" Z; U3 h  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。$ D) e) Y, B8 L  h

( t0 m1 w. c* X( j1 ~/ v
7 }' I+ y, h$ z2 R7 {; O
, u  T4 {2 N; J$ B
  text-embedding-3-large的价格定为0.00013美元/1k token。" y& h8 n' q' u+ _2 b6 Q) Q
+ M2 ^& c% q* k* s

" Z3 Z) |" s8 p& s1 ^
9 Q( T" W* J2 h" Q

3 O9 v8 ^  b9 x" u
  灵活调整嵌入向量( W" P4 Q# E5 v
; q: x' ?' G* ]3 z% F+ r3 o
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。
9 Z) x9 F1 a! |: J! y8 y

) _4 p! K% T5 ?! x: M  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。
' q0 ?" A) K7 P3 X5 T6 }1 {4 Q; _" ^  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。" k8 }% V2 R8 Y- |& g% U* X

  l" \0 _0 E% E$ I; k/ H2 @  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。7 E2 e/ U1 A3 J$ v* Q3 N. V
  这种做法极大地增加了使用上的灵活性。. g8 u8 j9 y# J4 \
  H3 v; y% s4 U" W! V
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。5 O; P$ _  D% K- h/ d
$ G. J9 T) J$ E3 J
; h$ A6 M# j$ [; M9 `0 e# S* `

8 b! M) x. X. _8 P8 Y3 E7 w% b
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
3 m* i% P% |) M& ~
6 f) p4 V2 y2 m' L  F, c) `' F
  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。5 `# k8 K1 a3 E  L1 _/ ~/ p& w3 R8 g
( z9 C$ ?; w' t! ?
  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。. @7 K* Y6 h6 s, p
1 {2 d% G8 b* e9 T6 J/ M( X
! w8 N6 ~4 n6 ~. a; Z7 y2 ^
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。8 m8 I4 ]3 \7 e% ~7 q3 c% d

8 F; X/ B, m7 l/ ?  首先,开发者可以直接在API密钥页面设置不同的密钥权限。+ P2 s+ y1 \  z

5 d0 h8 e+ e1 f6 K) }( [  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。( C3 I) O2 f  C! S
  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。/ L0 `- X* [8 O& `; k4 P; N7 i
, e2 A: f, J4 ?5 g
  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。0 F2 d/ u9 h! g
, |- p9 [2 J+ L6 r8 r
! V  v/ V4 d. F% |, q$ `6 f. }# _% ?

$ X( Y' y0 R% k4 Y
$ d% @& T1 {8 z# {4 h
来源:新智元(公众号)
9 j: [+ P# q! v: V! T" T; N& c链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg, Y6 T% U- t6 y+ N
编辑:李梦瑶
7 s' [3 x1 w! N" {
' |5 ?4 `# U1 Q2 q; ]; _

# g- L' r9 b5 }  @& e# i7 b& ]% N  L
+ S1 M5 w% |3 H& f2 \
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表