传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 427|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】1 L. B! _* c0 Y5 H- o

* f& \" L2 n# T; T
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京

) U  Y* D) L# O9 {1 s0 O: @
新智元报道  
编辑:编辑部

; f3 j# K# V$ o" \- k
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。, B% }" d- A0 {

0 G8 r9 P0 i' q  D3 Y! D7 G

4 G# f" w  y1 b7 @  GPT-4又双叒叕变强了!
' h. b' Q" \/ J3 i! V
  S& `% S+ S, C! Y5 r' {
  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview$ Y( ~2 A/ E# v9 f  _6 U) I
) ?7 o* L- H7 Z' L% i: J4 T
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。2 N4 J$ j1 E( Q) t: Q" ?
# J- @. c6 ^# f8 ~* O% O2 a' `( K# M
+ |; O) |6 C) c& U4 q7 V( J1 G
5 f1 f& X4 \0 Z' N- E6 K
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。9 \1 |0 @, i% p& p; r7 G
$ E) w, v, |1 j; M3 u/ x
  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
4 f  T& C, I( Y  s$ U! Z
& T" `' z5 s: r' s- d/ b
  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。- Y, y/ E; {' h" L" `
* n8 V8 J3 {: s. E9 H, j
  两个新一代embedding模型:
9 o- \# V$ y" K- ]3 V  i3 z
5 o: S* U" z" w: V2 d
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
4 J/ i, h$ A" [; O  P  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。1 O) a/ Y: {* f3 s* H; v, w
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
* V0 J* b. A0 p( r$ W$ ^9 a$ t2 A  t  Q" U

: {; M6 i4 [' D; m( K- [. u; u0 c
4 x6 M9 I7 j- _
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
) {5 F3 J  W) I( e2 ?6 Y# B

8 w1 L: R% q3 R" A$ K( \  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
5 p4 a6 {: X5 X0 _& B
( P% H) m' ~0 H- q4 @' y' d
  新模型还修复了一个影响非英文UTF-8生成的漏洞。
; |% z& N% R1 }6 a7 I6 e  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。" g' }% q7 v% i: I  i" O# M$ U

0 [' ^& x6 t6 [7 `( n2 H9 n0 \5 U  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
. {' Q! V! j5 o8 v/ K* t
& ~3 V% Z4 @: y6 E4 r
( _+ B) C# _4 W8 T: A& B
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
$ g( b( Q9 @2 C8 a4 I

$ `3 S" l/ U% X8 Y  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
* n- n2 N! |  u

9 a7 m; G/ n* k  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
5 ?2 p- C: i! P/ a  {" {# d( Y  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。4 z! Q, R! T" C% ^

5 v6 \( m9 O$ m1 U1 ]5 O  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
, Y6 l+ ~! Y; |+ Y# O. F" [; T! _3 @5 b/ C4 c/ \9 J0 {6 i9 w- u5 b
! Q; u* S/ J/ _/ O9 h
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。6 ~6 K3 K) F2 o/ I  @
/ @0 y9 `$ [% o7 ?; H
1 |8 `/ L) O" K% U; a

( _# w8 P, C7 H" z
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。. j: A5 L; G* k/ k+ ]
  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。/ g; ]2 n4 b+ [3 J: O+ S

  f( G6 B( X: k2 P5 t  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
7 Z* t/ E6 F1 M3 M3 n8 s5 \0 @0 g  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。+ A# t% s' H8 D9 n' k5 E- A
9 g4 l0 O0 B% a' I' I! F
3 }8 o8 r( a8 _  f4 D
  - 性能更强2 l7 Y8 @- F; h, Z7 ?. O
. p% |. s: p" Y$ G, Z: @
  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
# ]) K# x6 B, k  E  x2 O) Q/ V6 R
5 }1 R: k" l+ t5 e2 v1 |3 G
  - 价格实惠
  T8 S7 ?8 }; O: n

* I% Q9 t* Y" H: f2 A* V  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。, Q) z% L- m5 v* M- \, Y9 V
4 }! S. ^3 e. t8 W' g& S" z7 h. P
  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
' S0 t' D4 j9 Q/ X( s) C* v
  k& R$ G: s) h- x: q

% i6 B$ N: x" j* R% [「大」文本嵌入模型:text-embedding-3-large, w! B& _2 a* z3 g
. b, D8 B, a+ Z  K. r+ ]* x
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。/ \: n6 e+ r6 D- @2 _2 u
  text-embedding-3-large是OpenAI目前性能最强的模型——/ E- o5 i' D: T9 _" c
* M4 u4 R: B* p8 o
  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。9 M, C0 q' T7 w/ n- S% Y; }) x
. m5 l' l, \. I
5 H2 n  w" D2 `0 q' w" p7 e
! l! A: x; f  {; ^
  text-embedding-3-large的价格定为0.00013美元/1k token。
1 P4 Y* o9 t  Y& e) W  v9 X' D) J- `7 ^) d# h4 {
, N6 f- u' I8 G4 o7 R% z  z3 N

. f" X  S+ E' C. k2 v2 `* H7 P- g6 {. c- `2 n% t3 M* F
  灵活调整嵌入向量* j5 S% q: u3 E

9 H1 B6 E; k! m( G/ R( W5 a  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。9 K( _% r, H2 O3 d% V5 h. g
8 |. G: ^# ~+ D1 d5 \
  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。
; u* G+ u. L/ c# F' m1 _  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
1 X0 l5 ^. @! b2 v+ z

9 p& v$ Q5 Y" B3 n: @  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
! l  O9 v  N# q. S$ |  这种做法极大地增加了使用上的灵活性。
1 U. x, x, D- ?( z& \0 w( F( ^9 A  C
3 P* W, k1 }. ~
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。3 j& j2 |# O& O5 P6 x5 y
8 p" I! r# r6 B& S* S/ g) @
$ ]7 |. p3 ]" ?/ _

1 }) K+ F3 q& b* Q! B
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。+ R1 w6 O5 v0 l4 q* j2 f* W

9 h/ S) O" A  P- _7 f  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。( ^" c2 i3 a# r" U1 v- S

/ E1 Y1 Y7 M% D3 v% E  K4 }& z$ U( {  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
7 l' n/ j: s% Q3 s
' o: `; V, H/ K, `% N1 p- B" S/ Q
$ S* U. `( f3 K+ f; b7 ~
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
6 V+ h, P0 O. [
+ Z1 M2 H1 O# S  \
  首先,开发者可以直接在API密钥页面设置不同的密钥权限。$ \* I7 J+ a* D5 S* Q! N

5 S2 G0 i1 T! E$ R% v  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
( Z8 @7 r1 v8 h* l" \: ~  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
; [5 a) a# N6 b' c

0 ]" l/ _. G1 Y4 b& C9 Z$ r5 [  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。1 s; H; Z4 ?) D0 m* h% @+ W, W  J
% _7 r* A) a1 T1 c$ [6 ?
* z. G( P, @/ Z/ N  ]% {

0 T7 n6 C% X' O5 s8 ^
' Y9 M: z- F. I% v0 u
来源:新智元(公众号)/ m5 p7 {' b  p& `( G1 D% s0 \
链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg
1 q$ U5 M0 m; M编辑:李梦瑶
6 C# S- v; s0 H" m

; j3 }& V6 O" I- z' D' N7 h2 k: B8 ?  z* n

8 U; \1 t, V3 S# N# A, ~! t
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表