传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 41|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
【案例】. c( h8 h7 Z+ _4 [1 {6 R. {

4 A) Q) d( A0 W4 D2 w) N
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京

# M% i$ N0 S  b* x2 W1 H7 h) r
新智元报道  
编辑:编辑部

. J3 y9 m' Y* H+ F9 B$ d$ v
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。* I" x, P* w3 n( b

% P: g: U3 Y: }; e! l

2 N/ ]4 @3 |2 ^3 Y# ~" L3 {6 Y: l  GPT-4又双叒叕变强了!
% Z( {0 d# G1 M, }  c- l
" W$ e0 V3 r" Z9 v3 H4 B1 e
  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview
# Y6 `% u. E3 P% q- v  X! o
, b/ e( g& m9 W4 j0 U; a3 S; a
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
& V9 w* j5 I; k) ^  U8 c4 {
% x2 X+ Y0 P% Q' q( _
  @( I( ~7 M4 B( U6 y
9 I" S/ j, G+ ^5 ^2 R. I
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
9 ^  Q5 |7 D( u* u/ U" T- i& [; P
2 S4 U! P+ b' ~+ R7 e
  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
5 V( |) e+ Z  Y$ t  t* }

% Q+ `5 Q" u- M8 h  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
. M6 U7 r+ C% _) N  z3 q/ A
' Q9 _5 {! b0 e! x& |
  两个新一代embedding模型:
+ }! d; j) P8 S
: n4 u6 T8 `5 V# \
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
; J6 N' h4 _+ s% `, o" Z  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。* s- D# m0 a, _$ W7 E% c
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
4 n5 A+ N) K! {4 t  U; y9 t5 O9 H; S
- B5 i, O) c5 [0 \

0 i% C) W, U) U& ]5 K4 v
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。  F, B( F* n& R+ c$ }. D$ A
1 K0 B+ S! r) i+ E
  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。0 d  n. \# j6 R4 ~" b

( _. G( A) {7 h- m8 G  新模型还修复了一个影响非英文UTF-8生成的漏洞。/ E* \2 o' e7 j- [+ R; D7 _
  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。) A/ f& ?4 a% `6 t

8 x6 O9 h- y' E7 ^  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
, ]6 h+ h" O& {/ c' C( b
) d6 n8 D/ D5 j" P% E' H4 [; _

# h4 S  \& g7 I  H$ M6 ?( p( P, [5 }
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。5 o5 g' s- |" _1 H3 l- f
  `; A& v3 [! o# Z  O
  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
% X6 B. w. p, H  @3 ~, m

* _6 H, u/ D4 S& J  ~( Z  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。5 e2 u+ Y- _* h8 o! u6 a
  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。' K  `' c7 J  Q  x( W

5 b  f4 j9 O( C; z% F  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。, f, [0 N; W* M9 V9 }

. J. |% p7 v3 W7 [
  R! q8 D+ P& k# p( R8 c$ j$ j
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
8 w/ `4 i: i3 ?9 M) m  N( o! u5 \; O/ f% p. i" Q6 s& n

6 X6 ~$ T3 w( ]. A6 _

( p3 ]6 Y4 G' I# X/ Q" C# I! q
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
& B! @( o7 j7 \; p7 y; ~  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。2 V$ B* n% `( I1 E3 q

( ?1 D. \: h( X1 t# C  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。1 D! |  R9 s( Y9 Y
  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
: u" j( f! [  {$ O3 C5 r- v6 L% t5 v9 ~
( K* G6 |" A& @' w

  J3 p- y) k( P6 `  - 性能更强
- T# R$ x( x2 V0 {# I5 D" o

1 \/ L; @1 m) @. v2 ~4 |; x, p  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
0 f# d9 q' Q6 @8 A$ k( o$ z# X* E! \- z* v2 V
7 C3 T) g$ E! g2 y. e* W" f' H
  - 价格实惠9 k9 Y' C  B! Q, `% K$ M# p1 n
# J# U; e; p, A7 T
  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。( p1 Y4 g$ J- M, M1 ^2 {0 E
: _: V7 [" N$ j: f' L) T% k! o% M
  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
) s3 a" k( m& J8 M: O: ]* X& \( B
1 p% ~; C3 w3 s* W
! G$ [4 G4 ]- v$ z# d  B: T
「大」文本嵌入模型:text-embedding-3-large& R; A8 [3 o4 K6 l! z5 V

* A  w% U' Z7 S+ m( p$ ^0 f$ R0 n  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
% a1 j/ m$ s& ~, }5 o. b  text-embedding-3-large是OpenAI目前性能最强的模型——0 q" h$ p$ h* A& p
3 r) ?; r% a& x  {9 m. e' C
  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
+ [/ y0 @  Q+ F* S# B% \" i

: w( S# o& I& V
) {+ @! o2 w. I4 @
% N' v2 w2 W, g. F1 h9 m' [
  text-embedding-3-large的价格定为0.00013美元/1k token。% @+ B+ ?% v# Q! C9 w3 k& A& K

9 O) q* ~& D( r- c) `* o

3 o; W/ F5 X( d# }0 r0 @
+ I! \! b& n8 _5 j7 t- ?0 m* L$ F

% ~' Q- I) |* V  X8 _! v% J
  灵活调整嵌入向量
' {  V5 g+ u1 k6 C0 p: P. t: l
5 S9 L! `7 h) t, G) [
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。  U* B. n% ^# S9 Q+ d" }+ z
- k9 Z3 H' D: m$ c
  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。3 f5 }# ^% o9 v' V8 \2 U
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。6 o7 Q8 ~  s5 ~

9 U; `: T6 [* o1 h3 ]8 _0 O- p  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
0 D. h, {+ o( B0 C& w1 e0 A  这种做法极大地增加了使用上的灵活性。
: `% }. a( N4 \/ V7 e$ a' `

5 ~1 }, u; |: Q: I- I: N( L7 F  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。- e3 J, e, W% A) w3 A2 D

: W* ~" p: J. P5 k
2 n5 H; r. n* i! ^( x4 c

8 I9 q6 J0 v- C
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
3 L/ U2 `& N3 t8 A

9 k% T( ]5 V8 D# o* L) i5 W( U  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。6 }; H, x9 m4 u# d) v
8 L* J% v* I. ~* K3 m  p" \
  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。0 {: {: A. c' {" M3 d+ x! t
  f: q% w$ P2 u- O; ?! b  ?* d( e

+ W* @( p7 n* r$ H0 t, `  h
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。6 d2 n# {" r# e7 y' t! @
# |6 e( c" e, M
  首先,开发者可以直接在API密钥页面设置不同的密钥权限。5 G: y  \1 E1 S% |4 y
' ]6 W" j+ ^, Q7 j" p' R
  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
, Z+ A6 K* J, _! B  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
/ Y1 |, m' D( W+ d, x/ \* }
# P$ d  `$ x- K# u2 y! q- W
  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
& `: ~- z6 z7 p0 Z) H* R* i. P3 R" N8 H- u) h) C- l& I* v
* n( s! l2 O- d# S) y: k! g$ p

2 ?7 u/ h' C/ ]
1 P5 ]) x4 {* X
来源:新智元(公众号)
" z1 |. w2 i  S链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg+ ~: b3 t" [+ n  n) F; B7 c# [/ O& p
编辑:李梦瑶7 J3 o1 I4 r5 l( E6 a0 [( t- e
( @+ \/ s, b; ^, W: w1 v6 k7 G! P
* F  R' u  Z; K  l% Z

9 U, Z( Q8 T1 l" L. E) ^# f4 v
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表