传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 364|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】4 t% k/ M6 h* K
: b  Z! h" V; r2 }/ I7 q" S2 @! V% h
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京

* u) n' ?6 s6 @
新智元报道  
编辑:编辑部
" A7 n$ m' d. K) w8 M3 R
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
7 ?9 ~2 Y8 X2 S# `  g4 O/ Q, L( D4 g2 Q* q6 W! A

& R& T% A9 z5 T2 M4 r% v  GPT-4又双叒叕变强了!8 t6 P! n/ L" }3 R

5 e8 t' ~+ u! a& \* z6 \  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview
5 ?- z! A/ K: `6 `) ^8 _/ B; T5 v+ {
3 W8 n* H! D4 P+ D9 P1 B
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
8 L) [+ V2 S& S: j0 V# V6 ]" g3 V+ @. L# S. r' S/ H4 c9 K

' ~9 b' `9 S7 B3 z
0 O& P* u; M  V
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。) K* |. z7 S' B9 y

1 M3 ~$ k6 |& g  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。- x9 ^; |" _- w, }) {, j. R  O
/ H" F( S' r3 i$ Z% p  V
  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。; _% W7 |& H  M4 l

) b# m' X. [0 ]0 j2 O  两个新一代embedding模型:
# P0 ]; x" Z3 y% C4 E& f, l
- ]$ a4 u8 x8 l# {
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
) |& b% W# [8 |  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
. ~' d- S/ b9 G: F  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
1 H' c5 v" Q) Q- X
- K2 s( ^. J* J+ k9 D
) F5 `' f. C  t$ X4 \# H& E
" }7 y* V: h9 i% X6 F' w! R8 Y
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。7 b& M/ o  |0 f: n0 B

4 ?) \  I: K4 D  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。8 x+ d* d9 B5 ?! t( m7 ]" E+ {
# i9 X; c8 X! m6 n8 L% c
  新模型还修复了一个影响非英文UTF-8生成的漏洞。
( e' T) m7 J! }$ b7 y' i2 O, P& a  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
% X8 u  L8 S- `* ~* {2 J2 g" s

/ f/ m' A# j- D3 n$ Y  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。0 v8 W# l( A; s/ e9 J: s

( \/ n8 E; }" a9 j

2 r/ H4 A8 v/ Z3 B/ Y
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
7 ^' }' c- B3 N' d" m

; f2 y- ?# E5 V9 Q! Z" m6 }  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。. s8 d5 o3 H# ^, f) E

3 y1 U% I1 ~* t! z3 U. F  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。# H4 L9 R2 d  ]9 ?7 ^
  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。. R4 |+ C; }# S1 |4 O0 `
" y; ^* B. D7 O
  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
8 s! c+ K7 ^9 V
5 V4 g0 v) k' @! Z  H9 A  y( D# _
- D9 B( R" k# [. W- r
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。. ~3 d8 `  r/ r/ Y( t; R

% [0 V8 [: J6 P& a; _9 X
$ d5 y9 e( J( Z5 ^0 {( F) D

) z' f+ i. ~5 ?1 s4 B0 |
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。5 F5 I+ K7 r; D+ Z7 U) O
  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。9 M. q% z- x5 v* i1 v7 l( a8 Z: P5 U

; K3 i9 i# h+ [, p  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。  G' R6 G8 u& b  }2 ~$ Q/ A5 |
  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
4 ?+ N7 ~* M1 [
: Y- {4 C; X2 M4 E; x2 j- ^

  ^; S- l" f! U+ e5 Z0 [  I/ l* @7 b8 i  - 性能更强7 _- H4 y: _* |3 R+ Z: e4 t+ m
% D- M. b0 J: f, U! h
  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
2 F" S1 C& p- d$ [6 A9 W2 X7 x9 f3 a8 o6 i. g

/ P) T. N5 w  z  - 价格实惠
, O8 R) S- }- M2 M% ^4 T
$ X' E( N6 m! s1 j' ^
  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。9 y( v2 L/ [5 H

+ y3 T9 E- p, p2 N4 \5 S  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。' m0 `- H8 s; _2 u- b  S0 ~
6 G! E4 K2 z7 j. e: b' T

% \0 ~: o8 f+ q0 A  D8 b9 f* u「大」文本嵌入模型:text-embedding-3-large/ b6 s9 t( |5 ~5 U  }6 J, ?$ U
2 c" \, a/ x; D1 H' x" P7 w
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。; U1 F5 N0 |( f1 h" y
  text-embedding-3-large是OpenAI目前性能最强的模型——
0 S5 I* ^) `8 b% E
# Y( L% k/ c$ n" [* X) \
  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。) I  E2 h9 U% S( k% J/ h

* W2 C* o3 g2 c! n3 A
) n  t2 {' g$ F& g" d/ R  H
! K; ^0 M  M! `
  text-embedding-3-large的价格定为0.00013美元/1k token。
: _2 r6 M: B; q/ k9 u8 w7 W6 n4 C# u3 I: K' ?) T
% G2 Z* j3 q4 x/ ^+ ^

- _# Y! D% d4 C# _, e6 v+ A( T% j8 ~) O7 v$ X3 ?& l
  灵活调整嵌入向量1 x' H. N* p, O7 x; U) k4 R
8 e8 k6 C8 a- [
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。) r: }, z; R" x: `
. X  e9 @+ E9 i8 ~& f9 S0 k8 V
  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。5 K" D" l: t  t7 b7 r9 N
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。% M1 o4 F) `: T
) K( |; S9 d/ Q! Y5 E& ~* q
  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
& M/ O8 y, f. c  这种做法极大地增加了使用上的灵活性。, I& d3 }3 y; {' c- q

3 o" V9 f7 q  \2 z2 P" x1 Y6 u  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。7 m1 l9 J- K  B8 h  a( x
: d  c0 _0 p- b. ]
) l, ?: r' P& g+ b% J

& \% N6 ~/ b, X
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
4 H2 Y& J7 k! F5 a8 L

) }7 V1 C% B6 g; ~  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。0 E4 h( @0 q1 K6 d" o
! e  o& V5 s$ S& ?# r
  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
9 D) f7 R( A) L$ P" n
1 O: W! Q$ M' T# _- ?0 @

6 O! B# w8 @" H9 H+ L* p
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
/ m& n6 j" k" `# R8 O! i! r! X/ n
5 d: X0 o" j, i
  首先,开发者可以直接在API密钥页面设置不同的密钥权限。
+ h; T. C, l' V0 @9 i2 Y

0 L2 ^3 ]% S& i) ?  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。6 g2 [# n* K6 o. C5 G  t# S- x
  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
1 I5 Q0 k* K3 ]" Q! H, l) v
2 V  u! z' B1 E" ^( T% g
  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
3 G* ^" J5 Z! u# F4 `* k! U$ t8 @- c; z7 y; F7 ?) g3 _# a. G

! f4 G4 \6 T$ R; y" f

$ [- S) k* E  D0 f) D3 N+ V% d/ {$ |" e4 Z6 T, O5 s5 a) n
来源:新智元(公众号)& t! _( {0 ]" j% @
链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg" |6 N' A, E1 H0 I: M. r2 B' R
编辑:李梦瑶
6 X  w' \% F) ~% J1 ?; C

: s2 B% W. {, c0 V. m% [% I
$ J. D8 M" z: R+ v8 p' d! c  @+ I6 t& J% _
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表