传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 39|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】4 d7 B( j; S; E6 w: }

5 B' P( u2 j6 o% D, p
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京


, D" j% @2 [8 F
新智元报道  
编辑:编辑部

: O5 M. x6 L) J) s7 F/ B
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
1 b4 l, M/ j8 A; F- V/ \
( y# M* `; V3 c& `
& r- N) X2 U! I7 ^
  GPT-4又双叒叕变强了!
/ a: J+ \9 R$ e! v
  F6 F, \1 k& y3 r% p
  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview8 B9 N0 d* v2 x
: B. G# j% E2 A9 F- ~
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。7 }( r5 |! U/ \& v) G/ [% ]0 f

1 |6 k3 b/ e% ?" S3 y
" P( @2 m6 V# [$ N) r1 j
9 N) o8 O* @0 K% u: g
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。; z9 Q# c& ]7 m* Q/ o

, F1 D5 U& H- t' `! S' k  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。0 Z3 q  E+ w7 e, V9 ^

) @& _. b$ C# r3 J+ |+ O  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
8 V) }6 g9 Z5 Z6 g* L: b' ]

& k; g- G0 J% {" p6 X  两个新一代embedding模型:4 d& R; X2 K' V0 L
: t5 |1 W0 Z& G2 `8 h" s
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
! j% B' u# Q- b2 s0 W; A4 c1 u  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。% c7 t5 Z, X/ S3 S
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
: `  _% S% S/ Q+ B# P. {" L) Y# d+ y+ e* u* g% ]# X

# T0 \4 ]# g7 ]+ F& w2 ~

" U) ^/ _9 |  K. @1 D3 J" W
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
  @( }  c6 Y! ]1 b
: T- P2 o* t, Y: w6 H
  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。  j& T+ T3 C( X+ t/ v& ~6 s, H
1 e( N# v0 Z# J6 ?( Y
  新模型还修复了一个影响非英文UTF-8生成的漏洞。
% _& n  w, G" T- X% A  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。2 Q: J+ F/ X% Q6 ~, a: g
  O8 w, D/ x+ o0 ?+ R
  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
5 [4 ~$ U! }0 F# O7 O. _: c* O( }: W: U
* k- c5 z% `" f5 r+ ]' Q* w0 c
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
. E% n) p8 m! n* E* K  s

# V4 x5 A& Z* m9 a$ Z: G  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。' l3 Z2 `  e5 f/ C" x
& o$ _' i+ @& I; `
  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
0 u! D% i7 Z* P+ D  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。8 ]; R) d# L0 c& E6 O; T6 Q

% D7 I! c" k9 M" P  R% ?3 B3 t/ b! n  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。2 o% C$ Z" W3 ]5 a! y, C0 m
$ ~* J& j$ |) ?9 Z0 w' Q' f5 g) e

# g0 G  W5 n* {" ~3 ?
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
5 w9 ^' }  L' ~
! k6 S9 _6 q7 n: P

; d: q+ E! u3 U& u0 _

, W0 P( q; H; L0 R+ L2 F
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。. i+ Z# V; P# W( h/ ?# C0 g
  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。# x; I1 U2 P6 J! i7 Z# s1 S# a' P
: h" a+ S' t$ h! n9 i/ R: X
  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
1 J- K/ ^" P  S! t9 q2 y  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
& I% J. X: ^  X
1 d" q* z$ H* ?9 `/ f5 o0 t
* w& T* }' \/ r/ b
  - 性能更强2 g# s6 m. z9 \) Y, W
) K7 c- Z3 ?! z2 f: Y. f* T( w' ]
  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
& L, j, i; `$ V# d" I+ x5 ~
. H; i) o# F6 U! Q

  |$ V, n4 y7 q4 i8 \% ?6 E5 L. o  - 价格实惠& U; X: T: H0 ?& T" z
1 o3 ]! Q" X% Y+ M# u: s
  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。' A* M5 [* A: Q/ ]& k- O! J1 I1 g# ?
$ B! L% k: J9 o- d
  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。! O0 b& `) M2 `  a
; c7 g3 v# }# ?: `5 ]9 D+ p9 Q

4 I% V( W& V2 B9 W) s9 L6 z' k「大」文本嵌入模型:text-embedding-3-large
& W4 O- D! o. `( ?% {
. D+ v1 }% {% f' z2 Q1 K
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
" X( E" G& `3 a. E  text-embedding-3-large是OpenAI目前性能最强的模型——
1 g1 l1 |2 h8 n$ {+ h2 {7 ~

8 Y3 I) }2 {1 R0 V' L  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。4 ~/ F# }3 u3 m. S4 Q, Z( Q

* q% x2 }! n+ A2 ]' x6 L+ n  [- Q; j
0 A1 E5 N1 U% m, e4 ^- ?
  text-embedding-3-large的价格定为0.00013美元/1k token。
9 A4 e# y# s! L0 }! ?6 |: R1 R4 P1 v7 G5 ?4 E3 n; q( S2 `) u% Y

( Z9 C) Q* W. ?

0 h% S2 d; n2 Q2 W4 p- h7 u
& T8 t3 [) ?7 N5 i0 B0 v  W$ I
  灵活调整嵌入向量
+ [5 v; v) G3 U' P

3 s+ u! l4 L4 ^: }: P: f( d1 ]( z  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。
4 H& d8 N3 g. Q# Z) J8 o, f

# K( y# x7 E$ Y5 y- S  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。
6 a( `1 h8 o( q( D1 }2 @; v  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
7 s$ t; ?; [! F6 V0 x* }5 Q
0 I& h) v7 r  u. L; L; s
  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
, _3 H2 z/ W* |1 m  这种做法极大地增加了使用上的灵活性。
) P$ `+ ?) m- y6 L3 ~
- s+ q7 B& Q+ O' b. G
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。+ h3 S/ {; a" Q# {) B% b8 Y* M# i
+ N2 Q9 Q. O/ I7 _: @

  N0 N" D" Z$ c$ U# ?

2 p" d# S) D5 t: S3 J1 q4 z
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。5 i: G3 a7 Q1 l+ E- o+ S
, q. K& M/ R7 T6 J
  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
, b7 A5 }$ G# ?: F% ~0 }' Z1 z
+ W! k% h2 Y8 w( K+ U
  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。$ _  G; d. o+ F
" h& f8 ~8 j% x3 V' j
$ R; l. {: k3 o: ]
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。  \3 O* C  p4 R3 m
9 P- y7 i; E7 i' z  u0 E5 w- [
  首先,开发者可以直接在API密钥页面设置不同的密钥权限。
8 N' Q2 r9 l0 q7 l  H
8 ]0 U& s+ x1 ?
  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。' ?( o, d9 g: ]4 T. L8 u  x
  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。" }0 a" k) h% I& X5 C: N

( h5 Y2 J" w) Q- U  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
! J# a& Q( w; \5 }& z: l6 J% x
3 y2 j7 K5 A4 C9 W1 x' X0 E0 T
; ?1 G7 P1 r, @
" L( M1 y; y+ B' k
& u0 _1 v; x( Z( d& C
来源:新智元(公众号)+ W* b! y- d2 G3 D
链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg5 a" I% o( O3 N  U6 |7 I
编辑:李梦瑶
1 L' M! k$ r  P4 @! u% b
% a4 H0 k( M  Y3 U% W. x
" A% e% g/ I) E2 f( T
  u$ g" R- l. |0 a- S
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表