传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 206|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】
3 v! Q8 }' |0 d6 G3 i! ]: ]3 p8 o/ C& w2 u1 L0 F) r3 t
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京


# u% S5 \7 f. F8 b8 x2 M
新智元报道  
编辑:编辑部

+ W$ p! W" [, @: x. K* Z, k
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
. l+ }- _) d  m; P9 |7 d+ g% f) V& i3 R% ?7 k0 V
9 N0 A) ]4 `& v( \3 x
  GPT-4又双叒叕变强了!. ^& o) @( o% J- g

- }- [, s: g( X9 N% m, Y* c$ u  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview- b9 z% A: N/ ]
: Y, k: l  g1 n) o6 n3 }
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
' W; b8 I! N: X( j6 a, _( a
9 s6 X& D  }  U% p0 g3 f

% e) ?4 t+ p- O% z( i

) \( d( o8 ], N6 V: d/ j+ G" q1 @
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
; K; u% l; P3 K3 C! H
# U+ o( O, d5 d: Z- Z1 ^
  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
) Z. x* e/ w  R+ d) J% g6 y6 N( X
" D1 {7 p2 _# l, F( X' r+ Z+ Y
  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。" S. g6 l! T0 ?) z' s' s

' z9 }$ B4 N  o4 x2 d7 }9 e( _  两个新一代embedding模型:2 V! f5 {" ^8 G  {* e# o" x8 b
: t, E2 v" i" L! F# `
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。" @3 O- u8 S8 d0 s9 f. s- U
  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
: J4 s4 c& k% w3 C  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。1 g9 o2 @4 K# ^, e: h9 u: C, o+ o

/ ]# P( s" x! I6 Y# k6 x2 Q
' g+ x: b" K1 {6 m- d$ K* A

! a4 z, j( X' f- y5 O8 _5 B+ l. F
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。) U( m5 ^+ W. j4 |! S

5 y, w2 d: a; z: ^( D2 K  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。1 [2 A4 I" T, J
% L4 ^8 g# g/ E7 C  p/ z
  新模型还修复了一个影响非英文UTF-8生成的漏洞。4 {, q* y2 U  \) u5 I$ Q& E
  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。' h5 }$ \4 m! H5 o! Y: P- F
, Z" Z' u2 G; A4 q
  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。/ [- q3 q8 |. U! d5 t

# ?7 Z3 U0 ]8 w% C2 I4 {
9 ~9 R; O5 H, d3 ^. B; O+ ^+ z
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。! j' z0 Q+ R' G! K- Z! Y8 N
; ?$ {* ~1 G- n5 F! \
  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。6 k4 ]0 j" C7 Z; U3 ]4 \

8 U+ p7 `0 n  X3 s2 r3 `+ W  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
3 \, j1 G6 ]! ^! g  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
' \& |, g7 |1 V, |( r$ w

: @1 a" Z$ u5 `5 l  `) g+ c  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。, B6 A; l) B* H: f, ?* x$ U5 F

/ }8 ]1 ^. i1 o& N7 P+ {! W1 O  N
2 H5 T3 [+ ~' S, o0 v$ r3 B/ x
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。% x2 u0 l5 t" r; T* g% C
2 t! _, {8 k9 E1 m

" E% v' t, n9 J3 ~, }
% Z$ F5 ^8 i" Y4 Y1 t
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
$ W' J. q2 w( B0 J& L- L: t  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。7 W& e/ w' `. z; u. _% f5 k

" I  H% f  k6 Q, w1 P+ J- W/ \/ K7 {  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
  {% l4 g* R! D5 K% L  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
0 ?" }" _& ~0 v
- ^7 X, y, p- H6 q3 u6 ~. |1 [8 N

5 @1 I; e6 h; e2 s8 q2 [  - 性能更强) Y  d! ]1 s3 ?' |* j9 l

3 @" Q# U# r! b1 X- A$ R  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。# n& r/ L# s. F2 T0 P
/ r* O3 E; G( m, z% t, b
! Q1 X+ }9 d6 U, K1 ?
  - 价格实惠, @  L6 I! i, x, c" T

  t" J8 i* p. F4 b0 r! i  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。) v$ Z8 l8 J6 C2 c
1 V5 q" {/ Q  k4 T. x6 z
  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
7 z3 v" h' o; v2 a) E4 y/ R: h- Y7 u- T, l

& F* @1 J$ X) a$ L「大」文本嵌入模型:text-embedding-3-large
+ K8 j, ^! O; `( P# H! j/ V  m
/ y% d7 \  i, Z- g3 h
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。8 T5 s8 ?' Q, m+ q4 q
  text-embedding-3-large是OpenAI目前性能最强的模型——7 e; P8 Y1 g/ g

0 Q  K- J4 Q& q+ u3 ]  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。/ a8 c. j) e. ]" w# @

2 l) Q/ _' D2 p) G- S2 s* g$ x% P( r1 u' b- v

$ O7 p5 o( {/ @  text-embedding-3-large的价格定为0.00013美元/1k token。; _4 }) D7 N; C" f' k" L
0 Y5 a' a0 c. V+ z- b
/ n1 q' Q: `2 x1 |2 G
$ }4 a  W: T6 k! z2 a( W
5 @% [, w* n4 L" k. |: V
  灵活调整嵌入向量# }4 ]' n6 j5 a/ S/ l
  g7 t" J; p0 p& X
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。( o7 f) o6 L- e! A
& `% R6 p  y7 Q- L0 m  w
  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。
& g8 E4 U$ q+ @( S4 h  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。8 B; Q9 N% l- N1 S; H

$ ?# `$ e! D5 E' Y4 L' |" O  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。: h6 y$ [6 l5 J5 R5 H+ @( M* I
  这种做法极大地增加了使用上的灵活性。
4 i2 {4 I! L+ Y- S4 j/ e2 [; R
6 \% y) F( ?5 U3 O' f
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。3 C- X' j4 `4 q8 P0 H8 Y" ?
; v6 Y  P9 }8 U8 P0 m" E% V
! k' E3 L+ x6 x% U  o# ]
5 ]+ y+ f/ ^5 Q+ l6 b- Z  ]
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。" K. V+ ^6 C& R
  Z( z+ p. z0 Y5 Z: j# `
  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。2 B5 l. x5 _9 n" o
' h8 ^: u' `* }! v) ]+ p, U1 Z: N9 O3 S
  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
* J6 O- x% y8 J  A; _  V3 @$ K$ `- O( l1 ~

" d4 [+ z& Y  C; ^4 M: I2 p9 _3 a
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
- x8 ?  e. l+ B9 H7 @, L
2 J! h$ r8 g) }: t, |) Z
  首先,开发者可以直接在API密钥页面设置不同的密钥权限。
, ]2 C5 b9 I; ^! [8 z
. w% Y* z& r/ H; y- u: v
  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。* ^1 ~; U$ i5 a9 H- c9 y
  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。6 i* I4 w  B: |* Z7 C
: Y& L: }9 T& n# y
  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
# b$ [7 g9 ]% t0 n, Y" f0 ]- g. v  r: P2 {6 ]3 v. v! g
( U5 ^/ q: k) m  F$ G

; v4 q7 [2 q( u1 g5 d$ C1 f
' E/ l4 w* b# K4 B. s% Q0 g, k. i
来源:新智元(公众号)6 c  p- ]+ E) X6 S) e
链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg
1 M9 M5 e& V! o4 i编辑:李梦瑶
( A& k% Z! a7 U; |( ?& U! q' D
# S: u3 ^! [2 ~5 l0 j5 F
' o, i3 x6 [2 I
# g4 z3 x% O& t: \7 x% U
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表