传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 365|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】: ~3 @6 c/ m1 m+ T1 ~* P: u
: \7 z9 S" d' E& r
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京

5 t! L7 Q; w! C
新智元报道  
编辑:编辑部
9 G- z9 k- ^! e# d
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。8 @# L2 g: w- X+ o  I9 i, `" c, k* M
1 ~% e; E2 f& Z% ~# H% K
8 [$ }  X; s) ~
  GPT-4又双叒叕变强了!2 g+ H, C' x! k2 T
5 K+ i1 e8 p2 G, J3 Y7 t
  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview
; k4 w  ]" e  d
8 ^2 R+ M% p# A/ y
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
6 ]6 A3 C! H* F0 v4 e6 t: b8 l3 L/ b1 H

4 s+ [: x- A5 a
- ^5 q6 G0 J" ^( R
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
% \, J) v- X6 \6 [& ?  M

4 n) ?0 r+ E8 `; B1 m+ l  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
9 N) ^9 r* b8 d, X9 B
6 o5 [* o1 [* K  c$ Y
  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
# ?6 C# \* f3 t  n0 X; W1 U: v4 [8 a
  O% K. p0 w/ V/ A
  两个新一代embedding模型:5 P7 g$ O! S  I( t" @! X) }+ C* T# X
% ]1 D1 I$ k  w! ^% A5 k' `% W5 E9 k0 c  U
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
7 m) C; a  G/ {  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。" ]2 b+ X0 q# h# P5 D
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
9 R/ j# y9 |9 @$ W
$ o4 b+ S# ^  F% T4 v: J
( Y7 B; f, N- z' A9 w
! T, C! q0 y# l8 _/ H' T
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
. b4 d# ^8 [: {  A* H6 s7 b
/ l7 I* G: ]$ w, f9 ^7 W- u, j
  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
) R, j' \* ]5 \# R8 j9 Y

, `/ y/ [( d! Q  新模型还修复了一个影响非英文UTF-8生成的漏洞。' J2 S9 _8 C# b& [1 S
  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。+ O6 b5 \+ _' \3 E
8 H% b8 p3 e: ]1 V! {
  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
2 {& D. z# e2 H6 r+ o' C  O$ {6 ~
* w% E! s, U9 D  @) L* \' M- d

. ]4 @  ]' A; N
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
, o6 G! m! X- ~" Q) ]4 S+ U  ?
; T' C8 b8 Q: {7 Z$ F
  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。/ t7 B3 B5 w& i. l$ ]. z; h
3 h& ?3 N7 N2 [! F" e4 U1 l
  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
5 r4 a% `& F' K1 v0 \/ l/ f( \  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
; C5 T) E* c' T7 Z

* ~; [) r: H, N# x  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
4 R& V: V, x$ T/ F  j9 V6 |' w, q; E7 n6 x' u6 c( S5 l7 X
" s, ]) _- w* U8 \: V% a% \
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
& J2 j% p- [4 q% y7 d; z3 P0 {2 V: D* N

' M+ _( k3 E8 P* h2 L$ e6 J
0 P+ A, z  c7 A) q) F9 a8 f$ R
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。) |6 A6 V% R/ U2 [& a
  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。1 K. d+ K  v) L7 p$ U/ b

, @' D0 W0 [7 v% x  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。( a, I+ t7 r# u
  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
, h+ J2 [, `3 A; v! M3 G' s
) E! A8 E5 n" D, M. y

1 y% s# M/ D- j0 }, }: q  - 性能更强8 O# A' V% R7 ?
; B" W7 r# b4 f
  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
* |. ]9 _- t/ v6 ^2 F4 b! b/ o5 P

: A7 q. Z5 a0 J3 m; B& p9 C  - 价格实惠
" V1 y3 V& \) U; A+ o6 [$ f2 K
3 N% @+ ^( s: x6 Y- g; Y: V
  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。
  U6 E, e8 y) Z

2 c# ~% ^1 U$ O) A8 @1 ]2 M4 E  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
4 V! E) _; Z  y$ {9 y# n& _" l' [  _0 K# |1 z
: W6 r( \3 Z. l2 v& }3 }& x
「大」文本嵌入模型:text-embedding-3-large
  k- K8 ]  V& H$ v) |" c
9 l$ D  j) C* t$ r
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
7 j0 p2 s+ J$ Y& S9 U  text-embedding-3-large是OpenAI目前性能最强的模型——
* F$ o9 R  Q& u, C6 m/ g: f

, r: v! I" ~. G9 L, W: }# ^  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
' [! f" ]' T1 |4 L- Q: F
' H+ ~% |8 E) m# s
( \0 V1 ^9 \/ E8 N0 l- E4 o

) G; D% L* D9 f4 m  text-embedding-3-large的价格定为0.00013美元/1k token。
; t- J; ^, X- O% p4 A, x1 [# _& @$ ^
0 y, i3 M/ J+ @9 E9 P6 K! x7 T
# d, z2 g, m% w: k8 F6 V
4 ]0 k# a7 d, G6 e) P3 g
; H* r" l2 w" A
  灵活调整嵌入向量
2 s) ], X1 U* i

5 N- U8 S: g3 E/ p  f0 a5 h* G6 ~  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。. P& A% U% F8 D" o* c8 l

6 d0 w1 L) Z! k& h: W  X4 u  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。' B$ g- F' R/ S
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。1 d5 {( f  g/ s: ]

! ~: N7 b( V. u9 N1 o* \6 V+ N  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
  J" S- [2 V8 t  这种做法极大地增加了使用上的灵活性。
7 O$ z" K+ a; S$ n  O3 W, y4 G& v0 t
5 `9 r/ b. }1 ^* T0 o
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。
" ?8 V/ f) w4 C9 m! i
0 ]( @0 I, M1 D: i, X

: i7 |/ g5 Y. ?8 }
; L! t3 y# ?2 K
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。5 F2 G  v" [/ y. G

9 m# m* e/ O* K/ Y  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
- l$ u: C2 `9 W4 u# w5 w! D+ o8 S
; C9 O9 g2 D% R
  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
  }. s& |! t6 k5 Q+ ]6 a$ j% ^) D6 E7 \2 R
' G6 N0 T2 F8 R# r, S
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。3 g% E9 _  \  _/ s3 {1 Q
$ E/ j& T4 a: p9 I, P$ W" b$ E
  首先,开发者可以直接在API密钥页面设置不同的密钥权限。
& k2 z  }3 _/ F+ t- c/ ^

! g+ [7 g) A# S1 t  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
/ t0 M# z1 h0 e  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
; t7 x0 e, f2 R% t( t! d* \
; {8 a6 j. j4 p  G
  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
, C9 o, a8 ?; j: p/ X  R5 H3 D7 x: [' x7 }  M' q0 L) q& V

! _- i, g! W) l0 |' j: }, U; W
% O9 A0 x* n$ Q: t; G
3 j4 Q4 Y! T1 ?( W2 s6 d
来源:新智元(公众号)
; [' W+ N4 p3 O9 ?2 v7 i! h3 b3 ~' P链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg
2 I0 [( J# P0 l  B7 V编辑:李梦瑶
7 h* g4 \( p, y7 q- ]
, |9 H$ I4 ]0 ]' R$ n, k+ _

* z% v+ y0 A  l0 u2 J" l8 j# V2 n
8 E; N1 P1 x& f
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表