传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 347|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
【案例】
6 _4 F: ~/ c  @2 W2 a2 j$ ]
" o; N% ^0 B- E, n$ `7 }$ f# M5 s
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京


( [9 f7 W4 f9 u: D; N+ n7 J
新智元报道  
编辑:编辑部

$ l  I' I" g! n: k4 k
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。! f% `  [; |1 W* Y; Q- F/ L+ _. k
) }) \* ]" \9 O6 U3 v
4 S$ C& t/ b/ q4 T
  GPT-4又双叒叕变强了!, [* L) F/ n+ n7 b
0 r, i4 ]; |% @6 k0 y$ h! X4 O# z/ d
  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview2 F. G" A- i: D) i0 g: a3 c
8 X5 b& z4 S: I+ U; B
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。" h7 J1 u- B  y, W1 n$ U
) u; s; @7 D1 k

! f0 X, e( s1 q; D
6 |/ K5 u& F" ?1 B5 x* G) k
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
' O/ Y* J5 N/ H# X. o/ e3 X. N

3 Q. o) }0 y4 A6 J7 r  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
7 Q: c) G" ?% n0 L% r' `- Z& A

7 B. S; t2 F7 o  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
% A8 b; t$ W6 t" g9 C  V

9 H. A# M# u" ?" T  两个新一代embedding模型:5 M( E! g$ i" q* j4 l  K
6 O" T+ ~6 ^* w, T
  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。; Z# a' E: Z! H% j* s" E2 {  _
  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。/ U: r7 c, F: O4 M' ~4 F
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
8 D; `) D# ?+ {2 v* F! l' w9 e/ q- `2 I" b& {$ N
. B# [/ P: T- Q( h& y1 [- r

. `+ D' r/ o- m/ K, _* h" S
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
9 \7 k/ ~0 [' V$ j" I! E

1 V/ z4 [" t. N  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。" g! v& |5 k, }2 N+ `3 x2 C
; e$ a1 h5 L, k
  新模型还修复了一个影响非英文UTF-8生成的漏洞。- j1 O1 O& }) [: O; z8 [+ d# Y
  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
0 b5 Z4 I5 U, M/ p+ x/ V8 w+ T0 y
) c* l, I3 m8 y- L0 {- y1 v
  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。0 Q4 _5 v2 s) X3 p
, h0 l  K& }) f. t. D0 [& F
3 |& \8 m2 J& ]: }. m- E$ s
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。8 ~' P/ D" w/ }  N- D. M
5 N2 n) y+ E, P0 C8 b7 ]1 w  v
  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。- y2 B" T9 I. c# N  ?* ~7 w- T

" e. o% d" a, r% @/ d# T  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。  O) o1 T" ]; j' H  S, `  N  a
  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
  ^: Q  \# v; P2 v8 P( x# U

; `/ \) K  j. W! q- i  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
! I+ h- s' b& g" @. G0 V/ V# j1 D& L* s& r; j( i: U) v. M

/ z5 K% T$ y4 N% M/ P# i
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
' v6 M. Q# d4 Z1 J- \, N7 O/ F5 n' z/ Y! A! u  Z
& @" B6 z# Z1 X* |3 F
# `7 Z( \4 Y2 @5 \- A, ]
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
6 V+ A0 C% j# V' x" \1 o% d  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。8 W! ?7 |5 {7 `1 J& |- @
1 `/ k5 ]8 A3 D" Y7 [+ g# C
  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。
; o& h4 e6 e: N* j  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
2 `1 {7 U7 }  }
" I6 O* b1 ~. M2 J5 {
+ c/ W9 U8 E3 U0 j  F/ Z
  - 性能更强# I6 U9 _. |& ^! O& A

- }) i  c2 e$ a  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。" i0 i% |5 P' ]7 f
1 F. e3 D3 v" q( Z' G
* ?; ^. V. a* P' ^7 q- f- L1 B
  - 价格实惠( Z, \# i, a* ^0 A

# p& Y6 T: K) `- u$ r& r  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。# J! Z% D; q! |( \  o2 o: P

  n% {. a( O# Z6 i/ D  ^, S  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。: t  e# m. N; T, C. ?, M

- U1 ^0 b! y% `
9 U5 y. [: a+ t6 x$ ~
「大」文本嵌入模型:text-embedding-3-large
% ?3 I: q, m. ?" M
8 {% B% l7 ~3 j; v( e
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
8 k/ Z- J: P1 O* K  x& v  text-embedding-3-large是OpenAI目前性能最强的模型——
8 E3 e& [. J, l
1 l% c! M; o; J* D6 @
  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
3 C$ G4 B7 r: s- y* \7 Z3 w
9 R4 N* I8 W7 U# D8 T( P  o, n
: ^7 d; t1 g5 |0 p

: ~' v& \  V% g3 {  text-embedding-3-large的价格定为0.00013美元/1k token。
& z: _& M4 k/ q# Q8 l$ P+ L! L9 W/ O6 X! ]% u
+ d; T- [" d) {' F

' d# j3 Y* X4 {& \  `- }8 W4 |7 J1 R( t" H) a, L4 Q
  灵活调整嵌入向量
4 \2 ^8 j/ D' q0 W& f
! c' Q+ d! U( v; k1 C' \& f
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。
* T1 f$ D8 x& r

8 h, Y8 u6 ?- X+ {  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。
6 L& U5 _7 l. i$ Q3 j7 B  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。: J" J0 y# K/ N3 i% u5 L. K/ G; s
$ m! a4 i1 p# T; \/ U
  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。3 T* u8 H6 A" Q8 {7 v& g
  这种做法极大地增加了使用上的灵活性。$ U' x- N4 i. E; d2 [9 }; D; c
& S* C4 y$ a5 y4 y/ H
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。
+ a' v1 K' h# B* s  c  q+ O7 }
3 k9 N" O( ~/ m

4 J% W+ Y1 @5 K

; _2 S  J- {1 i* Z
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。5 w! o4 o* N, F2 V! s4 K

2 O5 R% e, f* M  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
- W# z9 u( W: m' h8 {, B( k3 B

/ p8 _- l1 W& u* m0 A/ g. a. r  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。: y5 H, U; X6 a; G+ x9 w

# {0 q% [( a! D5 b

/ h8 Y- n5 _2 O! g  u+ {4 F
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。: c  m* B: Q0 C4 \  g
( t: u; @* ^. D- ?% r( M, Q
  首先,开发者可以直接在API密钥页面设置不同的密钥权限。( w2 F8 B/ f' s& s; _6 A

0 r- X  E7 ]. a5 S  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
0 f! Q/ X0 b+ U+ M2 r  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
9 q+ `) |' k+ x9 p

0 s0 R4 r0 n$ X; l6 R" `8 T( k* u  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。2 k& y" s3 l* i# o

# D# h& w( Q" w* e

+ R, F0 b: r8 ]$ I6 y' ?

, j  C3 X: g. ^5 Z$ m( T8 D& {# O: O
来源:新智元(公众号)1 ^: e) X2 {. _$ _5 d, h
链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg2 T9 e6 I; ^% B; {8 ~
编辑:李梦瑶' x+ \% Z7 O: l' E9 ~
. W. d! E1 K* D

/ E# X, N$ u) \, z* I2 q! {
  A/ m& [+ n. |0 K5 I$ w
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表