传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 430|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】& y: Y: \( M% K# B9 _: r
3 Z6 J5 p4 o4 u+ F0 Q
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京


4 r8 p4 t5 |1 k! v9 [/ }8 v$ o
新智元报道  
编辑:编辑部
  Q/ H, D4 X+ L; S
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
2 I% _( \6 D! T2 e( K4 x4 U7 j; W# y5 Z: G+ s1 [

, _" L3 E+ C+ I9 q  m2 X; _8 j# b7 i1 r  GPT-4又双叒叕变强了!+ {. d' M5 i# ^
9 g, P( w2 t! x3 x! n$ [4 n1 G( `
  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview
% A- `$ H0 n2 r# g: J8 Y
) B" N, c5 y( y  I* A
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。3 P% b' u  L8 ^
3 W/ H0 z' q9 z# \1 s5 w, Z/ |

* f. _" y: p1 ~3 N0 \

" Q, @9 N. O& h8 g8 ?
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
) C  t, A5 I$ s9 @+ o$ A5 n' B8 n
' J$ w& ~/ m$ A- T7 c  c4 @
  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
, ]7 E8 n: o. ?$ u/ x% W

- R- O  s. S( M/ J2 s$ O7 @9 {  b  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
0 e2 G  P7 i5 z" o5 x
, F% }6 E! X8 m$ ^
  两个新一代embedding模型:
2 y$ `: ?. g+ [! o. z, |. M- q

" F0 o& K* e  C3 o* z& M) N0 l  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
$ g- K9 G% L4 c  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。2 G, U$ j7 W" H7 V3 @
  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
# E! V& m0 E; ^
0 \" R9 q- |' ]4 l5 a4 L4 K, A
- K8 H( [) ]. S8 |) C% D. n  I+ i* d
* H: }& y, l; E3 T1 i2 U
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。  Q' M5 z- Q4 a5 ]
5 e3 d0 e2 g* A+ Z
  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
! h! J+ r3 `0 O
- x+ ~" }! u, D* [
  新模型还修复了一个影响非英文UTF-8生成的漏洞。
# U# A! C$ _. O, p" n0 p  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。
( i7 {9 c  s, |, |  k
1 x' H9 N7 k. @0 F' ^& E  v2 u
  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
; z. r, s- N& Z1 d8 a* E7 `
3 M! P# E, X1 B  }5 {
3 m$ \; B/ k6 i* I
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
5 Z* R) g2 f. i( j  v3 [4 d

6 u7 E6 D% |8 Z& ^/ I  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。7 j! Y3 N0 f# K" ~, q$ I0 T/ [
# L1 s' T! c, D# m
  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。0 R: ^0 G1 v( \
  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
7 D% j5 M+ D0 f6 E$ O

3 ]: m% Q. N8 {; i2 K7 O$ v/ {9 f0 B4 Y. ]( |  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
5 Y+ X; ]% V: \( k* M3 h) {9 E1 q2 D/ |7 ~' V! ?+ B5 ~

3 L, c- S% a; c- K7 E7 K! q0 D
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。; o; o2 R2 i4 w4 E  R7 t
* k2 T" F1 q7 P" v# m

9 m" C) \* f. R9 f& O5 x: f# P+ I
1 ]' b1 l3 n: @) L# j4 t
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。
, r6 u5 t6 _- d) A/ Q" A' k  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。) t2 ~( Z6 k8 _1 p. T

! d+ Y; t0 i- c  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。" Z! D) C) D% W! K- Y5 i$ p( e
  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。, g* K  H  w1 f( Y% S  t3 s

% O) u, S0 Z0 s- z( k
4 k! m. p( `# o: T8 Z  o
  - 性能更强+ w# V# Y3 U8 C+ u- P

* P3 c& P$ j! E$ E8 M$ S  `7 ^  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。
" l; ~2 D! `! n5 M( d  Y" H0 Q
, @# r2 g0 I% {; S4 ^
2 b, z. z% `1 F5 x
  - 价格实惠
, r+ O) e8 j! b6 k. k, X1 a

. @5 M) U4 ]5 G  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。% u6 Z( `- J# Y: L4 s+ C

3 y# M' R( R6 O, v: {  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
" H( Q) s. Z1 ^1 _9 Y$ D/ z8 k7 t& l2 u+ ~. s5 e/ {5 K
; Y, u. j9 c& x7 l
「大」文本嵌入模型:text-embedding-3-large
3 B, ~1 k3 i( q. x0 L' v

% K% `6 |5 a2 `. J- H/ t  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。/ h' i' ^" o" d6 z1 j& L. G& y. P+ \
  text-embedding-3-large是OpenAI目前性能最强的模型——
  t% z. O* {# k* n9 _, e
) B9 u3 k9 E4 [
  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
4 N# i8 o1 y$ Z/ h$ }* F8 K+ ^

' |: A$ P) f4 c
, k1 B) M: h& l( L  S( D& T
+ c) P3 p1 g+ I0 ^  u0 R3 C5 `& I
  text-embedding-3-large的价格定为0.00013美元/1k token。/ D8 v6 X: E1 p! i; f5 i- N
; y3 m' S1 ?7 O, E$ ~
- {1 R8 A8 e' A( ^2 j

8 e6 z. J6 l0 E! M  @! N3 [
" [% }7 f: p! r5 {* R
  灵活调整嵌入向量2 h$ d0 U& H- I' n; l% W, t9 ]

- T' Z. b4 o  v; Y1 K- a  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。7 U5 H2 ^* q1 Z+ m

' y  W) S: \7 B/ F0 B; V( T  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。  C* b% ?7 J9 m# d) [
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
: G& I% X5 G) ?9 [7 j$ c" c

( ~# }& ]3 ]% W; h! C4 k. a* m  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
# q# Z% ^$ \3 @  这种做法极大地增加了使用上的灵活性。
' A- b2 I2 b1 X) _5 t8 n" |
: t8 ]/ `! b6 Q2 B( \0 `
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。+ y: {) q% z2 ?* }& _, J9 v  Y
; O$ u2 m9 F* h8 }

1 W" o; f* a* \4 ?  p. e

  E4 q" \4 G+ \* {: B* K
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
  T- Z4 z3 V: D* h6 y- e

. S8 A  |" J  i1 e- |& U/ |! g% X  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。
' S6 A3 c3 e* L7 ^$ J6 s

% w( a9 s1 v* r6 E  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
# G$ c4 ?3 F( g/ p8 w  B7 I' _: U
) u9 W* _& L# ]
2 B6 Q- [" j8 P- F4 b, d9 `3 d+ Z
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
6 e5 b/ U/ P% H- f2 Z# n" G

- [' X, ^/ \  [4 S3 h+ X2 Z  首先,开发者可以直接在API密钥页面设置不同的密钥权限。. W6 M+ g7 V3 Z# D9 G
+ C4 h, B& ~+ k
  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。$ P. W6 E' m, ~: g9 {. ^8 o
  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。8 W7 {8 L( o6 z. A6 L0 H

* R* J! Q& w3 `* E" d7 o# ~  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
7 S) U7 p& s. \% j; C# [5 Q) Q3 |- V/ s; q7 e  L3 e
- L+ v9 S7 K) H; E
; q) z. r# A' b3 s* t8 b

8 Z. O! c4 m; f3 Q; e* {# g( P
来源:新智元(公众号)
$ Q0 J6 l, _2 O. i链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg
3 Y: W2 W$ l4 v7 m编辑:李梦瑶
: ?3 o) [( u& |) V4 `0 a
7 j5 ^. n. f- X7 I

; A) v1 C) B. z! w
/ U* d4 S4 G. v% Y' Z
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表