传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 468|回复: 0
打印 上一主题 下一主题

GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙

[复制链接]
跳转到指定楼层
楼主
发表于 2024-1-26 21:52:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【案例】
( k/ J) F/ q4 D$ n+ Y
1 r3 c/ x  n4 f; y
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙
新智元   2024-01-26 12:18 发表于北京

2 B6 r; R) v: R1 M# a4 w& E
新智元报道  
编辑:编辑部
* z1 f& i( h3 j1 ^; ]1 @; ?. S7 T
【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。: ?) ]* p& Y7 b4 P  m+ Z

" m+ E, x/ h/ [* K7 z0 `
' K7 A" F, \6 z% r
  GPT-4又双叒叕变强了!
* ?' j7 u: \: V# D! E
; `( }" K$ w" n9 C5 K; [; n2 o
  今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview3 x' b; E4 S4 n; }# {1 g& t# f
, {9 j  _. ~9 q4 {! `" K5 a. x
  不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。! L4 i1 |$ }; Q! B& e" F
+ |5 q& I3 I5 p) e' B- Z# ?7 P
: G+ i% `' l0 Q' P# Z
# T) d3 o* ^# E3 t
  与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。4 ?$ f  {3 T4 b! n+ T

8 A8 N% o$ u4 x' c* t+ E% n  - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。: C6 |. q3 ~' ^' i

' F' d& N' y( u% }4 n7 K  - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
% w" Z9 l" O' u# v6 l* d& I4 @
% A4 N0 ^2 R) M0 e
  两个新一代embedding模型:, L0 N5 V3 _& R. b

( z& y4 n& q; P1 `3 W  - text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
0 c) w: O3 B9 |% k5 ~  - text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
, B" A& z( o6 K! O7 e! W3 [7 a2 R  最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
; _# M; U) g, {9 Z8 G- k0 M% \
4 t- X; Q. {# x* S4 b8 _! [( |' K

: D, m& [# |  H

8 Q; g- d1 @+ f1 h2 P* @! w5 f
  GPT-4更强了,变懒bug修复
  自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。
7 c  d3 v- d. _0 x+ O: C% }
: u: v! m& s/ W) \. G
  最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。
/ {7 Q5 b, ^0 [
4 T: y! Q9 e3 x
  新模型还修复了一个影响非英文UTF-8生成的漏洞。0 n* H- L; ]  r, v; }  h
  对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。7 y% f! |8 K" t

0 S0 B; c. G; t- E  在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
+ ?2 W: g- i& K5 K" n2 }5 w. R

0 ~' ?/ k0 ~# W8 w9 H6 D7 L! Z( B6 j
  GPT-3.5-Turbo喜迎「降价增效」
  下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。' F3 ]. @+ y% {5 z1 r- l
7 a9 Q* S$ l) `- n
  在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
4 i" S5 B7 k( \/ B! Q7 ]8 e

) H( i. I. ]6 e: F8 H" {1 H  新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。
* H5 ?% d/ g0 e/ _  此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
0 s, z) G  k3 i2 \

7 A/ Q) ~  U; |+ X5 d  在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。
2 A! P# E; A4 n! C& b7 V/ L
/ F& I$ _  b% s2 k, j7 k  K. q$ ?4 H8 P- L
7 K5 w8 V  g8 o0 y# c8 o
  全新嵌入模型2连发:性能大涨价格狂降
  OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。6 ^9 N( A. O# e& g0 b# Y8 p9 A) C

4 q* Z' }' q$ u
9 H; B% p  C+ d; e0 x+ O
2 q% c4 i2 B1 g+ _
  所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。5 |1 P+ U$ G5 G- I9 ~
  通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。
8 s6 G# c8 J# V, P
8 z7 C$ K% `6 H3 H* ^0 T
  嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。( x, c( X6 `& X% S& C: v) J
  「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。) q, B$ F; [' g+ u9 k- z
9 e3 u' `+ |) f. V$ e

, A7 J0 {2 W( E  - 性能更强# m% E3 P, z; e$ s- i! u

; X# S7 A+ f0 Z! u, i$ A8 n7 X  在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。1 o" d! \$ _$ a5 H! B( e# |, ^+ D
, C! o( b! ?3 u, e! B# ^/ g0 q$ J

/ O& X9 V3 C$ R3 `  - 价格实惠. _  Y% \3 H  j" S+ m

* p- I+ u4 k# c8 ^' ~9 M; h7 u# Z/ y  text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。
6 `7 Z2 `  ^5 C: _$ Q3 Q# V; B
2 g7 z) ~/ r) J3 ~8 }/ C; u
  OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。
( V5 h/ Y, ~, b8 F4 j  e9 L. A# D- R
. Z2 M0 W4 g8 _- r
「大」文本嵌入模型:text-embedding-3-large0 i0 ?. c. ~# Y+ Q; F; H
, J; P3 F- d) L( Q
  text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
& J+ h* f$ S0 s6 |% {0 C  text-embedding-3-large是OpenAI目前性能最强的模型——' }; o0 _  m+ ^( z

0 T3 K0 u+ M6 |! U$ _9 {& a  与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
: @; T  c9 U3 |  R" S  ?
* J8 R7 \( w. n) K) q3 S
# N. \8 K' [) f5 H$ ^( A

* v3 Y- S' I/ x. y1 \8 \: G  text-embedding-3-large的价格定为0.00013美元/1k token。% c, U4 r4 A  g9 P

" J) |. {% S8 @/ J& Q& C3 R6 r
: c% _9 d0 A: a& v# E7 _. W

: W5 f& z/ M" T: R3 b) N: k) n7 l: `9 ^4 ^' a* h' R
  灵活调整嵌入向量" y7 w( i, u9 I( B9 `# ]4 |
4 ^& P* ~; O: W; h! N( f1 i
  相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。# o9 W- Y3 d* l3 S

+ v  h2 ]" g7 o, H& M6 q  OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。; i+ Z  r0 W* j
  具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。: R6 v$ r$ z* V0 b% v- O8 H

9 t5 B/ U, s0 ^# Q  例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
1 `$ S4 ?. @  _7 _8 P  \& Q  这种做法极大地增加了使用上的灵活性。9 s! s* o( g+ ]5 c+ r& E
7 I7 C, Q# L( s/ t2 T& x$ K
  比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。
$ E5 j" D6 t5 g8 p' R% T- j- w  I+ Z9 O7 f
! x: ~0 ~1 b0 B" I

$ N7 Q, B: R, j% a$ O0 ~: w3 j- }7 u
  迄今最强的内容审核模型
  OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。8 v9 K# _$ [* p% K  M! W& s
  v) ^& ^& E3 I1 H+ c
  作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。4 Y6 G) M" C5 v1 B$ V1 u6 F
7 c9 t2 B( m/ G# Z8 C8 f5 L: a
  此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。
" J( |# l; l- h( @* s) {( T, J5 h

; ]1 Q0 T0 |$ h
API后台更新,更好的API密钥管理
  OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。+ @9 X& ]& P9 J

: V' \& ~+ Z  \& N0 |. I% V6 b3 U0 j  首先,开发者可以直接在API密钥页面设置不同的密钥权限。9 o. B5 Y$ C( K2 F" |, E0 ]
  Z- o1 Y6 V! D( L# Z
  举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
, h4 O0 b0 I4 ?6 ~7 Y  其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。  R* I$ A5 @/ ^, I

" T+ h  G$ b, N  z: a% u! ?  在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。6 G# B) Q; G. g, L/ g/ f  m$ ^
  Z9 D) G+ w7 C5 z
! T. Z8 m1 V. ^& C1 ]  r; D
+ ]* k, O# \# b
6 g( ]" z1 |) }. _$ Y
来源:新智元(公众号)
( r( T- x8 K6 x: n链接:https://mp.weixin.qq.com/s/6deJkhCniZPCMdZdy1T2Yg3 C  n  X: \5 b9 W% f
编辑:李梦瑶
2 b/ k, F* m$ D/ J# ^9 Q2 z! u
+ M% P) V3 r+ e
: \7 r: z# d3 h" O0 }3 q7 b

$ i( {4 p  q1 W# R
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表