字节跳动大模型被实习生攻击，损失超千万美元？涉事者已被辞退

2024-10-19 22:48| 发布者: 刘海明| 查看: 87| 评论: 0|来自: 数据保护官

摘要: 10月18日，多个微信群流传一则消息：“某头部大厂的大模型训练被实习生入侵，注入了破坏代码，导致其训练成果不可靠，可能需要重新训练。据称遭到入侵的代码注入了8000多张卡，带来的损失可能超过千万美元。”

综合：界面新闻、深圳晚报

10月18日，多个微信群流传一则消息：“某头部大厂的大模型训练被实习生入侵，注入了破坏代码，导致其训练成果不可靠，可能需要重新训练。据称遭到入侵的代码注入了8000多张卡，带来的损失可能超过千万美元。”

网传截图

记者从知情人士处获悉，该头部大厂为字节跳动。此事发生在今年6月，起因是某高校的博士在字节跳动商业化技术团队实习，因对团队资源分配不满，使用攻击代码破坏团队的模型训练任务。

记者向字节跳动求方面证此事，截至目前，官方未进行回应。

传闻显示，该田姓实习生利用了HF（huggingface）的漏洞，在公司的共享模型里写入破坏代码，导致模型的训练效果忽高忽低，无法产生预期的训练效果，而且AML团队无法核查原因。但传闻曝出之后，该实习生还在某微信群里辟谣称，自己发完论文后就从字节跳动离职，这个当口有另一个人钻漏洞改模型代码，把锅扣到自己头上。

记者从知情人士处了解到，字节跳动内部已经调查明确此事为田姓实习生所为。目前，该实习生已被辞退，字节跳动同时把此事同步给行业联盟和该实习生所在的学校。但这名实习生被辞退后到处“辟谣”甩锅，称是其他人所为。

但该实习生攻击的并不是豆包大模型，而是商业化技术团队的模型训练任务，影响了该技术团队的一些业务进展，但整体对公司造成的损失并没有传闻中的超过千万美元那么大。

一位技术安全专家告诉记者，HF漏洞产生肯定是单一性集中训练，此事暴露了字节跳动技术训练存在安全管理问题。公司既没做权限隔离，也没有做好共用代码的审计。正常情况下，每次大的代码变动必须做审计，无论谁做操作都有痕迹记录，一个人想动代码是不可能的。

上述技术安全专家表示，目前行业通用的做法是做三级隔离导向性部署，每一级只有镜像，每次先扫描。调用按次算、必须密钥。每一级完成后，才能进入下一级，而上一级自动删除，进行分级训练。

来源：数据保护官

链接：https://mp.weixin.qq.com/s/L6SiWHkAdz8CqucyIMTecQ

编辑：程正元

附：【关于“实习生破坏大模型训练”的事实澄清】（字节跳动）

近期有媒体称“字节跳动大模型训练被实习生攻击”，经公司内部核实，确有商业化技术团队实习生发生严重违纪行为，该实习生已被辞退。但相关报道也存在部分夸大及失实信息，特说明如下：

一、涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务，但并不影响商业化的正式项目及线上业务，也不涉及字节跳动大模型等其他业务。

二、网传“涉及8000多卡、损失上千万美元”严重夸大。

三、经核实，涉事人一直在商业化技术团队实习，并没有AILab实习经历。其社交媒体个人简介及部分媒体报道有误。

该实习生已在8月被公司辞退。公司也将其行为同步给行业联盟和所在学校，交由校方处理。

鲜花

握手

雷人

路过

鸡蛋

收藏邀请

上一篇：第10届红网“评论之星”高校推介会重庆大学站成功举办下一篇：首席商务官凯凡·萨曼普尔介绍了《波士顿环球报》如何依赖本地新闻付费手段度过难关并 ...

字节跳动大模型被实习生攻击，损失超千万美元？涉事者已被辞退

最新评论

相关分类

帐号		自动登录	找回密码
密码			实名注册