字节自研大模型,却因用ChatGPT被封号惹争议?官方回应了没想到,字节的大模型项目是被这样曝光的。上周末,有外媒报道称,字节跳动在使用 OpenAI 技术开发自有...

贴文 2个月前
1.1K 0

字节自研大模型,却因用ChatGPT被封号惹争议?官方回应了

没想到,字节的大模型项目是被这样曝光的。

上周末,有外媒报道称,字节跳动在使用 OpenAI 技术开发自有大语言模型时,因违反 OpenAI 服务条款从而遭账号禁用。

据 The Verge 报道,字节跳动内部正在研发的大语言模型项目名为「种子计划」(Project Seed)。

由于训练大模型需要大量问答知识,该项目被曝出一直在秘密使用 OpenAI 的技术来充实数据集。

在大模型领域,利用其他 AI 生成的内容用于训练的「取巧」行为虽然并不少见,但经常会被认为是一种超出底线的行为。在 ChatGPT 上,滥用 AI 生成的数据直接违反了 OpenAI 的服务条款,其规定其模型输出不能用于「开发任何与我们的产品和服务竞争的人工智能模型」。

在 11 月 14 日 OpenAI 对于 ChatGPT、DALL・E 的条款更新中还规定了用户:

不得进行逆向工程、反编译或参与模型提取或窃取,包括模型和系统;

不得以自动或程序的方式提取生成内容;

不得把 ChatGPT 生成的内容伪装成人类生产的内容。

OpenAI 对于违规用户的处理办法就是在通知后终止服务。

完整协议:openai.com/policies/business-terms

那么,字节跳动「种子计划」的具体内容以及如何被怀疑违反 OpenAI 使用条款的呢?

根据 The Verge 获得的内部文件消息,字节跳动更多是在「种子计划」的早期使用 OpenAI 的技术,并在大约几个月前指示该团队在模型开发的任何阶段停止使用 GPT 生成的文本。大约同一时期,字节跳动发布了自有 AI 大模型豆包(Doubao)。

相关员工非常清楚自身的行为,并讨论过如何通过「数据脱敏」方式来进行规避。不过他们仍然经常达到 OpenAI API 的最大访问上限。

当地时间周五,OpenAI表示,字节跳动的账户已被暂停使用。

OpenAI 发言人 Niko Felix 在给 The Verge 的一份声明中表示,「所有 API 客户都必须遵守 OpenAI 的使用条款,以确保我们的技术得到恰当地使用。虽然字节跳动对我们 API 的使用量很少,但在进一步调查的同时,我们已经暂停他们的账户。如果最终发现字节跳动的使用不符合政策,则将要求他们进行必要的更改或终止他们的账户。」

字节跳动发言人 Jodi Seth 做出了回应,否认公司有任何不当行为,并澄清获得了使用 GPT API 的权限。 网页链接

暂无评论

暂无评论...