在数字时代的激烈竞争中,AI大模型成为科技公司争夺先机的关键。然而,最近一则关于字节跳动的报道揭示了AI大模型开发的背后隐秘故事。本文将深入探讨字节跳动的「种子计划」(Project Seed),以及其在使用OpenAI技术开发自有大语言模型过程中所遭遇的困境。
项目细节
字节跳动内部孕育的「种子计划」是一项旨在打造强大语言模型的项目。然而,这个看似光鲜的计划却因为使用OpenAI技术的方式引发了争议。
违规行为曝光
根据The Verge的报道,字节跳动的团队在项目早期一直在秘密使用OpenAI技术,尽管几个月前OpenAI已经明确表示禁止使用其技术用于竞争性AI模型的开发。具体而言,字节跳动的团队违反了OpenAI的服务条款,该条款规定模型输出不能用于「开发任何与我们的产品和服务竞争的人工智能模型」。
OpenAI的回应
OpenAI对于违规行为的回应是暂停字节跳动的账户。Niko Felix,OpenAI的发言人表示,「所有API客户都必须遵守OpenAI的使用条款,以确保我们的技术得到恰当地使用。虽然字节跳动对我们API的使用量很少,但在进一步调查的同时,我们已经暂停了他们的账户。如果最终发现字节跳动的使用不符合政策,则将要求他们进行必要的更改或终止他们的账户。」
公司回应与澄清
字节跳动发言人Jodi Seth则对外澄清了公司的立场,否认公司有任何不当行为,并强调获得了使用GPT API的权限。她表示,「字节跳动已获得微软授权,可以使用GPT API。GPT生成的数据只在种子计划早期开发中用来注释模型,并已于今年年中从字节跳动的训练数据中移除了。我们使用GPT来支持非中国市场的产品和功能,而在中国市场使用我们自研的模型来支持豆包。」
公司内部行动
字节跳动相关负责人对于使用OpenAI服务的情况进行了详细的介绍:
在年初进行大模型初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中,但这种做法已在4月份停止。
公司内部要求不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。
在9月份进行了进一步的检查,采取措施进一步保证对GPT的API调用符合规范要求。
未来几天将再次全面检查,以确保严格遵守相关服务的使用条款。