Anthropic再遭侵权诉讼,被指利用盗版作品训练大模型
·三位作者称美国人工智能初创公司Anthropic使用他们以及其他人的盗版作品来训练大模型。该诉讼要求赔偿金额不详的经济损失,并要求永久阻止Anthropic滥用作者的作品。
美国人工智能初创公司Anthropic在美国加州联邦法院被三位作者提起集体诉讼,三位作者称Anthropic滥用他们的书籍和其他数十万本书来训练其人工智能聊天机器人Claude。
据路透社当地时间8月20日报道,作家和记者安德里亚·巴茨(Andrea Bartz)、查尔斯·格雷伯(Charles Graeber)和柯克·华莱士·约翰逊(Kirk Wallace Johnson)周一提起诉讼,称Anthropic公司使用他们以及其他人的盗版作品来教Claude对人类的提示做出反应。
作者在诉状中表示,Anthropic“通过窃取数十万本受版权保护的书籍,建立了数十亿美元的业务。”根据诉状,这些作者的作品被收录在Anthropic用来训练Claude的盗版书籍数据集中。“Anthropic下载了原告作品的已知盗版版本并复制,将这些盗版版本输入其模型。”该诉讼要求赔偿金额不详的经济损失,并要求永久阻止Anthropic滥用作者的作品。
Anthropic一位发言人周二表示,该公司正在评估诉讼,但以未决诉讼为由拒绝进一步置评。作者的律师也拒绝置评。
被视为OpenAI头号竞争对手的Anthropic由OpenAI前员工于2021年创立。Anthropic曾获得亚马逊、谷歌和前加密货币亿万富翁萨姆·班克曼-弗里德(Sam Bankman-Fried)等资金支持,今年3月发布大模型Claude 3系列,6月推出人工智能模型Claude 3.5 Sonnet。
美国人工智能初创公司Anthropic推出 Claude 3.5 Sonnet AI模型。视觉中国 资料图
此次纠纷并非Anthropic首次遭遇版权诉讼。去年10月,音乐出版商起诉Anthropic滥用受版权保护的歌词来训练Claude。当时环球音乐起诉这家初创公司“系统而广泛地”侵犯了他们的歌词版权,当一名用户向Anthropic的Claude询问美国女歌手凯蒂·佩里(Katy Perry)的歌曲《Roar》的歌词时,它生成了一个“几乎完全相同的歌词副本”,侵犯了版权所有者的权利。
视觉艺术家、新闻媒体和唱片公司等版权所有者已对科技公司用他们的作品训练生成式人工智能系统提起了几起高风险诉讼。今年3月,三位小说作者起诉科技巨头英伟达,称该公司未经许可使用其受版权保护的作品来训练英伟达NeMo人工智能平台。布莱恩·基恩(Brian Keene)、阿布迪·纳泽米安(Abdi Nazemian)和斯图尔特·奥南(Stewart O’Nan) 三位作者表示,他们的作品是大约196640本书的数据集的一部分,这些书帮助训练NeMo模拟普通的书面语言。由于侵犯版权,相关数据集于去年10月被下架。
去年12月,《纽约时报》以侵犯版权为由起诉OpenAI和微软,指控这两家公司未经许可使用其数百万篇文章以训练AI模型。这是媒体机构首次提起此类诉讼。随后,新闻媒体The Intercept、Raw Story和AlterNet也加入《纽约时报》阵营,在纽约联邦法院起诉OpenAI侵犯版权,指控OpenAI滥用文章来训练其ChatGPT背后的人工智能系统。
不过,一些出版机构也在和AI初创公司建立合作。据CNBC(美国消费者新闻与商业频道)报道,今年5月,OpenAI宣布与新闻集团建立合作伙伴关系,允许OpenAI访问《华尔街日报》、《市场观察》、《巴伦周刊》、《纽约邮报》和其他出版物的当前和存档文章。今年6月,OpenAI和《时代》杂志宣布了一项“多年内容协议”,该协议将允许OpenAI访问《时代》杂志100多年历史上的当前和存档文章。在遭遇抄袭指控一个多月后,今年7月,AI搜索公司Perplexity为出版商推出了一种收入分成模式,《财富》、《时代》、《企业家》、《德克萨斯论坛报》、《明镜周刊》等率先加入了该公司的“出版商计划”。8月,OpenAI与国际期刊出版集团Condé Nast宣布合作,其聊天机器人ChatGPT和AI搜索工具SearchGPT将展示《Vogue》、《纽约客》、《GQ》等的内容。