《纽约时报》更新条款 禁止使用其内容训练人工智能模型
【资料图】
凤凰网科技讯《AI前哨》 北京时间8月16日消息,面对AI技术的大规模采用,传统媒体出手了。《纽约时报》日前更新了其服务条款,禁止未经许可将其内容用于训练人工智能系统。通过采取预防措施,阻止其内容被用来训练人工智能模型。
据悉,《纽约时报》8月3日更新其服务条款,禁止将其内容(包括文本、照片、图像、音频/视频剪辑、“外观和感觉”、元数据或编译)用于开发“任何软件程序,包括但不限于训练机器学习或人工智能(AI)系统”。
更新的条款还明确指出,未经书面许可,不能使用网站爬虫类自动化工具访问、收集平台发布的内容。纽约时报表示,拒绝遵守这些新限制可能会导致罚款或处罚。
尽管在政策中引入了新规,但《纽约时报》似乎没有对其robots.txt文件进行任何更改,该文件会通知搜索引擎爬虫可以访问哪些URL。
此举或许是对谷歌最近更新的隐私政策的回应。该政策披露,搜索巨头可能会从网络上收集公共数据来训练其各种人工智能服务,如Bard或Cloud AI。为OpenAI ChatGPT等人工智能服务提供“动力”的许多大型语言模型都是在庞大的数据集上训练出来的,而这些数据集可能包含未经原创作者许可从网络上搜刮来的受版权保护或其他保护的资料。
尽管如此,《纽约时报》也在今年2月与谷歌签署了一项价值1亿美元的协议,允许这家搜索巨头在未来三年内在其《纽约时报》的一些平台上发布内容。该出版物称,两家公司将在内容分发、订阅、营销、广告和实验工具方面展开合作,因此《纽约时报》服务条款的修改有可能是针对OpenAI或微软等其他公司的。
据Semafor此前报道,《纽约时报》已经退出了一个试图与科技公司就人工智能训练数据进行联合谈判的媒体联盟。这意味着如果它真的与公司达成交易,可能更多的是根据具体情况而定。
OpenAI最近宣布,网站运营商现在可以阻止其GPTBot网络爬虫对其网站进行抓取。微软也在自己的条款和条件中增加了一些新的限制,禁止人们使用其人工智能产品“创建、训练或改进(直接或间接)任何其他人工智能服务”,同时禁止用户从其人工智能工具中搜刮或以其他方式提取数据。
本月早些时候,包括美联社和欧洲出版商理事会在内的多家新闻机构签署了一封公开信,呼吁全球立法者制定相关规则,要求训练数据集透明,并在使用数据进行训练前征得权利人的同意。
关键词: