首页 > 资讯 > 商业 > 正文
2024-05-09 07:45

Meta迫切需要数据来源来训练它的人工智能,以至于冒着版权诉讼的风险

  • 科技巨头一直在争先恐后地寻找新的数据源来训练他们的人工智能系统。
  • 我助教有限公司据《泰晤士报》报道,该公司考虑了几种获取数据的方法,包括收购西蒙与舒斯特公司。
  • 它也《纽约时报》写道,他们考虑过处理诉讼,而不是谈判许可协议。

科技巨头正在争先恐后地寻找新的数据来源,以推动人工智能军备竞赛。

据《纽约时报》报道,这个问题非常重要,以至于高管们在去年3月和4月几乎每天都在开会,讨论一个计划。

随着人工智能系统变得越来越强大,科技公司被迫更积极地寻求数据,这可能会使它们面临侵犯版权的风险。例如,有人怀疑OpenAI使用YouTube来训练其视频生成器Sora。该公司首席技术官米拉·穆拉蒂(Mira Murati)否认了这些指控。

有关的故事

据《纽约时报》报道,在meta的会议期间,一些与会者提出了收购西蒙与舒斯特出版社的想法。去年8月,私募股权公司KKR以16.2亿美元的价格收购了这家出版社。还有人建议支付10美元一本书,以获得新书的全部版权。

到会议开始时,meta已经总结了许多书籍、文章和其他在线作品。该公司在非洲雇佣了承包商,将小说和非小说类书籍的摘要捆绑在一起——其中一些包含有版权的信息。一位经理在一次会议上表示:“我们没有办法不收集这些钱。”

与会者讨论了该公司是否可以继续从可能受版权保护的来源收集数据,而无需花费时间和金钱来获得授权协议。据《纽约时报》报道,当一名律师指出盗用知识产权的“道德”问题时,他们遭到了沉默。

meta没有立即回应Business Insider的置评请求。

最终,参加会议的高管们决定以2015年美国最高法院审理的作家协会诉谷歌案为例。该法院拒绝审理此案,维持了下级法院的裁决。该法院表示,谷歌可以根据合理使用准则为谷歌图书扫描并数字化图书。据《纽约时报》报道,meta的律师表示,该公司可以按照同样的指导方针训练其人工智能系统。