我们不清楚Sora的训练数据是如何获取的。

2024-03-19 热点资讯关注公众号

IT之家 3 月 18 日消息，OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora，然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详，无法明确说明 Sora 的训练数据来源。

在采访中，记者直接询问 Murati 关于 Sora 训练数据来源时，她仅以含糊的官方话术搪塞：“我们使用的是公开可用数据和许可数据。”

当记者追问具体来源是否包含 YouTube 视频时，Murati 竟然表示“我实际上并不确定（I'm actually not sure about that）”，并拒绝回答有关 Instagram 或 Facebook 视频是否被纳入训练集的问题。她辩称，如果这些视频是公开可用且可以使用的，那么可能会被使用，但她本人对此并不确定。

当记者询问 OpenAI 是否与其合作伙伴图片素材公司 Shutterstock 达成过数据训练方面的合作，Murati 索性拒绝继续讨论数据来源话题。

Murati 甚至回避记者关于 OpenAI 与图片素材巨头 Shutterstock 的数据合作，拒绝透露来自该平台的视频是否被用于训练 Sora。最终，她干脆中止了相关讨论，坚称数据来源“肯定是公开可用或经过许可的”，却无法给出任何具体细节。

Murati 这番闪烁其词的做法让 OpenAI 陷入尴尬境地。此前，该公司就因数据抓取行为引发广泛争议，甚至面临多起版权诉讼，其中就包括纽约时报的指控。如今，连 CTO 都无法说清其最热门模型的训练数据来源，难免让人怀疑 OpenAI 高层对该问题的重视程度。

据报道，采访结束后，Murati 私下承认了确有使用 Shutterstock 视频训练 Sora。然而，相较于网络上浩如烟海的视频，来自 Shutterstock 的素材可能只是 Sora 训练数据的一小部分。

IT之家注意到，Murati 的讳莫如深引发了网友热议。不少人认为她缺乏坦诚，质疑其对自身产品的了解程度。有人直言，CTO 竟然对如此关键的问题不知情，实在令人难以置信。

然而，也有人为 Murati 辩护，认为既然已经发布到网络，就应该允许人工智能公司加以利用。他们认为，用户既然选择公开，就应该承担被使用的风险。

Murati 的回避行为究竟是为了防止更多版权纠纷，还是真的对数据来源一无所知，我们不得而知。但可以肯定的是，公众有权质疑这些“公开可用且经过许可”的 AI 训练数据究竟来自何处。未来，含糊其辞的官方说辞恐怕难以平息人们的疑虑。

在社交媒体平台上，人们对于这种情况下没有透明度的数据处理方式引起了广泛的争议。许多人认为，这样的做法侵犯了创的权利，并可能导致更多的版权纠纷。
此外，这个问题也暴露了开放AI公司在隐私保护方面存在不足的问题。作为一家全球领先的AI科技公司，其高层应该对此问题保持高度关注和责任感。
在这种情况下，我们需要采取更严格的措施来确保我们的AI系统不会滥用用户的隐私权。例如，我们可以增加透明度，让用户知道哪些数据已经被使用，以及如何使用它们。同时，我们也需要加强监管，确保AI公司的数据处理行为符合法律法规的要求。
总的来说，尽管OpenAI的首席技术官Mira Murati的言行仍然引发了广泛的关注，但这并不意味着我们不能从中汲取教训。我们应该更加透明，尊重创的权益，同时也需要加强监管，确保AI系统的合法、合规使用。

上一篇:Counterpoint：2023年全球五大晶圆厂设备制造商营收小幅下滑，ASML拔得头筹
下一篇:不甘只做AI 应用工厂，字节跳动补课大模型

更多更酷的内容分享

猜你感兴趣

互联网巨头：如何合法地窃取您的数据以训练AI?

主要事件是硅谷的大公司纷纷更新服务条款，允许自己利用用户数据训练生成式AI模型。这个事件引起了用户的担忧，尤其是那些拥有大量个人内容的互联网大厂，他们尝试通过偷窃或者欺诈的方式获取用户数据来进行AI训练。这次事件凸显出大数据时代隐私保护的重要性，也提醒我们在享受便利的同时，不能忽视对个人信息安全的保护。

热点资讯 07.03

全球科技早报> Sora训练数据被指质疑。

苹果推出MM1多模态大模型；英伟达GTC2024召开；CAR-T疗法展现治疗效果。三则新闻都强调了技术进步对于相关领域的重要性，尤其是新技术对医疗和科技创新的影响。

热点资讯 03.18

美国OpenAI首席技术官：不太确定是否用过社交媒体数据来训练Sora。

美国OpenAI首席技术官米拉·穆拉蒂在采访中被问及使用的数据类型和来源。

热点资讯 03.18

一文读懂：中国复制Sora的模型架构、参数规模、数据规模和训练成本

出门问问算法团队发布万字长文，解构中国如何复刻OpenAI的Sora。尽管Sora在视频生成领域实现了碾压式超越，但其技术细节并未公开。本文基于实战经验和相关文献，对Sora的技术路线进行有理有据的猜想，并探讨复刻Sora所需关注的重点。

热点资讯 03.01

宋慧乔晒照庆生，宋仲基二胎产女，一人美得惊呆众人！宋慧乔生日快乐，独享幸福时光：低调庆祝怀孕和大女儿出生，展现罕见的母爱力量！娱乐圈中的超级大美人——宋慧乔晒照庆祝生日，二胎诞女喜讯传遍全球！

宋慧乔的生日派对上，虽然已经43岁但依然风华绝代，引人注目。离婚的消息令粉丝猜测其原因，有人认为是生育观念不合。然而，现在看来，宋慧乔选择了专注于事业，而不是孩子的抚养问题。她复出演戏成功，还在国际时装周拿奖。状态非常好，生活的丰富多彩。

热点资讯 11.23

香港77岁冻龄男优庆祝生日：儿媳同框亲密照曝光

香港艺人石修迎来77岁生日，晒出年轻貌美的照片和与家人一同庆祝的照片，令人羡慕。虽然不是整生，但石修在演艺圈一直活跃，近年来更是参与了许多电视剧和电影的拍摄。尽管年龄增大，但他依然保持着良好的状态，丝毫没有油腻感，这让人感到惊讶。此外，石修与年轻女演员的合作默契十足，每次合作都呈现出了自己的风格，且没有违和感。石修的年龄变化引起了人们的好奇和讨论，他也成为了新一代的“冻龄神”，展现了魅力无边的人生态度。

热点资讯 11.23

巴基斯坦恐袭升级：中国是否能帮助肃清恐怖主义阴霾?

巴基斯坦发生多次针对中国公民和中资项目的袭击，并持续受到恐怖分子的威胁。解放军参加“勇士-8”反恐联合演习，加强了双方的战略合作。此外，巴基斯坦境内的恐怖主义活动愈演愈烈，特别是针对中国公民和中资项目的袭击呈现显著上升趋势。

热点资讯 11.23

拜登紧急指令：普京‘最后攻击’任务完成之际，政府如何应对?

美英法联合授权乌克兰使用远程武器，引发全球范围内的巨大轰动。这一决定不仅意味着冲突升级的新阶段，也可能影响未来地缘政治的走势。俄罗斯对此可能会感到不安，甚至有可能与西方国家发生对抗。而普京则考虑寻求与中国合作以增强本土防御能力。近期，绍伊古访华也被视为是俄罗斯寻求的一种新型合作关系的一部分。同时，这也被视为拜登政府有意制造麻烦的手段。在这种情况下，俄罗

热点资讯 11.23

中方关注美国在安理会的处境，呼吁对美国进行公正审判

继续进行军事干预，这与联合国安理会的初衷背道而驰。对于中国的观点，美国表示不满，认为中国政府对于安理会的问题置若罔闻，没有采取任何实际行动来解决问题。中国政府针对美国的行为，决定向联合国安理会提出4点主张：第一，必须实现立即无条件停火；第二，必须扩大加沙地带的人道援助；第三，必须制止违反国际法的单边行动；第四，必须重新落实“两国方案”。这份“讨美檄文”，直指美国为确保自己国家的利益，不顾人类道义，不断干涉他国内政，严重破坏了世界和平稳定，也将受到历史的审判。

热点资讯 11.23

Steam 2024 年秋季促销活动 11 月 28 日开启！丰富优惠等你来抢购！

Steam 2024 年秋季游戏促销即将于 11 月 28 日凌晨 2:00 开启至 12 月 5 日凌晨 2:00 ，将有多款游戏迎来折扣优惠。这些游戏包括《灰区战争》、《高达创坏者》、《霍格沃茨之遗》、《小丑牌》等。

热点资讯 11.23

上海玩家耗时1814天打造一款独特游戏，成功打破了传统网络游戏模式的桎梏。大家称其为‘疯狂’的游戏，究竟有何魅力？让我们一探究竟。

叠纸创始人和CEO兼游戏制作人的姚润昊在接受采访时表示，《无限暖暖》的研发难度超过了以往的新游项目。这部24分钟的短片通过幕后纪录片的形式展现了这款年度大作的研发过程，包括研发团队面临的各种困难和挑战，以及他们如何克服这些困难并最终成功发布的游戏。这部纪录片让观众有机会了解《无限暖暖》的研发历程，并对这款游戏充满了期待。

热点资讯 11.23

小胖不打，狼队已没戏：AG的决定无可替代

是减少了一定的物理伤害，另一个是将回血速度提高20%。总的来说，这一系列英雄调整旨在提升辅助英雄在比赛中的表现，同时加强物理系英雄的输出能力。尽管王昭君的被动被削弱，但这并不意味着她的实力下降，而是需要更多的时间去适应新的机制和调整自己的战术打法。

热点资讯 11.23

《完蛋！我被美女包围了！》12月4日登陆WeGame，海量内容等你探索！ 12月4日，《完蛋！我被美女包围了！》登陆WeGame，探索无尽的网页美少女盛宴！

"完蛋！我被美女包围了！”将在WeGame上线，并对玩家体验方便。《完蛋！我被美女包围了！》是一部模拟恋爱全动态真人互动影像作品，游戏的成功是对细分娱乐需求体验的深度挖掘和创新尝试的结果。

热点资讯 11.23

五十铃全新2.2升发动机，实现高效启程与持久续航提升 56%增扭与10%燃油效率的升级体验，让五十铃2.2升发动机焕然一新五十铃新款2.2升发动机，大幅度提升了动力和燃油经济性

五十铃汽车推出全新D-Max皮卡和MU-X SUV搭载的2.2升“MaxForce”涡轮增压柴油发动机，功率提高56%，燃油效率提升10%，达到符合全球排放法规的要求。这款发动机使用了低摩擦活塞技术，有助于五十铃满足日益严格的排放法规，目前官方还未公布更多细节。

热点资讯 11.23