我们不清楚Sora的训练数据是如何获取的。

2024-03-19 热点资讯 关注公众号

IT之家 3 月 18 日消息,OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora,然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详,无法明确说明 Sora 的训练数据来源。

在采访中,记者直接询问 Murati 关于 Sora 训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。”

当记者追问具体来源是否包含 YouTube 视频时,Murati 竟然表示“我实际上并不确定(I'm actually not sure about that)”,并拒绝回答有关 Instagram 或 Facebook 视频是否被纳入训练集的问题。她辩称,如果这些视频是公开可用且可以使用的,那么可能会被使用,但她本人对此并不确定。

当记者询问 OpenAI 是否与其合作伙伴图片素材公司 Shutterstock 达成过数据训练方面的合作,Murati 索性拒绝继续讨论数据来源话题。

Murati 甚至回避记者关于 OpenAI 与图片素材巨头 Shutterstock 的数据合作,拒绝透露来自该平台的视频是否被用于训练 Sora。最终,她干脆中止了相关讨论,坚称数据来源“肯定是公开可用或经过许可的”,却无法给出任何具体细节。

Murati 这番闪烁其词的做法让 OpenAI 陷入尴尬境地。此前,该公司就因数据抓取行为引发广泛争议,甚至面临多起版权诉讼,其中就包括纽约时报的指控。如今,连 CTO 都无法说清其最热门模型的训练数据来源,难免让人怀疑 OpenAI 高层对该问题的重视程度。

据报道,采访结束后,Murati 私下承认了确有使用 Shutterstock 视频训练 Sora。然而,相较于网络上浩如烟海的视频,来自 Shutterstock 的素材可能只是 Sora 训练数据的一小部分。

IT之家注意到,Murati 的讳莫如深引发了网友热议。不少人认为她缺乏坦诚,质疑其对自身产品的了解程度。有人直言,CTO 竟然对如此关键的问题不知情,实在令人难以置信。

然而,也有人为 Murati 辩护,认为既然已经发布到网络,就应该允许人工智能公司加以利用。他们认为,用户既然选择公开,就应该承担被使用的风险。

Murati 的回避行为究竟是为了防止更多版权纠纷,还是真的对数据来源一无所知,我们不得而知。但可以肯定的是,公众有权质疑这些“公开可用且经过许可”的 AI 训练数据究竟来自何处。未来,含糊其辞的官方说辞恐怕难以平息人们的疑虑。


在社交媒体平台上,人们对于这种情况下没有透明度的数据处理方式引起了广泛的争议。许多人认为,这样的做法侵犯了创的权利,并可能导致更多的版权纠纷。
此外,这个问题也暴露了开放AI公司在隐私保护方面存在不足的问题。作为一家全球领先的AI科技公司,其高层应该对此问题保持高度关注和责任感。
在这种情况下,我们需要采取更严格的措施来确保我们的AI系统不会滥用用户的隐私权。例如,我们可以增加透明度,让用户知道哪些数据已经被使用,以及如何使用它们。同时,我们也需要加强监管,确保AI公司的数据处理行为符合法律法规的要求。
总的来说,尽管OpenAI的首席技术官Mira Murati的言行仍然引发了广泛的关注,但这并不意味着我们不能从中汲取教训。我们应该更加透明,尊重创的权益,同时也需要加强监管,确保AI系统的合法、合规使用。

上一篇:Counterpoint:2023年全球五大晶圆厂设备制造商营收小幅下滑,ASML拔得头筹
下一篇:不甘只做AI 应用工厂,字节跳动补课大模型
更多更酷的内容分享
猜你感兴趣
互联网巨头:如何合法地窃取您的数据以训练AI?

互联网巨头:如何合法地窃取您的数据以训练AI?

主要事件是硅谷的大公司纷纷更新服务条款,允许自己利用用户数据训练生成式AI模型。这个事件引起了用户的担忧,尤其是那些拥有大量个人内容的互联网大厂,他们尝试通过偷窃或者欺诈的方式获取用户数据来进行AI训练。这次事件凸显出大数据时代隐私保护的重要性,也提醒我们在享受便利的同时,不能忽视对个人信息安全的保护。

热点资讯 07.03
全球科技早报> Sora训练数据被指质疑。

全球科技早报> Sora训练数据被指质疑。

苹果推出MM1多模态大模型;英伟达GTC2024召开;CAR-T疗法展现治疗效果。三则新闻都强调了技术进步对于相关领域的重要性,尤其是新技术对医疗和科技创新的影响。

热点资讯 03.18
美国OpenAI首席技术官:不太确定是否用过社交媒体数据来训练Sora。

美国OpenAI首席技术官:不太确定是否用过社交媒体数据来训练Sora。

美国OpenAI首席技术官米拉·穆拉蒂在采访中被问及使用的数据类型和来源。

热点资讯 03.18
一文读懂:中国复制Sora的模型架构、参数规模、数据规模和训练成本

一文读懂:中国复制Sora的模型架构、参数规模、数据规模和训练成本

出门问问算法团队发布万字长文,解构中国如何复刻OpenAI的Sora。尽管Sora在视频生成领域实现了碾压式超越,但其技术细节并未公开。本文基于实战经验和相关文献,对Sora的技术路线进行有理有据的猜想,并探讨复刻Sora所需关注的重点。

热点资讯 03.01
宋慧乔晒照庆生,宋仲基二胎产女,一人美得惊呆众人!

宋慧乔生日快乐,独享幸福时光:低调庆祝怀孕和大女儿出生,展现罕见的母爱力量!

娱乐圈中的超级大美人——宋慧乔晒照庆祝生日,二胎诞女喜讯传遍全球!

宋慧乔晒照庆生,宋仲基二胎产女,一人美得惊呆众人! 宋慧乔生日快乐,独享幸福时光:低调庆祝怀孕和大女儿出生,展现罕见的母爱力量! 娱乐圈中的超级大美人——宋慧乔晒照庆祝生日,二胎诞女喜讯传遍全球!

宋慧乔的生日派对上,虽然已经43岁但依然风华绝代,引人注目。离婚的消息令粉丝猜测其原因,有人认为是生育观念不合。然而,现在看来,宋慧乔选择了专注于事业,而不是孩子的抚养问题。她复出演戏成功,还在国际时装周拿奖。状态非常好,生活的丰富多彩。

热点资讯 11.23
香港77岁冻龄男优庆祝生日:儿媳同框亲密照曝光

香港77岁冻龄男优庆祝生日:儿媳同框亲密照曝光

香港艺人石修迎来77岁生日,晒出年轻貌美的照片和与家人一同庆祝的照片,令人羡慕。虽然不是整生,但石修在演艺圈一直活跃,近年来更是参与了许多电视剧和电影的拍摄。尽管年龄增大,但他依然保持着良好的状态,丝毫没有油腻感,这让人感到惊讶。此外,石修与年轻女演员的合作默契十足,每次合作都呈现出了自己的风格,且没有违和感。石修的年龄变化引起了人们的好奇和讨论,他也成为了新一代的“冻龄神”,展现了魅力无边的人生态度。

热点资讯 11.23
巴基斯坦恐袭升级:中国是否能帮助肃清恐怖主义阴霾?

巴基斯坦恐袭升级:中国是否能帮助肃清恐怖主义阴霾?

巴基斯坦发生多次针对中国公民和中资项目的袭击,并持续受到恐怖分子的威胁。解放军参加“勇士-8”反恐联合演习,加强了双方的战略合作。此外,巴基斯坦境内的恐怖主义活动愈演愈烈,特别是针对中国公民和中资项目的袭击呈现显著上升趋势。

热点资讯 11.23
拜登紧急指令:普京‘最后攻击’任务完成之际,政府如何应对?

拜登紧急指令:普京‘最后攻击’任务完成之际,政府如何应对?

美英法联合授权乌克兰使用远程武器,引发全球范围内的巨大轰动。这一决定不仅意味着冲突升级的新阶段,也可能影响未来地缘政治的走势。俄罗斯对此可能会感到不安,甚至有可能与西方国家发生对抗。而普京则考虑寻求与中国合作以增强本土防御能力。近期,绍伊古访华也被视为是俄罗斯寻求的一种新型合作关系的一部分。同时,这也被视为拜登政府有意制造麻烦的手段。在这种情况下,俄罗

热点资讯 11.23
中方关注美国在安理会的处境,呼吁对美国进行公正审判

中方关注美国在安理会的处境,呼吁对美国进行公正审判

继续进行军事干预,这与联合国安理会的初衷背道而驰。对于中国的观点,美国表示不满,认为中国政府对于安理会的问题置若罔闻,没有采取任何实际行动来解决问题。 中国政府针对美国的行为,决定向联合国安理会提出4点主张:第一,必须实现立即无条件停火;第二,必须扩大加沙地带的人道援助;第三,必须制止违反国际法的单边行动;第四,必须重新落实“两国方案”。 这份“讨美檄文”,直指美国为确保自己国家的利益,不顾人类道义,不断干涉他国内政,严重破坏了世界和平稳定,也将受到历史的审判。

热点资讯 11.23
Steam 2024 年秋季促销活动 11 月 28 日开启!丰富优惠等你来抢购!

Steam 2024 年秋季促销活动 11 月 28 日开启!丰富优惠等你来抢购!

Steam 2024 年秋季游戏促销即将于 11 月 28 日凌晨 2:00 开启至 12 月 5 日凌晨 2:00 ,将有多款游戏迎来折扣优惠。这些游戏包括《灰区战争》、《高达创坏者》、《霍格沃茨之遗》、《小丑牌》等。

热点资讯 11.23
上海玩家耗时1814天打造一款独特游戏,成功打破了传统网络游戏模式的桎梏。大家称其为‘疯狂’的游戏,究竟有何魅力?让我们一探究竟。

上海玩家耗时1814天打造一款独特游戏,成功打破了传统网络游戏模式的桎梏。大家称其为‘疯狂’的游戏,究竟有何魅力?让我们一探究竟。

叠纸创始人和CEO兼游戏制作人的姚润昊在接受采访时表示,《无限暖暖》的研发难度超过了以往的新游项目。这部24分钟的短片通过幕后纪录片的形式展现了这款年度大作的研发过程,包括研发团队面临的各种困难和挑战,以及他们如何克服这些困难并最终成功发布的游戏。这部纪录片让观众有机会了解《无限暖暖》的研发历程,并对这款游戏充满了期待。

热点资讯 11.23
小胖不打,狼队已没戏:AG的决定无可替代

小胖不打,狼队已没戏:AG的决定无可替代

是减少了一定的物理伤害,另一个是将回血速度提高20%。 总的来说,这一系列英雄调整旨在提升辅助英雄在比赛中的表现,同时加强物理系英雄的输出能力。尽管王昭君的被动被削弱,但这并不意味着她的实力下降,而是需要更多的时间去适应新的机制和调整自己的战术打法。

热点资讯 11.23
《完蛋!我被美女包围了!》12月4日登陆WeGame,海量内容等你探索!

12月4日,《完蛋!我被美女包围了!》登陆WeGame,探索无尽的网页美少女盛宴!

《完蛋!我被美女包围了!》12月4日登陆WeGame,海量内容等你探索! 12月4日,《完蛋!我被美女包围了!》登陆WeGame,探索无尽的网页美少女盛宴!

"完蛋!我被美女包围了!”将在WeGame上线,并对玩家体验方便。《完蛋!我被美女包围了!》是一部模拟恋爱全动态真人互动影像作品,游戏的成功是对细分娱乐需求体验的深度挖掘和创新尝试的结果。

热点资讯 11.23
五十铃全新2.2升发动机,实现高效启程与持久续航提升
56%增扭与10%燃油效率的升级体验,让五十铃2.2升发动机焕然一新
五十铃新款2.2升发动机,大幅度提升了动力和燃油经济性

五十铃全新2.2升发动机,实现高效启程与持久续航提升 56%增扭与10%燃油效率的升级体验,让五十铃2.2升发动机焕然一新 五十铃新款2.2升发动机,大幅度提升了动力和燃油经济性

五十铃汽车推出全新D-Max皮卡和MU-X SUV搭载的2.2升“MaxForce”涡轮增压柴油发动机,功率提高56%,燃油效率提升10%,达到符合全球排放法规的要求。这款发动机使用了低摩擦活塞技术,有助于五十铃满足日益严格的排放法规,目前官方还未公布更多细节。

热点资讯 11.23