我们不清楚Sora的训练数据是如何获取的。

2024-03-19 热点资讯 关注公众号

IT之家 3 月 18 日消息,OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora,然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详,无法明确说明 Sora 的训练数据来源。

在采访中,记者直接询问 Murati 关于 Sora 训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。”

当记者追问具体来源是否包含 YouTube 视频时,Murati 竟然表示“我实际上并不确定(I'm actually not sure about that)”,并拒绝回答有关 Instagram 或 Facebook 视频是否被纳入训练集的问题。她辩称,如果这些视频是公开可用且可以使用的,那么可能会被使用,但她本人对此并不确定。

当记者询问 OpenAI 是否与其合作伙伴图片素材公司 Shutterstock 达成过数据训练方面的合作,Murati 索性拒绝继续讨论数据来源话题。

Murati 甚至回避记者关于 OpenAI 与图片素材巨头 Shutterstock 的数据合作,拒绝透露来自该平台的视频是否被用于训练 Sora。最终,她干脆中止了相关讨论,坚称数据来源“肯定是公开可用或经过许可的”,却无法给出任何具体细节。

Murati 这番闪烁其词的做法让 OpenAI 陷入尴尬境地。此前,该公司就因数据抓取行为引发广泛争议,甚至面临多起版权诉讼,其中就包括纽约时报的指控。如今,连 CTO 都无法说清其最热门模型的训练数据来源,难免让人怀疑 OpenAI 高层对该问题的重视程度。

据报道,采访结束后,Murati 私下承认了确有使用 Shutterstock 视频训练 Sora。然而,相较于网络上浩如烟海的视频,来自 Shutterstock 的素材可能只是 Sora 训练数据的一小部分。

IT之家注意到,Murati 的讳莫如深引发了网友热议。不少人认为她缺乏坦诚,质疑其对自身产品的了解程度。有人直言,CTO 竟然对如此关键的问题不知情,实在令人难以置信。

然而,也有人为 Murati 辩护,认为既然已经发布到网络,就应该允许人工智能公司加以利用。他们认为,用户既然选择公开,就应该承担被使用的风险。

Murati 的回避行为究竟是为了防止更多版权纠纷,还是真的对数据来源一无所知,我们不得而知。但可以肯定的是,公众有权质疑这些“公开可用且经过许可”的 AI 训练数据究竟来自何处。未来,含糊其辞的官方说辞恐怕难以平息人们的疑虑。


在社交媒体平台上,人们对于这种情况下没有透明度的数据处理方式引起了广泛的争议。许多人认为,这样的做法侵犯了创的权利,并可能导致更多的版权纠纷。
此外,这个问题也暴露了开放AI公司在隐私保护方面存在不足的问题。作为一家全球领先的AI科技公司,其高层应该对此问题保持高度关注和责任感。
在这种情况下,我们需要采取更严格的措施来确保我们的AI系统不会滥用用户的隐私权。例如,我们可以增加透明度,让用户知道哪些数据已经被使用,以及如何使用它们。同时,我们也需要加强监管,确保AI公司的数据处理行为符合法律法规的要求。
总的来说,尽管OpenAI的首席技术官Mira Murati的言行仍然引发了广泛的关注,但这并不意味着我们不能从中汲取教训。我们应该更加透明,尊重创的权益,同时也需要加强监管,确保AI系统的合法、合规使用。

上一篇:Counterpoint:2023年全球五大晶圆厂设备制造商营收小幅下滑,ASML拔得头筹
下一篇:不甘只做AI 应用工厂,字节跳动补课大模型
更多更酷的内容分享
猜你感兴趣
互联网巨头:如何合法地窃取您的数据以训练AI?

互联网巨头:如何合法地窃取您的数据以训练AI?

主要事件是硅谷的大公司纷纷更新服务条款,允许自己利用用户数据训练生成式AI模型。这个事件引起了用户的担忧,尤其是那些拥有大量个人内容的互联网大厂,他们尝试通过偷窃或者欺诈的方式获取用户数据来进行AI训练。这次事件凸显出大数据时代隐私保护的重要性,也提醒我们在享受便利的同时,不能忽视对个人信息安全的保护。

热点资讯 07.03
全球科技早报> Sora训练数据被指质疑。

全球科技早报> Sora训练数据被指质疑。

苹果推出MM1多模态大模型;英伟达GTC2024召开;CAR-T疗法展现治疗效果。三则新闻都强调了技术进步对于相关领域的重要性,尤其是新技术对医疗和科技创新的影响。

热点资讯 03.18
美国OpenAI首席技术官:不太确定是否用过社交媒体数据来训练Sora。

美国OpenAI首席技术官:不太确定是否用过社交媒体数据来训练Sora。

美国OpenAI首席技术官米拉·穆拉蒂在采访中被问及使用的数据类型和来源。

热点资讯 03.18
一文读懂:中国复制Sora的模型架构、参数规模、数据规模和训练成本

一文读懂:中国复制Sora的模型架构、参数规模、数据规模和训练成本

出门问问算法团队发布万字长文,解构中国如何复刻OpenAI的Sora。尽管Sora在视频生成领域实现了碾压式超越,但其技术细节并未公开。本文基于实战经验和相关文献,对Sora的技术路线进行有理有据的猜想,并探讨复刻Sora所需关注的重点。

热点资讯 03.01
朝鲜农村出行需办理通行证: 健康的上网与信息交流方式探讨

朝鲜农村出行需办理通行证: 健康的上网与信息交流方式探讨

朝鲜农村与中国的惊人相似,农民出行需具备证明文件、通行证以及家庭口粮供应制度,其中粮食分配约为每日700克。农村串门还需携带口粮,以免对邻居造成不便;女性也有类似的工作量和待遇差异。朝鲜农村仍采用农业为主的生活方式,大部分时间由政府规划,并分配给农民。

热点资讯 09.19
吉利星愿启动预售,挑战友商市场地位

吉利星愿启动预售,挑战友商市场地位

吉利新推出的紧凑型纯电代步车星愿,外观圆润可爱,内饰精致科技感强。该车预计售价在7.88万至10.78万之间,提供高低功率两种电机供消费者选择。电池容量分别为30.12kWh和40.16kWh,最大续航里程分别为310km和410km。

热点资讯 09.19
成功转战LNG赛场!Yagao图受宠若惊,韩国队质疑替补选手人选

或者

‘LNG世界赛租借Yagao图’引发争议:韩国官方对替补选手不满

成功转战LNG赛场!Yagao图受宠若惊,韩国队质疑替补选手人选 或者 ‘LNG世界赛租借Yagao图’引发争议:韩国官方对替补选手不满

事件是因中单选手scout合同问题被限制出境,无法参加S14世界赛,无奈之下转向其他战队租借中单选手Yagao。此事引发了Lck玩家的不满,并称Lpl赛区在世界赛前轻松租借选手的规则违背公平竞争原则。拳头官方则指出在8月16日提交参赛名额后,允许队伍组建临时超级战队,违反规则。对此,有玩家调侃称其可能为要给scout办退役仪式做铺垫。

热点资讯 09.19
中国创造,全球首台人体哈勃望远镜成功制造

中国创造,全球首台人体哈勃望远镜成功制造

"人体哈勃望远镜"和"探索者"全身PET-CT是中国自主研发的世界首款全球顶尖的医疗设备,能实时动态监测药物在人体全身代谢分布,具备极高的灵敏度和快速扫描能力。中国高端医学影像设备已在国内外市场上占据主导地位,并走出国门,展现出中国高质量发展的优秀成绩。

热点资讯 09.19
斗罗大陆:第67集预告被大量用户质疑和怒斥,其中的关键内容为何被删除?

斗罗大陆:第67集预告被大量用户质疑和怒斥,其中的关键内容为何被删除?

斗罗大陆第二部第67集预告遭大量网友炮轰,原因是该预告中出现了张乐萱这个名字,引发了大量网友不满。其中一名大美女张乐萱在预告中并未出现,引起了很多网友不满。对于导演的行为,有人认为其不分主次,甚至将张乐萱这样重要的人物删掉。另一些人则认为,虽然新一代史莱克七怪即将重聚,但他们还未与寒若若、楚倾天等新人交手,因此期待他们的精彩表现。最后,导演选择了删掉新一代史莱克七怪首战,以避免了过于激烈的打斗场面。

热点资讯 09.18
中国在绿色能源领域已成为全球领导者

中国在绿色能源领域已成为全球领导者

长57%,而欧洲仅为11%,美国只有4%。 在这篇文章中,《纽约时报》专栏作家大卫·华莱士-威尔斯批评了美国企图通过推行一系列绿色科技关税来阻挡中国在绿色能源转型方面的努力,认为这标志着美国在全球绿色转型中全面失败。文章指出,尽管中国在过去几年取得了许多显著的绿色科技突破,但它与欧洲、日本等发达国家相比,仍处于领先地位。同时,大卫也警告说,如果不采取行动,未来的世界将变得越来越不利于环保和可持续发展。

热点资讯 09.18
传字节跳动拟在2026前量产两款自研AI芯片,将由台积电代工

传字节跳动拟在2026前量产两款自研AI芯片,将由台积电代工

字节跳动计划自研AI芯片,以便在中国AI聊天机器人市场领先竞争对手,同时节省数十亿美元的成本,降低成本并增强供应链的多元化和安全性。字节跳动此前与博通合作开发AI芯片,但由于需求太大,每个客户都想争取最多出货量,因此字节跳动最终决定自研AI芯片。

热点资讯 09.18
官员三天穿同一套衣服引发争议:有损公职形象?

同一件衣服三日穿出,官员形象何去何从?|新京报评论

官员三天穿同一套衣服引发争议:有损公职形象? 同一件衣服三日穿出,官员形象何去何从?|新京报评论

浙江省应急管理厅办公室副主任楼卿磊出镜直播期间着装不整洁被质疑有损形象。其本人表示是因为任务紧急而无法换衣服。评论应尊重公务员的工作态度和职责,避免以衣着和外貌来评价公务员形象。

热点资讯 09.18
美联储降息预期:明天凌晨,你会看到什么?

美联储降息预期:明天凌晨,你会看到什么?

美联储货币政策会议将于17日至18日举行,市场关注降息25个基点还是50个基点。 由于全球经济形势变化,美联储下一步的政策走向备受瞩目。 8月份美国核心CPI同比增长3.2%,超出市场预期,削弱了市场对美联储再次降息的预期。 民生证券首席经济学家 陶川认为,尽管目前市场预计美联储下周会开始其降息周期,但仍存在两种观点:一种认为应该降息25个基点,另一种则认为应该降息50个基点。 美联储货币政策会议即将召开,投资者将密切关注此次会议的结果及其对金融市场的影响。同时,还将关注其他相关国家的货币政策调整。

热点资讯 09.18
直播间的高额月饼利润:单个成本仅需5元,额外主播佣金高达20%

直播间的高额月饼利润:单个成本仅需5元,额外主播佣金高达20%

网红主播小杨哥带货的“香港美诚月饼”陷入虚假宣传风波,引发消费者不满。该月饼并非产自香港,并且标注有黑松露成分,但价格却远超正常售价。广州市花都区市场监管局表示涉事企业为广州市美诚食品有限公司、广州市美诚食品科技有限公司以及香港美诚食品集团有限公司。部分月饼产品已被下架。

热点资讯 09.18