全球科技早报> Sora训练数据被指质疑。

2024-03-18 热点资讯 关注公众号

每经记者:文巧    每经:兰素英

|2024年3月18日 星期一|

NO.1 苹果推出MM1多模态大模型

近日,在一篇名为MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training的论文中,苹果正式公布MM1多模态大模型研究成果。该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。它由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现最优效果,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。

点评:苹果的这一突破性技术展示了其在多模态AI领域的成果,有助于推动行业创新。

NO.2 英伟达GTC2024即将揭幕

3月18日至21日,英伟达GTC大会将在圣何塞会议中心和线上同时举行。这是英伟达每年最重要的技术发布平台之一,被业界公认为“AI风向标”。据悉,英伟达有望在大会上发布Blackwell架构及B100芯片。作为Hopper架构H200芯片的下一代产品,英伟达早已在全球超算大会上展示过B100芯片的强劲性能,在训练GPT-3 1750亿参数模型的比较中,B100芯片以喷射式的性能提升幅度碾压H100和H200芯片。此外,英伟达或将发布一系列生成式AI应用。

点评:英伟达即将发布的新技术可能会进一步巩固其在高性能计算和AI领域的市场主导地位。

NO.3 CAR-T疗法对实体瘤显示出效果

近日,两篇分别刊登于《自然-医学》和《新英格兰医学杂志》的研究结果表明,抗原嵌合受体T细胞(CAR-T)疗法在临床试验中表现出了针对实体恶性脑肿瘤——胶质母细胞瘤的治疗效果。据悉,胶质母细胞瘤是成人中最常见的脑部恶性肿瘤,即使是最好的治疗也收效甚微。过去利用免疫系统对抗该脑肿瘤的尝试均失败了,导致患者只能依靠传统药物、放疗和化疗,但平均生存率改善却不尽如人意。

点评:这一临床进展可能会开启实体瘤治疗的新篇章,对整个医疗行业产生深远影响。

NO.4 奔驰汽车工厂试点Apollo机器人

近日,奔驰宣布和仿人机器人开发商Apptronik达成协议,双方将合作探索高科技机器人Apollo,主要从事搬运、装配零部件等繁重的低技能劳动。根据双方协议,奔驰将启动试点项目,在汽车制造过程中测试Apollo仿人机器人执行各种任务的能力。奔驰称,相比较全面升级汽车生产流水线,Apollo机器人的运用可以降低员工工伤情况,自动化复杂、重复和枯燥的任务,进一步释放生产力。

点评:奔驰的这一举措可能会提高生产效率,同时减少工人的劳动强度。

NO.5 ChatGPT参数规模或被破解

近日,南加州大学研究人员使用一种方法,仅花费不到1000美元就将最新版GPT-3.5-turbo模型的参数规模破解出来。据该研究报告,研究人员破解出了未公布的GPT-3.5-turbo嵌入向量维度为4096或4608。几乎所有已知的开源大模型如Llama和Mistral,在嵌入向量维度为4096时,参数规模均为7B(70亿)。南加大研究团队指出,可以推测GPT-3.5-turbo的参数规模也在7B左右。

点评:此发现可能会促使AI领域对模型透明度和安全性的进一步探讨和改进。

NO.6 Sora训练数据被质疑

近日,OpenAI CTO Murati在接受采访时对Sora训练数据支支吾吾,让Sora陷入版权争议。当记者问及Sora是用什么数据训练以及是否用到YouTube、Facebook和Instagram上的视频时, Murati对此语焉不详,称不太确定,并表示不会详细透露关于使用数据的细节,但强调该公司使用的是公开可用的以及经过许可的数据。此前,OpenAI已频繁陷入版权诉讼。去年年底,《纽约时报》已向OpenAI及微软提起侵犯版权诉讼,指控二者未经许可使用其数百万篇文章以训练模型。

点评:这可能影响OpenAI在AI领域的声誉,并加剧版权诉讼风险。


结论:
Apple发布的MM1多模态大模型显示了其在多模态AI领域的成果,有助于推动行业创新。而GPU大会的即将到来将带来一系列新技术,包括英伟达的Blackwell架构及B100芯片,以及Car-T疗法等。这些技术创新可能会改变医疗行业的面貌,提高生产效率并减轻工人劳动强度。然而,ChatGPT参数规模的破解则引发了一定的社会关注,可能导致AI领域的透明度和安全性的问题。另外,OpenAI在Sora训练数据上的行为引发了版权争议,可能会影响其在AI领域的声誉。
建议:
对于苹果来说,继续投入研发,不断推出更先进的AI技术和解决方案,可以保持其在行业的领导地位。对于英伟达来说,应尽快发布其备受期待的B100芯片,以保持其在高性能计算和AI领域的市场主导地位。对于奔驰和OpenAI来说,应积极应对人工智能伦理和社会挑战,确保AI技术的安全性和公平性。对于Sora训练数据的使用方来说,应尊重知识产权,遵守相关法规。

上一篇:突发:马斯克Grok开源!
下一篇:港媒:中国像变形金刚,变招拆招终逆袭
更多更酷的内容分享
猜你感兴趣
我们不清楚Sora的训练数据是如何获取的。

我们不清楚Sora的训练数据是如何获取的。

OpenAI 最近推出的情感分析工具“Sora”后,其首席技术官(Mira Murati)未能详细解释Sora的训练数据来源,而只是含糊地声称使用了公开可用和许可的数据。然而,当记者追问Instagram和Facebook等社交平台上的视频时,她表示不确定这些内容是否会加入到训练集中。此外,OpenAI并未与其合作伙伴如Shutterstock达成过数据训练方面的合作。在接受采访时,Murati还回避了关于OpenAI与Shutterstock的合作,称数据来源肯定公开可用或经过许可。最后,她在采访结束后承认了确有使用Shutterstock的素材训练Sora,但相比于网络上浩如烟海的视频内容,来自Shutterstock的内容可能是Sora训练数据的一部分。这一做法让OpenAI陷入了尴尬境地,因为在此之前,该公司的数据抓取行为引发了广泛争议,并导致版权诉讼。如今,虽然 Murati承认了确实使用了Shutterstock的视频,但仍未提供具体细节。

热点资讯 03.19
全球科技早参携手Sora进军好莱坞。

全球科技早参携手Sora进军好莱坞。

2024年3月25日,OpenAI计划在好莱坞与影视公司合作,推动人工智能技术在娱乐行业的应用;英国科学家正在研发肺癌疫苗,有望降低肺癌发病率;苹果公司与百度商谈AI合作,中国或受益;Stability AI CEO辞职,导致公司面临困境。

热点资讯 03.25
美国OpenAI首席技术官:不太确定是否用过社交媒体数据来训练Sora。

美国OpenAI首席技术官:不太确定是否用过社交媒体数据来训练Sora。

美国OpenAI首席技术官米拉·穆拉蒂在采访中被问及使用的数据类型和来源。

热点资讯 03.18
一文读懂:中国复制Sora的模型架构、参数规模、数据规模和训练成本

一文读懂:中国复制Sora的模型架构、参数规模、数据规模和训练成本

出门问问算法团队发布万字长文,解构中国如何复刻OpenAI的Sora。尽管Sora在视频生成领域实现了碾压式超越,但其技术细节并未公开。本文基于实战经验和相关文献,对Sora的技术路线进行有理有据的猜想,并探讨复刻Sora所需关注的重点。

热点资讯 03.01
东方甄选创始人董宇辉今年或将陷入口碑危机:丈母娘是否被冤枉?

东方甄选创始人董宇辉今年或将陷入口碑危机:丈母娘是否被冤枉?

今年初,董宇辉成为东方甄选最高薪酬雇员之一。他在2024财年年度收益高达3.41亿港元,包括年薪、奖金、期权和新公司分润。自7月25日分手后,他自立门户已55天。但近日舆论场对其进行猛烈批评,被指责“没有文化”,并有人称对其进行了“绞杀”。在此期间,他面临各种商业挑战,如稳住人设、守住口碑和带领“与辉同行”前行等。目前,他的抖音账号粉丝数量超过51.7万,“与辉同行”账号粉丝数超过165.7万,显示出良好的发展势头。尽管如此,东方甄选主账号却掉了24.3万粉丝,这无疑给与辉同行带来了竞争压力。在完成一系列直播带货数据后,于近日新增了一家名为“与辉同行”的品牌公司,实现了业绩增长。与辉同行目前的销售额和粉丝数量均超过了东方甄选,与竞争对手相比有着明显优势。在未来的发展中,他还将继续努力稳定形象,提升口碑,并带领“与辉同行”走向更广阔的舞台。

热点资讯 09.19
科沃斯:过去26年的逆袭之路——如何成为中国及全球的领先智能扫地机器人制造商

科沃斯:过去26年的逆袭之路——如何成为中国及全球的领先智能扫地机器人制造商

科沃斯推出全球首款恒压活水洗地机器人地宝X8 PRO PLUS,打破传统洗地模式。此款产品采用滚筒式结构,通过内置恒压系统提供持续的水源,解决了高清洁度和长寿命的问题。此外,它还配备高性能多维视觉模组和业内首个扫地机器人自研大语言模型,实现了智能交互和自主避障,为用户提供便捷高效的生活体验。这一创新突破标志着科沃斯在扫地机器人领域的领先地位,同时也引领了行业的未来发展方向。

热点资讯 09.19
从大小杨到曾志伟:网站编辑成长历程与自我评价

从大小杨到曾志伟:网站编辑成长历程与自我评价

曾志伟率领公司员工全力支持大小杨哥开设的分公司,并为其捧场,以期借此打开新的市场局面。其背后其实是一场互帮互助的好事。曾志伟的入场既是为了捞取后者的人气,也是为了扩张公司的影响力。最终,被挖墙角的不仅是大小杨哥所在的分公司,还有曾经在其中大放异彩的明星们。

热点资讯 09.19
梦幻西游中西栅黑的绰号-麻狼蹲着尿尿与七星地煞奖励2级神秘石

梦幻西游中西栅黑的绰号-麻狼蹲着尿尿与七星地煞奖励2级神秘石

黑总改名为“麻狼蹲着尿尿”,西栅老街黑总的160法暴神链号已被转会至超级联赛。 内容总结:黑总改名成“麻狼蹲着尿尿”,黑总的新号已在超级联赛报名中。

热点资讯 09.19
深一度:深度解读手机通信技术——寻找寻呼机的历史与现实威胁

深一度:深度解读手机通信技术——寻找寻呼机的历史与现实威胁

黎巴嫩发生多个区域的无线通信设备爆炸事件,伤亡人数超过4000人,死亡人数增多至11人。爆炸可能是由装置故障、电池过热等原因引发。目前,真主党方面怀疑是有人通过传呼机发送恶意信号或指令导致电池过热引发爆炸。该情况引起了外交与安全部门的高度关注,目前尚不清楚爆炸的具体原因。

热点资讯 09.19
梦幻西游:150四蓝字扇子与120第一3伤害戒指,价值远超预期的32万交易揭示

梦幻西游:150四蓝字扇子与120第一3伤害戒指,价值远超预期的32万交易揭示

这位热爱游戏的老玩家在鉴定了一把蓝字扇子后被震惊,发现竟然有疾风荡魄、珍宝、绝杀和必中四种蓝字,对此感到十分兴奋。同时,他也发现了新出的80级超简易戒指具有双速度和敏攻双属性,并且其价格预计会受到市场需求的影响。中秋节当天,一位狗托玩家炸出了11技能的谛听,他立即通过传音方式表达了自己的快乐心情,并成功以32.5万的价格售出了该戒指。

热点资讯 09.19
感受新款iPhone 16系列与手表耳机的细微差别:手机真机与图片观感大不相同

感受新款iPhone 16系列与手表耳机的细微差别:手机真机与图片观感大不相同

样触发拍照模式。对于第三方品牌来说,虽然苹果在智能硬件市场一直具有强大的影响力,但是在智能设备的设计与创新方面却始终表现得相对较弱。此次发布的全系新产品中,消费者可以看到大量模仿自家产品的元素,这也是为何众多科技媒体都将此次发布会称为"战场上的传统秀"。 这次苹果发布会,无论是新品还是之前的老款产品,都被展示得各有特色,而且在很多细节之处都有着独特的设计感。比如iPhone 16系列的新配色方案,既没有了上一代的简洁清新,也没有牺牲细节美感,而是通过色彩的对比使得整体更加活泼明亮。而这些变化,在保证外观美观的同时,也为用户带来了更好的视觉体验。 此外,苹果的全新AR技术也在发布会上得到了深度展示。通过全新的眼镜式AR设备,用户可以在家中就能体验到前所未有的沉浸式体验。这种设备不仅能够提供丰富的视觉信息,还可以让用户参与到游戏或者娱乐活动中去,大大提升了用户的参与感和乐趣。 总的来说,苹果发布的新品及新技术都展现了其强大的创新能力,并且在细节之处充满了创新设计。这对于科技行业来说无疑是一个好消息,也是消费者期待已久的表现。

热点资讯 09.19
朝鲜农村出行需办理通行证: 健康的上网与信息交流方式探讨

朝鲜农村出行需办理通行证: 健康的上网与信息交流方式探讨

朝鲜农村与中国的惊人相似,农民出行需具备证明文件、通行证以及家庭口粮供应制度,其中粮食分配约为每日700克。农村串门还需携带口粮,以免对邻居造成不便;女性也有类似的工作量和待遇差异。朝鲜农村仍采用农业为主的生活方式,大部分时间由政府规划,并分配给农民。

热点资讯 09.19
吉利星愿启动预售,挑战友商市场地位

吉利星愿启动预售,挑战友商市场地位

吉利新推出的紧凑型纯电代步车星愿,外观圆润可爱,内饰精致科技感强。该车预计售价在7.88万至10.78万之间,提供高低功率两种电机供消费者选择。电池容量分别为30.12kWh和40.16kWh,最大续航里程分别为310km和410km。

热点资讯 09.19
成功转战LNG赛场!Yagao图受宠若惊,韩国队质疑替补选手人选

或者

‘LNG世界赛租借Yagao图’引发争议:韩国官方对替补选手不满

成功转战LNG赛场!Yagao图受宠若惊,韩国队质疑替补选手人选 或者 ‘LNG世界赛租借Yagao图’引发争议:韩国官方对替补选手不满

事件是因中单选手scout合同问题被限制出境,无法参加S14世界赛,无奈之下转向其他战队租借中单选手Yagao。此事引发了Lck玩家的不满,并称Lpl赛区在世界赛前轻松租借选手的规则违背公平竞争原则。拳头官方则指出在8月16日提交参赛名额后,允许队伍组建临时超级战队,违反规则。对此,有玩家调侃称其可能为要给scout办退役仪式做铺垫。

热点资讯 09.19