全球科技早报> Sora训练数据被指质疑。

2024-03-18 热点资讯关注公众号

每经记者：文巧每经：兰素英

｜2024年3月18日星期一｜

NO.1 苹果推出MM1多模态大模型

近日，在一篇名为MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training的论文中，苹果正式公布MM1多模态大模型研究成果。该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。它由密集模型和混合专家（MoE）变体组成，不仅在预训练指标中实现最优效果，在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。

点评：苹果的这一突破性技术展示了其在多模态AI领域的成果，有助于推动行业创新。

NO.2 英伟达GTC2024即将揭幕

3月18日至21日，英伟达GTC大会将在圣何塞会议中心和线上同时举行。这是英伟达每年最重要的技术发布平台之一，被业界公认为“AI风向标”。据悉，英伟达有望在大会上发布Blackwell架构及B100芯片。作为Hopper架构H200芯片的下一代产品，英伟达早已在全球超算大会上展示过B100芯片的强劲性能，在训练GPT-3 1750亿参数模型的比较中，B100芯片以喷射式的性能提升幅度碾压H100和H200芯片。此外，英伟达或将发布一系列生成式AI应用。

点评：英伟达即将发布的新技术可能会进一步巩固其在高性能计算和AI领域的市场主导地位。

NO.3 CAR-T疗法对实体瘤显示出效果

近日，两篇分别刊登于《自然-医学》和《新英格兰医学杂志》的研究结果表明，抗原嵌合受体T细胞（CAR-T）疗法在临床试验中表现出了针对实体恶性脑肿瘤——胶质母细胞瘤的治疗效果。据悉，胶质母细胞瘤是成人中最常见的脑部恶性肿瘤，即使是最好的治疗也收效甚微。过去利用免疫系统对抗该脑肿瘤的尝试均失败了，导致患者只能依靠传统药物、放疗和化疗，但平均生存率改善却不尽如人意。

点评：这一临床进展可能会开启实体瘤治疗的新篇章，对整个医疗行业产生深远影响。

NO.4 奔驰汽车工厂试点Apollo机器人

近日，奔驰宣布和仿人机器人开发商Apptronik达成协议，双方将合作探索高科技机器人Apollo，主要从事搬运、装配零部件等繁重的低技能劳动。根据双方协议，奔驰将启动试点项目，在汽车制造过程中测试Apollo仿人机器人执行各种任务的能力。奔驰称，相比较全面升级汽车生产流水线，Apollo机器人的运用可以降低员工工伤情况，自动化复杂、重复和枯燥的任务，进一步释放生产力。

点评：奔驰的这一举措可能会提高生产效率，同时减少工人的劳动强度。

NO.5 ChatGPT参数规模或被破解

近日，南加州大学研究人员使用一种方法，仅花费不到1000美元就将最新版GPT-3.5-turbo模型的参数规模破解出来。据该研究报告，研究人员破解出了未公布的GPT-3.5-turbo嵌入向量维度为4096或4608。几乎所有已知的开源大模型如Llama和Mistral，在嵌入向量维度为4096时，参数规模均为7B（70亿）。南加大研究团队指出，可以推测GPT-3.5-turbo的参数规模也在7B左右。

点评：此发现可能会促使AI领域对模型透明度和安全性的进一步探讨和改进。

NO.6 Sora训练数据被质疑

近日，OpenAI CTO Murati在接受采访时对Sora训练数据支支吾吾，让Sora陷入版权争议。当记者问及Sora是用什么数据训练以及是否用到YouTube、Facebook和Instagram上的视频时， Murati对此语焉不详，称不太确定，并表示不会详细透露关于使用数据的细节，但强调该公司使用的是公开可用的以及经过许可的数据。此前，OpenAI已频繁陷入版权诉讼。去年年底，《纽约时报》已向OpenAI及微软提起侵犯版权诉讼，指控二者未经许可使用其数百万篇文章以训练模型。

点评：这可能影响OpenAI在AI领域的声誉，并加剧版权诉讼风险。

结论：
Apple发布的MM1多模态大模型显示了其在多模态AI领域的成果，有助于推动行业创新。而GPU大会的即将到来将带来一系列新技术，包括英伟达的Blackwell架构及B100芯片，以及Car-T疗法等。这些技术创新可能会改变医疗行业的面貌，提高生产效率并减轻工人劳动强度。然而，ChatGPT参数规模的破解则引发了一定的社会关注，可能导致AI领域的透明度和安全性的问题。另外，OpenAI在Sora训练数据上的行为引发了版权争议，可能会影响其在AI领域的声誉。
建议：
对于苹果来说，继续投入研发，不断推出更先进的AI技术和解决方案，可以保持其在行业的领导地位。对于英伟达来说，应尽快发布其备受期待的B100芯片，以保持其在高性能计算和AI领域的市场主导地位。对于奔驰和OpenAI来说，应积极应对人工智能伦理和社会挑战，确保AI技术的安全性和公平性。对于Sora训练数据的使用方来说，应尊重知识产权，遵守相关法规。

上一篇:突发：马斯克Grok开源！
下一篇:港媒：中国像变形金刚，变招拆招终逆袭

更多更酷的内容分享

猜你感兴趣

我们不清楚Sora的训练数据是如何获取的。

OpenAI 最近推出的情感分析工具“Sora”后，其首席技术官(Mira Murati)未能详细解释Sora的训练数据来源，而只是含糊地声称使用了公开可用和许可的数据。然而，当记者追问Instagram和Facebook等社交平台上的视频时，她表示不确定这些内容是否会加入到训练集中。此外，OpenAI并未与其合作伙伴如Shutterstock达成过数据训练方面的合作。在接受采访时，Murati还回避了关于OpenAI与Shutterstock的合作，称数据来源肯定公开可用或经过许可。最后，她在采访结束后承认了确有使用Shutterstock的素材训练Sora，但相比于网络上浩如烟海的视频内容，来自Shutterstock的内容可能是Sora训练数据的一部分。这一做法让OpenAI陷入了尴尬境地，因为在此之前，该公司的数据抓取行为引发了广泛争议，并导致版权诉讼。如今，虽然 Murati承认了确实使用了Shutterstock的视频，但仍未提供具体细节。

热点资讯 03.19

全球科技早参携手Sora进军好莱坞。

2024年3月25日，OpenAI计划在好莱坞与影视公司合作，推动人工智能技术在娱乐行业的应用；英国科学家正在研发肺癌疫苗，有望降低肺癌发病率；苹果公司与百度商谈AI合作，中国或受益；Stability AI CEO辞职，导致公司面临困境。

热点资讯 03.25

美国OpenAI首席技术官：不太确定是否用过社交媒体数据来训练Sora。

美国OpenAI首席技术官米拉·穆拉蒂在采访中被问及使用的数据类型和来源。

热点资讯 03.18

一文读懂：中国复制Sora的模型架构、参数规模、数据规模和训练成本

出门问问算法团队发布万字长文，解构中国如何复刻OpenAI的Sora。尽管Sora在视频生成领域实现了碾压式超越，但其技术细节并未公开。本文基于实战经验和相关文献，对Sora的技术路线进行有理有据的猜想，并探讨复刻Sora所需关注的重点。

热点资讯 03.01

厦门一在建工地项目假打卡被发现，当地有关部门已介入调查

近日，福建厦门市同安区五缘实验学校的施工现场出现一名保安使用照片作为人脸打卡现象。目前，厦门市住建局下属的建设工程造价站正在对此事进行调查，并已接到相关情况反映。相关部门表示，这起事件属于人员履约合同范畴，由造价站负责监管。具体情况待官方公布。

热点资讯 11.26

公募基金新发产品破万亿，ETF市场新契机显现：为流动性与市场信心注入新的活力

鹏华基金和银华基金宣布为旗下宽基ETF增设流动性服务商，以改善市场流动性和基金运营平稳性。这一措施已吸引了多家基金公司的参与，并有助于拓宽ETF的销售市场。此外，公募基金年内新发产品数量突破千只，发行总份额超过1万亿份。市场情绪正朝着积极方向转变，表现出市场对权益类投资的热情。在宽松货币政策和经济基本面企稳的环境下，“固收+”基金有望获得更多的关注和支持，成为资本市场高质量发展的有益力量。

热点资讯 11.26

全国第十，9k/月！看完海南平均工资，我哭死了…

近日，阿发听闻海南工资高，决定详细介绍其情况。统计局数据显示，2023年全国城镇非私营单位就业人员年平均工资为120698元，同比增长5.8%；全国城镇私营单位就业人员年平均工资为68340元，同比增长4.8%。虽然看似平均工资较高，但值得注意的是，全国有编制的工人平均年薪为12万元，而普通工人的平均年薪仅为6.8万元。此外，由于体制内工资的存在，一些非私营单位属于体制内的收入，导致居民对"金饭碗"的认识有所偏差。尽管各地平均工资与当地经济发展水平、人均GDP有关，但仍然存在部分地区工资较高的特殊情况。总之，政府应加大社保投入，缩小贫富差距，实现人人平等。

热点资讯 11.26

今日辟谣：澄清误解，守护信息的真实性与权威性如果还有其他问题需要帮助，欢迎随时告诉我。

近日，有网民在短视频平台发布题为“贺州市砸毁市民200多辆摩托车”的视频，并有网民声称“相关部门无故销毁市民群众的车辆”。对此，贺州市市场监管局郑重声明，该信息系谣言。市场监管部门集中销毁的206辆电动自行车，为执法人员查扣不法商家擅自改装的不合格电动自行车，尚未销售流入市场。该批电动自行车经广西壮族自治区产品质量检验研究院检验，检验报告显示按GB17761-2018判定均为不合格。市场监管部门依法依规对不法商家立案查处，没收擅自改装的不合格电动自行车并进行销毁，切实保障群众生命财产安全，从源头上维护消费者合法权益。根据相关信息，广西贺州有人在社交媒体上发布关于电动车被砸毁的信息，政府进行了回应，称该信息是谣言，并已经对相关违法行为进行了查处。此外，科普人员提醒公众不要轻易相信网上关于某个人视力下降或眼药水有问题的消息，要查看真实信息。

热点资讯 11.26

最近24小时内，三件事引发全球市场的强烈反响

1. 特朗普提名贝森特出任美国财长； 2. 美国股市、债市、汇市以及商品市场迎来重大变化； 3. 贝森特有望落实减税措施。

热点资讯 11.26

官网发布消息：因工作失误，员工被停职，已启动问责程序。具体细节尚在调查中。或者官方通报：网站编辑员因误操作导致错误信息泄露，被停职并启动问责程序。

近日，湖南长沙县出现了一份公示，显示县卫生健康局向市民出具的《依法履职处理意见书》中存在大量错别字。据统计，该份文件有7处错别字，其中包括一些媒体经常使用的专业术语。这一事件引发了广泛关注，被网友质疑政府部门回应文件时的审慎程度。长沙县卫生健康局已经发布了情况通报，并表示将对相关人员进行严肃处理。同时，他们也将进一步改进工作流程和责任追究机制，防止类似事件再次发生。

热点资讯 11.26

周鸿祎正式发布首部短剧，邀请多位企业家朋友们担任嘉宾出演

周鸿祎在新产品的发布会上首次出演短剧，以“为了宣传新产品，被市场部逼着演了短剧”为由表达了不满。他透露，公司市场部为了宣传自己的想法，已经把产品推广融入了短剧中。他计划邀请几位企业家朋友来客串短剧中的霸道总裁角色，并向公众推荐观看这部短剧。据称，这部短剧每天写剧本两天拍摄，预计将在27号的新品发布会上播出。希望大家可以在27号前去看这部电影。

热点资讯 11.26

商场坠楼事件：男子死亡疑因迷路引发

居民发现一名男性员工在商场四楼坠楼身亡，经过核实后已报警并通知了家属。事件发生在上海市闵行区仲盛世界商城，具体原因尚未得知。目前当地警方正在进行调查。

热点资讯 11.26

国产射频芯片大厂裁员：约40%的研发团队被裁，补偿方案已确定

广州慧智微电子股份有限公司被曝大裁员，其中研发人员裁员比例达40%，其他部门未知。此外，广州慧智微电子股份有限公司也于近日开始了大规模裁员计划，其中包括上海分公司和广州分公司在内的多家子公司，预计涉及人数超过500人。关于此次裁员的原因，暂未得到该公司官方的确认，但有消息人士表示，原因是业绩持续恶化，为了削减成本。然而，该公司并未给出具体的裁员数量或赔偿标准。该报道还提到了慧智微的主营业务——射频前端芯片及模组的研发、设计和销售。其产品主要应用于智能手机、物联网等领域，并具有全方位的技术实力和品牌影响力。

热点资讯 11.26

微软与三星Galaxy Book 4 Edge推出全新Recall AI快照预览版

微软宣布Samsung GalaxyBook 4 Edge和GalaxyBook 5 Pro 360用户可使用Recall功能，通过Windows Insider Dev Build 26120.2415版本更新才能启用此功能。Recall是新的功能，用户可利用此功能搜索他们PC上曾经看过或做过的事情，并通过Windows Hello验证身份。该功能需用户注册并验证Windows Hello，允许用户控制保存哪些快照以及Recall何时保存快照。系统托盘的新图标显示当前状态和访问Recall的操作。

热点资讯 11.26