Sora的成功,源于谷歌的支撑吗?业界认为:人才、算力和数据的积累才是关键。

2024-02-21 热点资讯 关注公众号
    近日,全球AI界爆点频出,新锐巨头OpenAI震撼发布了一款名为Sora的文生视频模型,其创新突破在业内引发了一场广泛而热烈的讨论。Sora成功将AI生成视频时长提升至一分钟,并以演示视频中呈现的高度逼真度和卓越质量惊艳四座,外界纷纷猜测:在ChatGPT发布不足两年的时间内即推出Sora,是否意味着OpenAI背后还隐藏着强大的技术实力?而这款表现惊艳的Sora,是否已经具备了世界模型的特质?
Sora成功是站在谷歌肩膀上吗?业内:关键是人才、算力和数据的堆砌    尽管OpenAI尚未公布Sora对公众开放的确切日期,目前仅向安全团队、视觉艺术家、设计师及电影制作人等特定群体开放了使用权限,但其官网已上线了技术报告并不断释出内部人士的演示片段。据悉,Sora沿用了与GPT模型类似的Transformer架构,这一关键技术被广泛认为是支撑其强大能力的核心所在。
    深入探究,Sora与Pika、Runway等同类文生视频模型采用了底层相同的Diffusion扩散模型,但独特之处在于Sora对其实现逻辑进行了革新,创造性地用Transformer架构替换了原有的U-Net架构。北京邮电大学智能交互设计专业副教授谭剑在接受澎湃新闻采访时指出,相较于其他AI模型架构,Transformer架构具有两大显著理论优势:一是能够自动生成跨维度、多层次的知识网络或信息网络,犹如一张无缝对接的思维导图;二是其权重关联机制(attention机制)使其能根据任何数据的上下文环境理解相关高低维度信息,而这要求输入数据量足够庞大且维度丰富。
    一位不愿具名的AI大模型从业人士透露,Sora的技术核心思路在于运用视觉块编码方式将不同格式的视频统一编码后,通过Transformer架构进行训练,并引入类似Diffusion的Unet方式在降维和升维过程中实现加噪与去噪处理。通过巧妙的设计细节,Sora不仅解决了视频“闪烁”问题,还能直接生成高分辨率1080p图像以及长达60秒的高质量视频,显示其训练序列较长,训练窗口至少为五秒。
    然而,OpenAI发布的Sora技术报告仍留有诸多悬念。浙江大学百人计划研究员、博士生导师赵俊博表示,尽管Sora所采用的扩散Transformer架构可能是其成功的关键之一,但当前公开的并未详尽揭示更多的技术细节。他强调,从最基础的原理出发,学术界对于Transformer神经网络架构的理解尚处于初级阶段,尤其是对其在扩大规模后展现出的强大效能感到惊叹。
    此外,关于Sora的训练数据来源也成为业界热议焦点。据推测,Sora可能利用了游戏引擎生成的大规模数据进行训练,但具体的数据收集、生产加工过程以及如何将其喂给Sora进行预训练管线化的过程仍然成谜。
    谈及Sora对AI业界及学界的影响,赵俊博认为,由于该模型在技术上仍有待验证和完善,故应保持审慎乐观的态度:“Sora无疑会对AI视频领域的研究者及竞品带来重大冲击,但在生成模型的实际应用层面,可控性仍然是一个亟待解决的重大问题。要谈论产业影响,就必须明确目标用户、应用场景以及解决何种痛点需求,这些产业化落地的思考同样适用于此。”
    谭剑进一步指出,OpenAI借助ChatGPT和Sora的成功案例有力验证了纳什嵌入定律,即高维信息世界可以无缝兼容低维世界,实现所谓的“降维打击”。尽管构建此类高维AI模型需要跨越极高的数据和硬件门槛,但随着OpenAI的成功先例,后续或将有更多团队有望取得突破。
    值得注意的是,在OpenAI发布Sora的数小时前,谷歌亦推出了其Gemini 1.5版本的多模态通用模型,其中的Gemini 1.5 Pro将稳定处理上下文的能力上限提高到了100万tokens。然而,Sora的横空出世瞬间盖过了Gemini 1.5的风头,加之OpenAI在Sora报告中引用的多篇核心论文均出自谷歌科研团队,使得这两家科技巨头之间的“恩怨情仇”再度成为话题焦点,甚至有人戏称OpenAI是“站在谷歌肩膀上”。
    对此,赵俊博表示,虽然理论共享至关重要,但在现代科技发展环境中,单靠个人智慧和灵感实现重大技术突破的时代已经过去。他认为,关键在于人才团队的组建、算力和数据资源的积累,以及时间上的沉淀,将这样的系统视为一个庞大的“工艺装置”,其中的探索和形成过程才是最为关键的。
    最后,针对Sora的出现是否与AGI(通用人工智能)有关联的问题,赵俊博在朋友圈撰文表达了反对意见,他认为目前我们距离AGI还有很长一段路要走。他解释道,一个真正的世界模型应当具备输出动作、预测未来以及判断当前状态的能力。尽管Sora可能已经学习到了一些世界运行的模式,但它是否拥有上述全部能力尚不得而知。不过,如果有一天能解开其embedding的秘密,或许我们将能更深入地了解Sora的本质。

上一篇:梦境,复杂而多变
下一篇:梦是现实的预兆、延伸
更多更酷的内容分享
猜你感兴趣
周鸿祎强调:提升算力,国内企业才能追上Sora。

周鸿祎强调:提升算力,国内企业才能追上Sora。

360集团创始人周鸿祎表示,如果Sora的技术路线被开源,国内将能很快赶上,但算力可能成为门槛。他认为Sora的技术路线出炉后,国外有闭源和开源两条路线的斗争。一旦Sora的技术被开源出来,国内就能很快赶上。

热点资讯 03.04
‘三U一体’:实现数据中心算力升级的关键路径

‘三U一体’:实现数据中心算力升级的关键路径

随着数字化转型的深入,云化数据中心将成为新基建产业数字化的基础,但面临的挑战也越来越大。"三U一体"正在推动云化数据中心向更高规模组网、超低时延、超高带宽、高性能存储转型。

热点资讯 05.14
人才是科技强国的关键,尊爱惜护人才,共创未来。

人才是科技强国的关键,尊爱惜护人才,共创未来。

中美科技竞争日益激烈,中国在前瞻领先技术原创性上处于下风。科技人才实力是关键,但高端人才供给不足,面临流失问题。为提升科技人才梯队实力,中国需加大研发预算占GDP比例至3%以上,保证人才收入和研发环境,实施体系化人才战略,以培养科技领军团队。

热点资讯 03.09
陈晓建:有效利用数据驱动的AI时代,企业如何获得成功?

陈晓建:有效利用数据驱动的AI时代,企业如何获得成功?

亚马逊云科技总经理陈晓建在会上表示,数据是生成式AI时代企业取得成功的关键,只有利用自身数据个性化构建有价值的应用才能获得竞争优势。

热点资讯 05.01
Keep再遇裁员危机:业界关注的明星业务下降

Keep再遇裁员危机:业界关注的明星业务下降

Keep裁员100多人,主要集中在线上、国际化和市场等部门,其中包括部分员工提前离职。这一轮裁员的背后是Keep进行有力度的降本增效,包括削减免费午餐、不再免费提供办公用品等。

热点资讯 11.26
【用户实测】微信自动清理能节省高达90%的存储空间!

【用户实测】微信自动清理能节省高达90%的存储空间!

微信将于11月26日推出"原图、原视频14天自动清理"功能,该功能通过优化聊天记录占用空间,并允许用户暂时保存原图或原视频,以减少其占用空间。此外,用户还可以通过启用该功能查看普通画质的图片和视频。据数据显示,启用此功能后,90MB的视频可以压缩至3MB,节省约90%的存储空间。

热点资讯 11.26
中国半导体硅片替代加速:对海外供应商的影响和挑战

中国半导体硅片替代加速:对海外供应商的影响和挑战

中美贸易战使中国不得不发展本土半导体产业链以保障半导体自给自足,包括信越和胜高的业绩下滑。目前中国境内半导体市场竞争加剧,进口半导体硅片市场的份额减小,甚至导致胜高业务损失。为此,中国本土半导体制造商加大采购国产晶圆以对抗竞争对手,预计会对国内供应链产生深远影响。

热点资讯 11.26
iQOO Neo10 Pro:极致性能与速度的视觉呈现

iQOO Neo10 Pro:极致性能与速度的视觉呈现

"天玑9400 旗舰芯"、"台积电第二代 3nm 制程工艺"、"第二代全大核设计"、"电竞芯片 Q1"、"蓝海双芯电池"组成的高性能架构。同时具备快速响应能力的四曲面后壳、一体化陶瓷触控键等独特设计,以提供更极致的使用体验。以下是关于这款产品的简要概述: 基于高性价比原则,IQOO Neo10 Pro配备了一系列高质量的组件。其核心处理器采用先进的工艺技术和第二代5纳米制程技术,确保性能强劲且高效。这款手机的尺寸控制得恰到好处,轻薄度和握持感都很好。此外,还配备了一块具有防蓝光功能的6.78英寸超清护眼屏,并具备自研电竞芯片Q1。 综上所述,这是一款性能出色的智能手机,具有极高的性价比和出色的用户体验。

热点资讯 11.26
华为Mate 70系列新品发布:半导体材料ETF联动市场机遇与供应链复苏的催化剂

华为Mate 70系列新品发布:半导体材料ETF联动市场机遇与供应链复苏的催化剂

经过一夜调整后,半导体材料ETF已重返底部,并迎来新的买入时机,而由于华为Mate品牌盛典将于11月26日盛大举行,芯片产业将迎来提振。此外,报道还提及了半导体市场的复苏态势,以及投资者可关注的相关ETF产品。值得注意的是,多家媒体提到芯片制造业正面临增长机遇,因此半导体材料ETF及相关联接基金值得投资者关注。

热点资讯 11.26
李小冉古装新作再次引领热潮,8.3评分成功吸引了大量观众

李小冉古装新作再次引领热潮,8.3评分成功吸引了大量观众

《斗罗大陆之燃魂战》正热播,这部神还原经典动漫的玄幻剧已拿下8.3的高分,成为古装玄幻剧中的新势力,引得大批粉丝狂热追捧。同时,原定在第二季中出演的奇幻剧《斗罗大陆之蓝忘机》也在该剧的推动下得到了提前播出,并夺得高分,展现了全新的古装玄幻剧魅力。最终,由唐三带领的队伍击败强敌,获得了傲人的成绩,成为玄幻剧市场的最大赢家。此次成功让观众看到了众多精彩纷呈的故事和人物,无疑为观众带来了一场视觉盛宴。

热点资讯 11.26
《白夜破晓》的软肋在何处,现实验证老问题仍未解决

《白夜破晓》的软肋在何处,现实验证老问题仍未解决

国产悬疑剧《白夜破晓》受观众关注,但剧情质量低,引来失望情绪;其中法医角色表现欠佳,剧情不合理、注水现象影响观感;部分观众质疑为《白夜追凶》续集。官方尚未发布评分,观众普遍感到失望。

热点资讯 11.26
韩国顶级明星非婚生子继承权争议:拥有800亿韩元财富,每月300万抚养费引发热议

韩国顶级明星非婚生子继承权争议:拥有800亿韩元财富,每月300万抚养费引发热议

天”是郑雨盛收入的主要来源,但是既然他都已经公开承认了这件事,那就意味着他在这件事情上有很大的压力。郑雨盛每个月需要支付200万到300万韩元的抚养费,这个数额已经超过了我国规定的最低抚养费标准,这也引起了很多网友的关注。 另外,他还需要支付孩子的继承权。虽然他现在还没有结婚,但是如果他未来结婚生子,遗产分配时可能会受到影响。因此,无论是作为父母还是孩子来说,都需要注意这个问题。 总之,郑雨盛的婚外子事件是一个非常复杂的事件,涉及到很多因素。希望所有的宝子都能够理性看待这件事情,并且能够理智地对待他们身边的人。

热点资讯 11.26
吴谨言甜蜜归来与丈夫逛商场,手牵手温馨互动示幸福时光

吴谨言甜蜜归来与丈夫逛商场,手牵手温馨互动示幸福时光

吴谨言怀孕疑孕,预计产期快到。此前,有传她是奉子成婚,于正曾在评论区玩梗。两人因合作《延禧攻略》相识相爱,却被传是恋爱脑。吴谨言坚持要怀孕,她将坚守在丈夫身边。看到吴谨言夫妇恩爱画面和即将为人父母,我们也祝贺他们。

热点资讯 11.26
赵薇财产疑因强制执行曝光:处境堪忧?

赵薇财产疑因强制执行曝光:处境堪忧?

赵薇因被公司强制执行14117元登上热搜,其公司面临连带责任。此外,她过去几年的投资事业频繁失败,包括多个公司的股权被冻结以及投资项目注销。对于赵薇来说,失去的关注和支持让她感到失落。然而,尽管身陷困境,她仍保持着奢华的生活方式,并且以自己的微博账号积极回应粉丝的问题。目前,公众希望赵薇能够尽快还清欠款,并且一切正常发展即可。

热点资讯 11.26