AI无限可能。北京航空航天大学巢文涵：探索提升的契机

2024-03-18 热点资讯关注公众号

每经记者：王郁彪每经：文多

AI（人工智能）大潮汹涌，真实与虚拟，正在被无限模糊。2024年伊始，OpenAI用它的首个视频生成模型Sora宣告了AI新阶段的到来——仅凭简单的文字描述，便可深度模拟真实物理世界，生成最长60秒的拟真视频。

如果把AI比作刚出生的婴儿，大语言模型的诞生则意味着它开口讲话，Sora的面世相当于他/她睁开了双眼，并把自己观察到的一切转化为画面与声音。

随着AI技术不断发展与应用，在AI赋能过程中，如何平衡其中的创新与挑战？3月15日，由工业和信息化部工业文化发展中心牵头成立的AI应用工作组主办，每日经济新闻承办、数智未来场景实验室协办的“Sora的启示：AI应用再飞跃”主题沙龙活动在京成功举办。

北京航空航天大学计算机学院副教授巢文涵在主旨演讲环节表示，生成式AI的迭代速度降低了用户端的再训练必要性，因此，想要在生成式AI的应用中寻求进一步突破，应该从训练和创造AI，逐渐走向调用和激发AI潜力。

图为北京航空航天大学计算机学院副教授巢文涵进行主旨演讲 v每经记者韩阳摄

Sora尚有诸多局限性

当其他AI视频工具还在突破几秒内的连贯性时，Sora已经可以快速制作最长1分钟、准确反映用户提示、可一镜到底的视频。

对于Sora在技术上的突破，巢文涵认为，Sora实际上是一个“Diffusion＋Transformer模型”（Diffusion、Transformer分别为模型名称），是二者组合成的强大信息提取器。Sora继承了DallE3（OpenAI 开发的最新文本到图像转换工具）的画质和遵循指令的能力，可以深度模拟真实物理世界，能生成具有多个角色、包含特定运动的复杂场景。因其根据静态图像生成视频的能力，Sora在动图制作、广告设计等领域具有不小的应用前景。不过，Sora能够获取现有视频并对其进行扩展或填充缺失的帧，这一功能在视频、电影特效等领域也将有不俗的应用表现。

值得一提的是，用户还可以使用Sora连接两个输入视频，在完全不同的主题和场景组成的视频间实现无缝过渡。

Sora在技术上的突破及其未来广阔的应用前景，使得AI又上升到了全新的维度。“Sora虽被定义为一款人工智能文生视频大模型，但其实，OpenAI并未将其单纯视为视频模型，而是作为‘世界模拟器’。”巢文涵如此表示。

从时尚展示到动漫制作，从心理治疗到建筑规划，Sora可以为多个相关领域进行全新创造、再创造。

不过，巢文涵认为，目前Sora同样拥有诸多局限性。比如，Sora在处理复杂场景时对物理规则的应用不一致，因此出现无法准确模拟出因果关系的特定情况。这也可以解释，为什么在Sora生成的视频里，时常能看到变形的椅子飞向天空的画面。

巢文涵进一步补充说，在人机交互、充分理解空间和时间的复杂性以及使用限制上，Sora还有非常多的局限性。

难免引发一系列问题

那么，如何在AI技术不断突破的过程中，继续逐点击破AI赋能和应用的难点，平衡创新与挑战？巢文涵表示，生成式AI应用，应该从训练和创造AI，走向调用和激发AI潜力。

“生成式AI的迭代速度降低了用户端的再训练必要性，关键是用户怎么调用这些生成式AI。同时，大模型本身外部检索、多模态能力都非常强，本身是一个好的搜索入口。”他接着补充说，“应该进一步去APP化，提供更多维度的综合应用交互方式。”

在巢文涵看来，大模型本身具备生态插件及融合能力，其自身会调用服务接口，不需要打开APP，而是需要设计合理的API（应用程序编程接口）接口。此外，还需打破传统AI应用中语音、文字、图片等不同格式的界限，提供更多维度的综合应用交互方式。

从技术层面考量，Sora也面临一系列挑战，包括可扩展性和计算资源、隐私和伦理问题以及就业和社会变革等。在这些挑战中，巢文涵特别提到了深度伪造。他注意到，不法分子会利用机器的深度学习技术，进行图像、声音、视频的篡改、伪造和自动生成，产生高度逼真且难以甄别的。

巢文涵认为，Sora对社会生产力和产业发展的促进作用毋庸置疑，但同时，Sora创造的大量虚拟视频会污染现存的图像数据，引发一系列问题。因此，他建议，应该建立法律和监管框架，同时提供政策支持，增强创新意识，加强数据保护与安全。

每日经济新闻

随着AI技术的快速发展，尤其是生成式AI，越来越多的应用场景开始涌现。在OpenAI推出其首个视频生成模型Sora之后，生成式AI的概念再次引起了业界的关注。然而，我们也要认识到，生成式AI的发展并非一帆风顺，仍然面临着许多挑战和难题。
首先，生成式AI的技术进步可能会降低用户端的再训练必要性。当前，人们对于人工智能的理解和应用还处于初级阶段，对于生成式AI的训练和创造AI的过程还不熟悉，这可能会导致用户的反馈不够准确或者质量不高。解决这个问题的方法之一就是鼓励用户在训练和创造AI的过程中，更加关注反馈机制，提高系统的稳定性和准确性。
其次，生成式AI在技术上的突破并不是孤立存在的。在实际应用中，生成式AI往往需要与其他技术相配合，才能达到最佳效果。例如，用户可以通过选择不同的参数来调整生成的效果，从而创造出符合自己需求的视频。在这种情况下，我们需要研究和开发更多的API接口，以满足不同用户的需求。
另外，生成式AI的发展也会带来一些问题，如隐私和伦理问题。一方面，生成式AI可能会收集大量的用户数据，这对用户的隐私权构成了威胁。另一方面，如果生成的违反了道德规范或者法律制度，可能会给社会带来负面影响。因此，我们需要建立相应的法律法规，对生成式AI的行为进行规范和约束。
最后，随着生成式AI的发展，它将对就业和社会结构产生深远影响。一方面，由于生成式AI可以创造大量的就业机会，可能会推动相关行业的经济发展。另一方面，它也可能加剧现有的职位空缺，尤其是在创意和设计等方面。因此，我们需要思考如何在推进AI技术的同时，也要考虑到这些问题，以确保AI的发展能够真正地造福人类。

上一篇:票房惨不忍睹！比烂片更可怕的，是烂片重映
下一篇:锐明技术：已将出租车及公交车的AEBS业务引入海外市场

更多更酷的内容分享

猜你感兴趣

北京航空航天大学：迎接新生和家长的住宿与报到安排

北京航空航天大学迎新结束，因大雨临时安排学生住宿。共有2024名新生报到，发放迎新礼包和物资。

生活常识 08.26

北京航空航天大学原副校长张广受贿案二审开庭，揭露高校官员贪腐之风

江西南昌中级法院已对北京航空航天大学原党委常委、副校长张广受贿一案作出公开开庭审理决定。张广利用职务之便为他人谋取利益，被指控涉嫌受贿犯罪。庭审过程中，检方出示相关证据，并听取了张广及其辩护人的陈述，最终判决结果将在近日公布。

热点资讯 10.18

南京航空航天大学2024年飞行技术专业招生简章: 提供全方位的学术和生活指南

南京航空航天大学2024年飞行技术专业将于2024年发布招生简章，作为教育部卓越工程师计划项目、江苏省特色专业、国家教学综合改革试点专业以及国家级一流本科专业建设点，该专业已有20多年历史。

热点资讯 04.22

微软推出 MatterSim AI 模型：探索材料设计无限可能

微软发布 MatterSim 模型，可模拟金属、氧化物、硫化物等多种材料。该模型基于深度学习技术，对大量合成数据进行训练，能以第一性原理预测相当的准确度，大大降低了对材料数据的需求量。此外，MatterSim 还提供定制化功能，只需要少量原始数据即可实现高性能预测。

热点资讯 05.15

阿里电商组织调整的后续及一些其他细节

阿里巴巴电商业务组织调整，CEO蒋凡回归，整合国内外电商业务，同时进行人事调整。淘天用户平台和阿里妈妈事业部总裁吴嘉将调任阿里云，原国际板块AI业务负责人张凯夫接替其位置。淘宝天猫和1688今年都有出海动作，淘宝海外团队负责13个国家和地区的华人市场，但业绩未达激进目标。考虑到业务融合的需求，蒋凡回归电商业务，对国内电商业务进行了重新整合，与其他高管分工更加明确。根据企业内部信息，此次阿里电商业务的组织调整和人员调整，可能标志着公司战略转型的重要一步。

热点资讯 11.22

手握电话，不需有线连接：手机厂商打破网络限制，开启无网通话新时代

手机厂商推出无网通信技术提升差异化竞争力。这类技术可在关键时刻提供安全保障，尤其在荒漠戈壁、地震、洪水等灾害区域以及未覆盖的地区使用。运营商已积极行动，推出各类服务增强通信安全性，但该技术仍有局限性。未来，业内将研究并推进“星地融合”技术实现全天时、全天域通信。面对日益增加的安全气囊，手机用户们的隐私保护越来越重要。

热点资讯 11.22

央八剧《熬通宵也要追》再掀悬疑风暴！于和伟领航大制作，期待你的精彩观看

标题：《我是刑警》将在黄金档播出！中国版“金盾传奇”即将开篇。根据腾讯混元大模型生成的内容，电视剧《我是刑警》将于11月27日在中国中央电视台八套黄金档播出，同时同步在桃厂同步网络平台上线。该剧以小人物的成长为主线，讲述了秦川、武英德、曹忠恕等三代刑警的故事，旨在展现刑警的职业精神和背后的付出。导演通过全方位的视角展示了刑警们的日常生活，让人看到了他们对于正义的坚守和对罪犯的制裁。《我是刑警》是一部值得一看的国产剧，有望成为今年的热门之一。

热点资讯 11.22

艳星碰上潜规则：8次影后助女演员角逐电视剧行业大奖

史艾玛从一个草根女演员崭露头角，逆袭成为影后的过程中，面临着不同的挑战。尽管她努力拼搏，并且受到了许多人的支持，但她仍然面临来自外界的压力。最后，她甚至经历了身体受伤的经历。但是，史艾玛并未放弃她的梦想，反而得到了朋友的帮助和支持。这段经历让她更加坚定了自己的信念，同时也塑造了一个勇敢追求梦想的女性形象。

热点资讯 11.22

拜登即将成为美国历史上最长寿在职总统之一

拜登在美国宪法第58条法定年龄为82岁。他因年龄过大无法胜任总统职位而退出。他成为历史上最年长的美国总统，将于2029年提前退休，届时将年满82岁零7个月。

热点资讯 11.22

逆袭男星：这些男星的反串角色，颠覆你的认知！

有几种男扮女装现象十分常见，除了女扮男装的争议外，还存在男扮女装翻车的情况。而在这其中，有一些男性演员频繁尝试扮女装，以此展示他们非凡的演技能力，如成毅的扮女装行为就引起了广泛的争议。其中，张国荣的男扮女装表演更是让观众深受震撼，体验到了真正的性别转变。然而，在现实中，虽然中国本土影视剧中也有一些能在短时间内塑造出独特的性别魅力的演员，但在众多男装扮女装的例子中，张国荣的表演无疑是最为出众的。

热点资讯 11.22

票房仅400万！叶珂真对黄晓明的害有多深？原来如此

黄晓明的新片《戴假发的人》上映一周，累计票房只有400万，预计最终票房仍将在460万左右。这部犯罪悬疑片以黄晓明饰演的大专生孟中为主线，讲述了罪行、秘密、身份和救赎的故事。然而，由于最近的感情风波影响票房，以及口碑不佳，该片的票房表现堪忧。

热点资讯 11.22

刀郎方回应云朵威胁：否认携家人威胁解约

云朵走红，却被网传她与师傅刀郎师徒发生冲突，还被其弟弟打腰部。刀郎经纪公司否认云朵威胁解约，并发布辟谣声明，云朵否认接受刀郎徒弟身份。网民对云朵的回应分歧很大，她在过去两个月经历人生最低谷。近期，刀郎演唱会再次重启，云朵缺席引发争议，曾三次发声以平息争议。如今，面临舆论压力，云朵两次发声试图挽回自己的形象。

热点资讯 11.22

第十一批在韩中国人民志愿军烈士遗骸11月28日回国，迎接新成员：再迎43位英雄回家

中韩签署了第十一批在韩中国人民志愿军烈士遗骸交接协议，韩方将于今年11月28日向中方移交43位烈士遗骸及相关遗物。此次交接在中韩双方遵循人道主义原则和国际法的基础上进行。

热点资讯 11.22

女生在风筝比赛中遭风筝线割喉，但主办方已签订《免责协议》，依法尽责

小姜参加南京江北新区盘城街道举办的“骑遇盘城”单车露营大会暨乡村自行车个人计时赛，不幸被风筝线割喉。此前两根风筝线也被发现并清除。主办单位认为选手签署了《免责协议》，但由于双方存在过错，主办方应承担责任。

热点资讯 11.22