AI无限可能。北京航空航天大学巢文涵:探索提升的契机

2024-03-18 热点资讯 关注公众号

每经记者:王郁彪    每经:文多

AI(人工智能)大潮汹涌,真实与虚拟,正在被无限模糊。2024年伊始,OpenAI用它的首个视频生成模型Sora宣告了AI新阶段的到来——仅凭简单的文字描述,便可深度模拟真实物理世界,生成最长60秒的拟真视频。

如果把AI比作刚出生的婴儿,大语言模型的诞生则意味着它开口讲话,Sora的面世相当于他/她睁开了双眼,并把自己观察到的一切转化为画面与声音。

随着AI技术不断发展与应用,在AI赋能过程中,如何平衡其中的创新与挑战?3月15日,由工业和信息化部工业文化发展中心牵头成立的AI应用工作组主办,每日经济新闻承办、数智未来场景实验室协办的“Sora的启示:AI应用再飞跃”主题沙龙活动在京成功举办。

北京航空航天大学计算机学院副教授巢文涵在主旨演讲环节表示,生成式AI的迭代速度降低了用户端的再训练必要性,因此,想要在生成式AI的应用中寻求进一步突破,应该从训练和创造AI,逐渐走向调用和激发AI潜力。

图为北京航空航天大学计算机学院副教授巢文涵进行主旨演讲 v每经记者 韩阳 摄

Sora尚有诸多局限性

当其他AI视频工具还在突破几秒内的连贯性时,Sora已经可以快速制作最长1分钟、准确反映用户提示、可一镜到底的视频。

对于Sora在技术上的突破,巢文涵认为,Sora实际上是一个“Diffusion+Transformer模型”(Diffusion、Transformer分别为模型名称),是二者组合成的强大信息提取器。Sora继承了DallE3(OpenAI 开发的最新文本到图像转换工具)的画质和遵循指令的能力,可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景。因其根据静态图像生成视频的能力,Sora在动图制作、广告设计等领域具有不小的应用前景。不过,Sora能够获取现有视频并对其进行扩展或填充缺失的帧,这一功能在视频、电影特效等领域也将有不俗的应用表现。

值得一提的是,用户还可以使用Sora连接两个输入视频,在完全不同的主题和场景组成的视频间实现无缝过渡。

Sora在技术上的突破及其未来广阔的应用前景,使得AI又上升到了全新的维度。“Sora虽被定义为一款人工智能文生视频大模型,但其实,OpenAI并未将其单纯视为视频模型,而是作为‘世界模拟器’。”巢文涵如此表示。

从时尚展示到动漫制作,从心理治疗到建筑规划,Sora可以为多个相关领域进行全新创造、再创造。

不过,巢文涵认为,目前Sora同样拥有诸多局限性。比如,Sora在处理复杂场景时对物理规则的应用不一致,因此出现无法准确模拟出因果关系的特定情况。这也可以解释,为什么在Sora生成的视频里,时常能看到变形的椅子飞向天空的画面。

巢文涵进一步补充说,在人机交互、充分理解空间和时间的复杂性以及使用限制上,Sora还有非常多的局限性。

难免引发一系列问题

那么,如何在AI技术不断突破的过程中,继续逐点击破AI赋能和应用的难点,平衡创新与挑战?巢文涵表示,生成式AI应用,应该从训练和创造AI,走向调用和激发AI潜力。

“生成式AI的迭代速度降低了用户端的再训练必要性,关键是用户怎么调用这些生成式AI。同时,大模型本身外部检索、多模态能力都非常强,本身是一个好的搜索入口。”他接着补充说,“应该进一步去APP化,提供更多维度的综合应用交互方式。”

在巢文涵看来,大模型本身具备生态插件及融合能力,其自身会调用服务接口,不需要打开APP,而是需要设计合理的API(应用程序编程接口)接口。此外,还需打破传统AI应用中语音、文字、图片等不同格式的界限,提供更多维度的综合应用交互方式。

从技术层面考量,Sora也面临一系列挑战,包括可扩展性和计算资源、隐私和伦理问题以及就业和社会变革等。在这些挑战中,巢文涵特别提到了深度伪造。他注意到,不法分子会利用机器的深度学习技术,进行图像、声音、视频的篡改、伪造和自动生成,产生高度逼真且难以甄别的。

巢文涵认为,Sora对社会生产力和产业发展的促进作用毋庸置疑,但同时,Sora创造的大量虚拟视频会污染现存的图像数据,引发一系列问题。因此,他建议,应该建立法律和监管框架,同时提供政策支持,增强创新意识,加强数据保护与安全。

每日经济新闻


随着AI技术的快速发展,尤其是生成式AI,越来越多的应用场景开始涌现。在OpenAI推出其首个视频生成模型Sora之后,生成式AI的概念再次引起了业界的关注。然而,我们也要认识到,生成式AI的发展并非一帆风顺,仍然面临着许多挑战和难题。
首先,生成式AI的技术进步可能会降低用户端的再训练必要性。当前,人们对于人工智能的理解和应用还处于初级阶段,对于生成式AI的训练和创造AI的过程还不熟悉,这可能会导致用户的反馈不够准确或者质量不高。解决这个问题的方法之一就是鼓励用户在训练和创造AI的过程中,更加关注反馈机制,提高系统的稳定性和准确性。
其次,生成式AI在技术上的突破并不是孤立存在的。在实际应用中,生成式AI往往需要与其他技术相配合,才能达到最佳效果。例如,用户可以通过选择不同的参数来调整生成的效果,从而创造出符合自己需求的视频。在这种情况下,我们需要研究和开发更多的API接口,以满足不同用户的需求。
另外,生成式AI的发展也会带来一些问题,如隐私和伦理问题。一方面,生成式AI可能会收集大量的用户数据,这对用户的隐私权构成了威胁。另一方面,如果生成的违反了道德规范或者法律制度,可能会给社会带来负面影响。因此,我们需要建立相应的法律法规,对生成式AI的行为进行规范和约束。
最后,随着生成式AI的发展,它将对就业和社会结构产生深远影响。一方面,由于生成式AI可以创造大量的就业机会,可能会推动相关行业的经济发展。另一方面,它也可能加剧现有的职位空缺,尤其是在创意和设计等方面。因此,我们需要思考如何在推进AI技术的同时,也要考虑到这些问题,以确保AI的发展能够真正地造福人类。

上一篇:票房惨不忍睹!比烂片更可怕的,是烂片重映
下一篇:锐明技术:已将出租车及公交车的AEBS业务引入海外市场
更多更酷的内容分享
猜你感兴趣
北京航空航天大学:迎接新生和家长的住宿与报到安排

北京航空航天大学:迎接新生和家长的住宿与报到安排

北京航空航天大学迎新结束,因大雨临时安排学生住宿。共有2024名新生报到,发放迎新礼包和物资。

生活常识 08.26
南京航空航天大学2024年飞行技术专业招生简章: 提供全方位的学术和生活指南

南京航空航天大学2024年飞行技术专业招生简章: 提供全方位的学术和生活指南

南京航空航天大学2024年飞行技术专业将于2024年发布招生简章,作为教育部卓越工程师计划项目、江苏省特色专业、国家教学综合改革试点专业以及国家级一流本科专业建设点,该专业已有20多年历史。

热点资讯 04.22
微软推出 MatterSim AI 模型:探索材料设计无限可能

微软推出 MatterSim AI 模型:探索材料设计无限可能

微软发布 MatterSim 模型,可模拟金属、氧化物、硫化物等多种材料。该模型基于深度学习技术,对大量合成数据进行训练,能以第一性原理预测相当的准确度,大大降低了对材料数据的需求量。此外,MatterSim 还提供定制化功能,只需要少量原始数据即可实现高性能预测。

热点资讯 05.15
民航局积极探索并实施无人机适航审定新模式探索,应对未来挑战:如何更好地满足行业需求 - 民航局引领无人机适航审定改革方向

民航局积极探索并实施无人机适航审定新模式探索,应对未来挑战:如何更好地满足行业需求 - 民航局引领无人机适航审定改革方向

中国民航局表示将积极推动低空经济的发展。目前,我国拥有大量的无人机企业和持照人员,并且已经形成了较为完善的基础设施和服务体系。在接下来的时间里,将进一步推进飞行服务保障体系建设,优化市场环境,规范市场秩序。同时,还将强化安全运行监管,细化安全规则和标准,鼓励创新和竞争,促进行业发展。

热点资讯 07.10
打破传统:创新公司通过定制音响系统,引领KTV行业的变革

打破传统:创新公司通过定制音响系统,引领KTV行业的变革

智爱未来旗下品牌"Aison爱畅"发布了首个智能K歌音箱系列产品,打破行业天花板,成为中国智能K歌音箱赛道的黑马级产品。该产品的音质、交互性和综合K歌体验上都表现出色,提供了海量正版曲库和优质的K歌体验。爱畅还与雷石、全民K歌、QQ音乐等优质内容服务商合作,确保了产品的版权丰富和高质量。在未来,AI大模型与智能音箱的融合将带来更多新的体验和可能,爱畅将持续为行业和消费者带来更多惊喜。

热点资讯 09.19
黎巴嫩爆炸加剧:涉及更多民用设备,或将引发信任危机?

黎巴嫩爆炸加剧:涉及更多民用设备,或将引发信任危机?

示牌(T-18)、韩国“SM”、美国“Duracell”和中国台湾“金阿波罗”品牌的无线通信设备。次轮爆炸袭击中,有多家知名品牌如诺基亚、三星、华为和小米的产品被发现被使用。最近的爆炸事件则涉及到了日本品牌的无线通信设备,以及一些非智能手机产品的无线电设备。联合国人权事务高级专员表示将彻查爆炸的原因,并对下令者和实施者追究责任。同时呼吁国际社会应该采取行动,阻止冲突的扩大。目前无法确定这些无线通信设备是否是通过非法渠道获得的,也不知道是否有官方许可和审查程序。目前仍有许多爆炸事件发生在黎巴嫩。黎巴嫩通讯部证实了第一轮爆炸袭击时使用的设备来自日本品牌艾可慕。对于这次爆炸事件,黎巴嫩政府已经发布安全警告,建议民众避免前往现场。然而,相关产品仍然在市场上流通。

热点资讯 09.19
荷兰抵制通过2758号决议

荷兰抵制通过2758号决议

题上并不是第一次采取这样的行动,最近的动作尤为嚣张,这显然不是和平的方式解决问题。荷兰的行为已经引发了很多国家的关注,尤其是对中国来说,这无疑是又一次挑衅。中国坚决反对任何对国际法的践踏和对国际秩序和规则的公然挑战,对于荷兰的做法,中国必须坚决回击。中国的立场鲜明且坚定,相信在不久的将来,国际社会会看到公正与和平的一面。

热点资讯 09.19
华为三折叠手机是否将于近期发布?小米荣耀的布局动作是否值得关注?

华为三折叠手机是否将于近期发布?小米荣耀的布局动作是否值得关注?

小米2022年12月21日提交三折叠手机外观设计专利

热点资讯 09.19
新款电动车强制性国标发布,新增多项标准让你出行更安心

新款电动车强制性国标发布,新增多项标准让你出行更安心

工业和信息化部等多部门对《电动自行车安全技术规范》进行公开征求意见,做了很多改进和提升,提高了防火阻燃性能、防范非法改装行为,优化了电动车额定功率和最高转速的测试方法,提升了产品实用性,包括降低火灾事故风险、减少非法篡改行为、动态安全监测、提升续航里程等。此次新修订的标准旨在提升电动自行车产品的安全水平,促进行业的规范化发展,保护人民群众生命财产安全。

热点资讯 09.19
IBM裁员人数超过1000人,其中大部分集中在50-55岁的职场精英群体

IBM裁员人数超过1000人,其中大部分集中在50-55岁的职场精英群体

本文报道称,根据一位IBM内部员工透露的信息,该公司的美国总部近期秘密进行了大规模裁员,受影响的数千人。裁员的原因与传统裁员不同,本次裁员未经正式通知。该员工表示他的经理告诉他必须签署保密协议才能讨论具体细节。据悉,IBM在全球约有288,000名员工,且在2023年末,已经裁员3,900人。该公司正在考虑调整人力配置以满足AI需求,并在印度和其他地区招聘新职位以确保员工数量稳定。该裁员可能导致约5,200个职位减少,涉及4亿美元的费用。目前还不清楚在这次裁员中哪些职位会被关闭或转至印度。此外,由于泄露事件的影响,一些招聘信息已被替换为招聘其他地点。至于新职位的具体位置和时间,公司方面尚未给出明确答复。该公司股价在过去三个月内上涨了33%。

热点资讯 09.19
2023年中国MCU市场规模持续扩大至282亿美元,领先全球

中国MCU市场规模稳步增长至282亿美元,占据全球主导地位

2023年中国MCU市场有望突破282亿美元,引领全球消费电子趋势

中国MCU市场增长强劲,已超全球平均水平,未来前景广阔

2023年中国MCU市场规模持续扩大至282亿美元,领先全球 中国MCU市场规模稳步增长至282亿美元,占据全球主导地位 2023年中国MCU市场有望突破282亿美元,引领全球消费电子趋势 中国MCU市场增长强劲,已超全球平均水平,未来前景广阔

新冠疫情期间加剧芯片供应紧张,推动MCU价格上涨;厂商逐渐转向成本更低、性能更强的Arm生态系;但取代率上升可能促使MCU价格继续下滑。预计未来几年MCU平均单价会跌至0.88美元。整体来看,MCU价格将持续波动。

热点资讯 09.19
越南欲通过新铁路项目加强与中国老挝的合作

越南欲通过新铁路项目加强与中国老挝的合作

越南政府成立特别工作组,负责实施连接越南与中国和老挝的铁路投资项目。

热点资讯 09.19
重庆紧急发布高温红色预警,最高温预计将达40摄氏度以上!

重庆紧急发布高温红色预警,最高温预计将达40摄氏度以上!

重庆市气象局发布高温红色预警信号,预计未来15小时内,重庆市13个区县海拔400米以下地区将出现高温天气,并伴有强烈日照和酷热感,需注意防暑降温。 详细信息:重庆气象局发布高温红色预警信号,预计未来15小时内,重庆市13个区县海拔400米以下地区将出现高温天气,并伴有强烈日照和酷热感,需注意防暑降温。

热点资讯 09.19
蔚来将收购比利时奥迪工厂:激进还是稳健之举?

蔚来将收购比利时奥迪工厂:激进还是稳健之举?

蔚来打算收购奥迪在比利时沃斯特的工厂,以降低关税并提升产品在欧洲的销售能力。尽管面临国内市场竞争和欧洲不确定性的风险,但收购被认为是一个合理的决策。目前,该工厂已在挪威、德国、荷兰、瑞典和丹麦等地启动运营,并已成功交付首批用户。

热点资讯 09.19