密歇根大学:多模态大模型的应用拓展,提升可穿戴设备与人体工学AI智能体的智能化水平

2024-06-02 热点资讯 关注公众号
密歇根大学:多模态大模型的应用拓展,提升可穿戴设备与人体工学AI智能体的智能化水平
最近,LLMs(Large Language Models)在多模态交互方面取得突破性进展,其中一种方案是基于预训练大模型搭配视觉感知模块,生成准确的多模态回复。然而,实验发现模型存在严重的视觉幻觉问题,表现为图像中不存在的物体、回答中对图片描述与事实不符等。针对这一问题,最近的研究引入了Grounding功能,使得模型不仅能输出名词短语所对应物体的边界框坐标,还能提供有关物体在图片中的位置的信息。虽然此类模型仍面临一些问题,如长方形物体边界框的表达能力不足等,但仍显示出巨大的潜力。
密歇根大学:多模态大模型的应用拓展,提升可穿戴设备与人体工学AI智能体的智能化水平
最近的研究已经取得了一些令人瞩目的成果,其中之一就是基于预训练大模型搭配视觉感知模块的多模态交互方式。这种方法可以让模型不仅可以生成准确的多模态回复,还能根据图片的提供相关的信息,解决由模型存在的视觉幻觉问题所带来的挑战。
密歇根大学:多模态大模型的应用拓展,提升可穿戴设备与人体工学AI智能体的智能化水平
然而,在实际操作中,这个方法也遇到了一些问题。例如,长方形物体边界框的表达能力不足就是一个明显的问题。这主要是因为在生成答案时,模型可能无法准确地识别出长方形物体的边界框。另一个问题是,模型可能会给出错误的回答,因为它需要依赖于输入的图片信息来确定对象的位置和特征。
密歇根大学:多模态大模型的应用拓展,提升可穿戴设备与人体工学AI智能体的智能化水平
因此,研究人员引入了一种新的技术,叫做Grounding功能。这种功能可以增强模型的输出,使其能够更准确地描绘出图片中的物体。 Grounding功能的基本思想是在模型生成答案后,通过提出与输入图片相似的问题来检测和纠正模型的答案。如果模型给出的答案不正确,那么就会提示用户“这是哪里?”,然后让用户去寻找正确的答案。
密歇根大学:多模态大模型的应用拓展,提升可穿戴设备与人体工学AI智能体的智能化水平
这种功能的有效性已经在一些研究中得到了验证。例如,一项在《计算机视觉》杂志上发表的研究就使用了Grounding功能,并发现了显著的效果。他们的研究发现,Grounding功能可以帮助模型更好地理解输入图片,从而生成更准确的答案。
总的来说,尽管LLMs在多模态交互方面的研究仍然面临一些挑战,但这些新的技术和功能正在不断地推动着这个领域的进步。通过引入Grounding功能,我们可以期待未来更多的研究成果出现,让LLMs在未来能更好地服务于我们的生活。

上一篇:中国女排奥运形势:实际优势还有38.83分,失去亚洲第一位置
下一篇:沈阳地铁疑因社保断缴惹保洁人员维权?中标公司:部分人员属于合法退休年龄 正在沟通合理补偿建议
更多更酷的内容分享
猜你感兴趣
科学家创新协同算法,构建跨模态智能体的大模型高效合作系统

科学家创新协同算法,构建跨模态智能体的大模型高效合作系统

最新的研究表明,麻省理工学院与ATI特种材料公司合作,成功地开发了一种制造高强度-延展性钛合金的新方法。这种合金结合了优异的强度和延展性,可能被用作航空航天、能源基础设施和生物医学设备等多种领域的材料。这项研究揭示了如何通过对合金的化学成分和晶格结构进行精细调整,以及改变工艺技术以实现高效生产和高质量的产品。这项发现对钛合金的应用产生了深远影响,并将推动新材料产业的发展。

生活常识 07.08
科学家研发的多模态大模型,准确锁定图像物体位置,让大模型更懂物理世界。

科学家研发的多模态大模型,准确锁定图像物体位置,让大模型更懂物理世界。

社交媒体和影视剧上父母辅导孩子写作业的有趣和崩溃瞬间,常常源于小学语文常考的“看图写话”题目。这种题目旨在提高小学生的观察和表达能力。如今,AI 如何实现“看图写话”呢?新加坡国立大学的研究团队提出了一种名为 pix2emb 的方法,并基于该方法训练了多模态大模型 NExT-Chat,能够将对话、检测和分割进行统一,以处理各种对话场景。相关论文已发表在 arXiv 上。

热点资讯 02.25
智能穿戴设备集体升级:手环变手表,是否真的可以摆脱手机的束缚?

智能穿戴设备集体升级:手环变手表,是否真的可以摆脱手机的束缚?

2023年全球可穿戴腕带设备市场出货量1.85亿台,同比增长1.4%。2024年有望实现5%的增长至1.94亿台。受通胀和复杂经济环境影响,基础手表市场份额上升至历史最高水平(48%),但同时智能手表厂商“单飞”可能不是明智之举。厂商正努力在基础手表上预装更多应用程序以促进更智能的体验并提高电池续航能力。目前苹果、小米、华为位列前三。未来市场趋势显示,消费者支出向服务转移。美国和北欧消费者的智能手表需求下降。厂商积极应对。

热点资讯 07.04
从小规模模型发展到大规模模型,人工智能技术主要有两种路径。一是专门设计的智能,也就是有明确目标和应用场景的模型;二是通用的智能,这种模型能够适用于各种应用场景。

从小规模模型发展到大规模模型,人工智能技术主要有两种路径。一是专门设计的智能,也就是有明确目标和应用场景的模型;二是通用的智能,这种模型能够适用于各种应用场景。

"具有代表性的通用人工智能项目,由来自中国人工智能实验室的乔宇先生发表。他指出,这两条发展路线不是孤立存在的,而是相辅相成的。其中,对已有路径进行探索并解决其固有问题,是通用人工智能的发展方向。他也提到了机器翻译(Machine Translation)、对话系统(Dialog Systems)等创新领域的前景。他还强调了大模型和增强学习的重要性,以及如何利用它们来解决通用人工智能面临的问题。"

热点资讯 03.25
揭秘低空经济新探索:应用场景及落地策略

揭秘低空经济新探索:应用场景及落地策略

2024年首次被写进政府工作报告的低空经济,近30个省份和城市的政府工作报告提出大力发展低空经济及通用航空。其中,长三角地区城际间低空航线正在密集开通,昆山到浦东的载客直升机航线仅需飞行不到半个小时。 从2小时缩短到半小时,苏州高新广场直航中心到南通仅需25分钟,无锡硕放机场仅需12分钟。同时,航空运动、空中旅游、飞行培训、应急救援等领域都具有巨大的发展潜力,有望成为低空经济的重要增长点。例如,长沙湘江新区的航空应急救援基地,能快速响应临近事故点开展应急救援任务。

热点资讯 09.19
洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

江南五虎在江浙地区崛起,占江苏白酒市场份额近40%,竞争日益激烈。 黄山归来,犹如一幅画卷,把古老的中国文化装点得独具魅力。

热点资讯 09.19
女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

深圳男子PPT揭露出轨事实,自称曾下跪哀求女友不要举报。

热点资讯 09.19
外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

9月18日,深圳日本人学校10岁学生遭男子刺伤,已被现场捕获。中方继续采取有效措施,保障在外中国人的安全。

热点资讯 09.19
挑战《黑神话》的强劲对手:打造3A级开放世界游戏引擎,却未知其神秘力量

挑战《黑神话》的强劲对手:打造3A级开放世界游戏引擎,却未知其神秘力量

随着《黑神话:悟空》的火热,国内玩家开始调侃欧美玩家的“女拳师”现象,国内一些工作室也试图利用男女话题来吸引眼球。最近一家被称为全女的GHG游戏工作室成立,并承诺将制作出完全由女性参与的3A级别开放世界游戏。然而,由于尚未完成游戏引擎的研发和成本控制,这款游戏可能会成为诈骗的一种手段。对此,我们建议大家保持理性判断,不要轻信不实信息,保护自己的权益不受侵犯。

热点资讯 09.19
大众关闭工厂,狼堡裁员,互联网巨头的严峻挑战与未来展望

大众关闭工厂,狼堡裁员,互联网巨头的严峻挑战与未来展望

沃尔夫斯堡面临前所未有的挑战:汽车电动化、智能化转型和竞争压力加剧导致德国这家百年历史的工业重镇面临倒闭风险。沃尔夫斯堡及其庞大的大众汽车集团总部象征着德国工业复兴,但随着欧洲最大汽车制造商宣布关闭本土工厂,并放弃工作保障承诺,这座城市的12万居民开始担忧未来。沃尔夫斯堡拥有超过4800万辆汽车的生产能力,而在中国汽车市场竞争加剧的影响下,该公司可能会遭受重大打击,需要大幅增加拨备以应对这一冲击。这个消息引发了全球汽车产业的关注。

热点资讯 09.19
罗峰全新造型发布,诺岚山危机,五大强者的降临:一位神秘人物的隐藏身份

罗峰全新造型发布,诺岚山危机,五大强者的降临:一位神秘人物的隐藏身份

米克、亚瑟和涅塔。在这五人当中,涅塔的名字最引人注目,因为他是一名黑帮老大,同时还是一个天才级别的战士。从他的实力来看,他是第五个出场的五大强者之一,绝对不容小觑。 另外,涅塔在预告片中并未完全展示出他的实力,只能猜测他的战斗力应该很强。这次出现在《吞噬星空》动漫中的涅塔,无疑会给观众带来更大的惊喜。 总之,从这次剧情来看,有很多看点,包括主角罗峰的新造型、五大超级强者的登场等,相信这部动漫会有更多的精彩内容等待着观众。

热点资讯 09.19
黎巴嫩爆炸引发猜测:台企生产寻呼机,源头调查仍在进行中

黎巴嫩爆炸引发猜测:台企生产寻呼机,源头调查仍在进行中

黎巴嫩真主党订购台产寻呼机爆炸,以色列事先破坏并伪装成自杀式袭击。

热点资讯 09.19
梦幻西游:首款秋杀九黎城装备首曝 - 表弟团队打造联赛冠军帮计划已启动!

梦幻西游:首款秋杀九黎城装备首曝 - 表弟团队打造联赛冠军帮计划已启动!

标题:奇幻高手晒新装!打造双九黎城阵容及联赛冠军帮! 事件起因及关注爆点:梦幻游戏官方曝光九黎城装备,打造双九黎城阵容;另曝雪山表弟团队欲打造联赛冠军帮,提高团队实力。

热点资讯 09.19
70后农行女性高管晋升至高层,预示着银行业改革与发展新趋势

70后农行女性高管晋升至高层,预示着银行业改革与发展新趋势

张曼获湖南农行派重任官,时值长沙银行半年后新行长人选揭晓,张曼晋升为副行长,成为湖南省万亿上市银行董事长人选,由她提名成为董事会董事候选人。此前张曼加入长沙银行前是中国农业银行的员工,期间担任过多个职务,包括副行长等,此次晋升为总经理。

热点资讯 09.19