科学家提出大模型分子交互学习框架,能高效建模分子图信息,已在400多万分子对中得到验证

2024-03-06 生活常识 关注公众号
    :MolTC框架:革新药物分子交互研究,以AI驱动科研新突破
科学家提出大模型分子交互学习框架,能高效建模分子图信息,已在400多万分子对中得到验证    
科学家提出大模型分子交互学习框架,能高效建模分子图信息,已在400多万分子对中得到验证    设想一场科研变革:当面临“新型药物分子作用于小白鼠体内将产生何种效应”这类问题时,若无需依赖繁琐的临床实验设计和重复验证,只需将药物与环境中多个分子信息输入类似ChatGPT的智能聊天机器人,就能迅速、准确预测出药物可能产生的所有影响。这一颠覆性技术有望大幅削减科研人员的时间成本和相关厂商资源投入,为更快速、精准地发现药物提供强大动力。
科学家提出大模型分子交互学习框架,能高效建模分子图信息,已在400多万分子对中得到验证    
科学家提出大模型分子交互学习框架,能高效建模分子图信息,已在400多万分子对中得到验证    中国科学技术大学博士生方俊峰及其团队研发的全球首个统一多模态大语言模型分子交互学习框架——MolTC,正在打破这一看似遥不可及的科学幻想。在逾400万个分子数据集的严苛检验下,MolTC已成功验证其可靠性,方俊峰表示:“尽管目标仍显遥远,但我们的工作已在千里之行中迈出了坚实一步。”
科学家提出大模型分子交互学习框架,能高效建模分子图信息,已在400多万分子对中得到验证    
科学家提出大模型分子交互学习框架,能高效建模分子图信息,已在400多万分子对中得到验证    MolTC框架聚焦于高效建模分子图信息,通过整合图编码器与映射器技术,实现对复杂分子关系的深度理解和精确模拟。该团队创新性引入多层级思维链概念,优化了大模型的思考模式和训练范式,并采用动态参数共享策略,在保证预测效率的同时提升预测精度。
科学家提出大模型分子交互学习框架,能高效建模分子图信息,已在400多万分子对中得到验证    
科学家提出大模型分子交互学习框架,能高效建模分子图信息,已在400多万分子对中得到验证    MolTC的革命性在于构建了一个全面且易于使用的分子交互输出平台,无需深度学习背景或生化先验知识,即可通过集成海量多元化的分子交互任务,显式高效地揭示并掌握分子间的隐藏关联。这不仅打破了传统深度学习模型只能处理少量任务的局限,也弥补了传统大模型隐式学习分子交互规律的短板,即使面对少样本甚至零样本任务,MolTC依然能够保持卓越的精准度和效率。
    
    当前多数分子交互模型需要用户具备特定的专业背景,而MolTC一旦整合了广泛丰富的交互任务,凭借其在零样本任务上的出色表现,能直接给出交互结果,同时适用于多种分子交互任务的分析与建模。
    
    研究起源于当前分子关系学习领域所面临的困境:过于依赖文本信息如SMILES编码,导致未能充分利用分子图中的结构信息;缺乏一个统一的分子交互学习框架,阻碍了跨数据集关键信息的学习提炼。针对这些问题,方俊峰团队借鉴AlphaFold2等生物化学大模型的成功案例,着手开发MolTC框架,旨在解决分子交互任务中的核心挑战。
    
    在研发过程中,团队首先解决了如何高效提取并让大模型理解分子对信息的问题。他们借助Q-Formers架构的启示,利用两个图神经网络编码器获取分子对表征,并通过Q-Formers将其映射至大语言模型的输入空间,使模型如同安装了一双洞悉分子交互的“慧眼”。
    
    然而,分子对交互性质的分析远比单个分子性质复杂,对此,团队创新性地采用了多层级思维链的方法,引导大模型逐步表达,从定性到定量逐层解析分子交互特性,显著提升了预测准确性。通过预训练阶段精心设计的数据集和提示词,MolTC得以适应不同应用场景,尤其在涉及复杂的定量分子交互任务时,展现出了卓越的预测能力。
    
    面对模型混淆输入分子性质的问题,团队通过额外引入分子的SMILES形式来区分输入顺序,确保了MolTC在各类分子交互任务中取得优秀效果。随后,为了应对统一学习框架中不断加入新数据集而导致的精度下降问题,吴畅等人注意到底层交互机制虽有共性但表现各异,于是他们引导MolTC根据角色和顺序创建独特的编码,并采用动态参数共享策略排除冗余信息干扰。
    
    经过横跨12个分子交互数据集、涵盖超过400万个分子对的大规模验证,MolTC的有效性和准确性得到充分证明。近期,相关研究成果《MolTC:语言模型中的分子关系建模》已发表在arXiv上,方俊峰为第一,中科大教授王翔担任通讯。
    
    未来,团队计划进一步丰富MolTC的训练数据,致力于打造真正意义上“统一”的分子交互学习框架,并针对大分子交互任务的表现瓶颈,计划嵌入信息压缩模块,利用诸如“图信息瓶颈”等先进技术,排除冗余信息,拓宽MolTC的应用范围,持续推动分子交互领域的科研进步。

上一篇:DNF:都比男鬼剑士设计的好看?3大职业模型重做外观,女枪手成赢家
下一篇:3月中路法师最新梯度排行:沈梦溪胜率提升,“五大法王”换人!
更多更酷的内容分享
猜你感兴趣
新加坡留学生构建AI推理框架,引领大模型提升效率

新加坡留学生构建AI推理框架,引领大模型提升效率

新加坡国立大学博士生康力伟和赵子瑞提出的AI分析框架旨在提高大模型的推理能力,同时强调了思维链和思维树在提升模型推理能力方面的应用。研究表明,思维链能降低推理模型的描述长度,从而降低问题的样本复杂度;而思维树虽然也能提供改进,但在某些计算复杂度高的任务上效果不佳。建议在选择推理方式时应考虑任务的计算复杂度,以便选择合适的算法。文章中提到的研究者基于样本复杂度和计算复杂度的分析框架,对四个不同的任务进行了分析,并给出了一些建议。其中,思维链的运用可以让复杂的问题被分解为简单的问题,并在每次简化后的运算过程中得出正确的结果。而在直接回答的情况下,可能会忽视中间的步骤,导致推理错误。

热点资讯 06.30
科学家推出新型算法,让现有大模型的微调效率得到显著提升

科学家推出新型算法,让现有大模型的微调效率得到显著提升

美国斯坦福大学研究团队推出了一种名为 ReFT 的方法,该方法通过训练干预模块对模型表征进行干预,实现更高效的微调效果。此方法基于线性子空间概念,在特定分词位置进行表征修改,节省计算资源并提高推理效率。最新研究表明,相关论文已将 ReFT 发表在预印网站 arXiv 上[1]。目前吴政璇和阿拉曼·阿罗拉是共同第一作者,该研究设计思路源于一次实验,最终研发出了 ReFT,有效解决了微调问题。需要注意的是,ReFT 是基于线性子空间概念,无需训练大量的模型参数。

生活常识 07.20
揭秘社交信号与睡眠关系:大型模型解析社交媒体参与者行为背后的分子机制

揭秘社交信号与睡眠关系:大型模型解析社交媒体参与者行为背后的分子机制

华中科技大学张珞颖教授和薛宇教授发现仅在群体环境下调节睡眠功能的基因MRE11,此研究有助于揭示大脑如何适应并调整群体环境中的睡眠模式。他们的新发现可以应用于群居动物的生物行为监测,帮助研究人员理解社交信号对人类睡眠及其他行为的影响。

生活常识 09.24
华科PSALM多元任务多模态模型构建与全面开源,实现深度学习的高效协同应用

华科PSALM多元任务多模态模型构建与全面开源,实现深度学习的高效协同应用

华中科技大学推出针对多模态大模型(LMM)在视觉任务中的应用挑战的解决方案——PSALM模型,该模型以统一框架实现普遍性分割任务,具有高效参数优化和多任务统一等特点。PSALM在多个已见分割任务上展现出超群表现,优于传统参数过大且功能单一的模型,充分体现了多模态大模型在视觉任务中的巨大潜力。

热点资讯 04.09
家长因担忧隐私质疑是否合理拆掉孩子房间门锁?

家长因担忧隐私质疑是否合理拆掉孩子房间门锁?

门有何对错? 这篇文章引起了广泛的关注和讨论,特别是家长拆掉门锁或门的情况。有的家长表示出于担忧孩子学习不好而这样做,认为这是保护孩子的隐私权;也有人批评这种行为侵犯孩子的自主权,并认为父母应该更多地了解孩子的想法。还有些人回顾了自己的经历,并表示自己的观点和别人不同。最后,一名学生表示他从小就被妈妈拆掉门锁,并以此感到不安。这表明,经历过相同情况的孩子可能有很多。这篇文章引发了对教育和亲子关系的深刻思考。

生活常识 11.22
马斯克的中国首款减肥药即将上市,你需要知道这2点

马斯克的中国首款减肥药即将上市,你需要知道这2点

到这个条件的,不要轻易尝试减重版司美格鲁肽。” 减肥神药 适合人群 - 患者群体:适合所有有肥胖问题或有“体重焦虑”的人群。 注意事项 - 使用时需通过医生指导。 - 使用后需要注意可能的胃肠道副作用和低血糖风险。 - 用药过程中要注意饮食控制,避免过度摄入糖分和油脂。 - 如出现不适症状,应立即停止使用并就医。

生活常识 11.22
科学揭示:有效减肥的关键,让我们走得更快、更健康!

科学揭示:有效减肥的关键,让我们走得更快、更健康!

动计划,建议参与者每次推车(包括上下楼梯)最好持续30分钟。这项研究还指出,短暂的走路也能带来许多好处。例如,它可以提升每日能量消耗,改善健康状况。尽管如此,如果想要燃烧更多的卡路里并减少肥胖风险,可能需要采用更为高效且耗时较少的步行方式。意大利科学家在10名健康成年人身上实验后,发现了这样的秘密:他们能够通过在10到30秒内进行短暂步行的方式,显著地比一次性走完相同距离节省60%的能量。这种现象已经得到了其他科学研究的认可,并在医学领域引起了广泛关注。这项研究的研究者认为,如果我们能够在日常生活中采取一些小措施,比如每天坚持走动10000步,就能够大大改善身体健康状况。为了达到这个目标,人们可以选择多种不同的步行方式,如走路、爬楼梯机和跑步机等,也可以结合使用中等强度和剧烈的有氧运动。总的来说,短暂的步行是一种非常有效的健康锻炼方式,可以帮助我们更好地维持体重并改善身体健康状况。

生活常识 11.22
旺旺牛奶中喝出老鼠事件谣言的澄清:公司已经封存相关管道,并确认未有其他动物进入饮用系统

旺旺牛奶中喝出老鼠事件谣言的澄清:公司已经封存相关管道,并确认未有其他动物进入饮用系统

11月22日,网友发帖称孩子饮用富含食物残渣的罐装旺仔牛奶时,疑似发现了老鼠。此事件引起了关注和热议,包括旺仔品牌的回应。相关话题在微博上引发热度,登上热搜榜榜首。 对此,旺仔官方账号在评论区回应表示:“感谢反馈,请您私信留下联系方式,我们收到信息后会尽快与您联系。”同时,公司CEO也通过微博回应了此事,并强调自家产品不含老鼠。 最后,该公司还表示将采取措施以确保此类事情不再发生,并提醒消费者注意产品的卫生和安全。目前,关于此事件的具体细节仍在进一步调查中。

生活常识 11.22
黑龙江林草局:如何让东北豹显得更大?有效防范提示

黑龙江林草局:如何让东北豹显得更大?有效防范提示

何物件,离开时动作要轻盈,不要惊动豹。 1. 黑龙江省林业和草原局发布防范东北豹提示。 2. 非必要不入山。 3. 保持冷静,避免眼神交流。 4. 增强自我保护意识。 5. 加强区域防控和警戒工作。

生活常识 11.22
不同流向、多种原因:揭秘海水倒灌现象背后的复杂网络

不同流向、多种原因:揭秘海水倒灌现象背后的复杂网络

浙江宁波、广东深圳、广西北海等地发生海水倒灌现象引发社会广泛关注,台风“万宜”和冷空气共同影响导致部分地区出现50至110cm的风暴增水,并造成多地出现海水漫滩。

生活常识 11.22
崛起中的中国汽车品牌:瑞幸科技董事长袁岚峰谈汽车产业未来趋势

崛起中的中国汽车品牌:瑞幸科技董事长袁岚峰谈汽车产业未来趋势

据陈经描述,奇瑞最近创造了一个令人目眩的吉尼斯世界纪录——两辆瑶光C-DM以20码的速度智驾开行一公里。在其中一名表演者施海林在两车之间完成行走的过程中充分展现了星途瑶光C-DM电四驱的稳定性。 陈经认为,瑞虎汽车的成功源于其深耕出口、利用中国的汽车产业链实力以及新能源汽车业务的协同优势。他进一步指出,奇瑞在全球汽车业最大的变局中获得了领先地位,特别是在中国品牌的出口方面。他强调,尽管竞争对手如吉利和比亚迪也在积极布局海外市场,但相较于这些企业,奇瑞仍然能够保持在国内市场的领导地位。 陈经还提出了一些具体的建议,他认为,对于奇瑞来说,需要继续深化其出口业务,并加强技术创新,提升产品性能。他还表示,面对未来的全球化竞争,奇瑞需要更加注重海外市场的开拓,提高产品在当地市场的知名度和影响力。

生活常识 11.22
史上罕见!小雪节气为何总是与寒潮撞个满怀?

史上罕见!小雪节气为何总是与寒潮撞个满怀?

由于此次寒潮影响将持续时间较长,预计明起至27日,我国大部地区伴有4~6级大风,阵风7~9级;27日至28日,我国东部和南部海区也将先后出现6~8级偏北大风,阵风9~11级。建议各位提前做好防寒保暖工作。

生活常识 11.22
中国菜价遭逆袭:部分蔬菜价格远低于纸袋包装物

中国菜价遭逆袭:部分蔬菜价格远低于纸袋包装物

今年菜价大幅度下跌,尤其是西红柿、黄瓜等高价菜,冬笋、大白菜等低价菜价格也出现波动,这主要原因是供应量的增加和消费者对价格的接受程度降低。专家认为,这一波菜价回调是正常的,有助于市场回归合理价格水平。

生活常识 11.22
女子携亲子证离家,法院判母女关系紧张,子女入学受阻

女子携亲子证离家,法院判母女关系紧张,子女入学受阻

伟伟父亲通过法律途径寻求帮助解决孩子户籍登记问题,因《出生医学证明》引发的案件,重庆市江津区人民法院审理后判决结果是:伟伟父亲需返还《出生医学证明》原件,否则将由杨某协助伟伟申请户籍登记。此案例说明,为确保未成年人合法权益,应在出生医学证明丢失或损坏时及时给予相关处理,避免类似问题的发生。

生活常识 11.22