Uni-3DAR:开创3D结构生成与理解的新纪元‌

日期:2025-03-26 09:53:47 / 人气:28



从微观世界的分子与材料结构,到宏观世界的几何与空间智能,3D结构的创建和理解一直是科学研究的重要基石。它不仅承载着丰富的物理与化学信息,更为科学家提供了解构复杂系统、进行模拟预测和跨学科创新的重要工具。然而,如何准确且高效地构建3D模型、理解和生成3D世界,一直是AGI(通用人工智能)、AI for Science(人工智能科学)和具身智能这三大AI热门领域共同关注的焦点。近日,一个名为Uni-3DAR的开创性大模型应运而生,为AI for Science带来了新的可能。

Uni-3DAR,由深势科技、北京科学智能研究院及北京大学共同打造,是一个通过自回归下一token预测任务将3D结构的生成与理解统一起来的框架。它是世界首个此类科学大模型,其核心团队阵容强大,包括深势科技AI算法负责人柯国霖、中国科学院院士鄂维南等。

Uni-3DAR的核心在于一种通用的粗到细token化方法,这种方法能将3D结构转化为一维的token序列。基于这套方法,Uni-3DAR使用自回归的方式,统一了3D结构的生成和理解任务。实验表明,Uni-3DAR在多个任务中均取得了领先性能,尤其在生成任务中,相较于现有的扩散模型,其性能实现了高达256%的相对提升,推理速度提升达21.8倍。此外,此模型不仅可用于微观的3D分子,也可用于宏观的3D任务,具备跨尺度的能力。

Uni-3DAR解决了3D结构建模中的两大痛点:数据表示不统一和建模任务不统一。传统的3D结构表示方式多样,且在不同尺度下差异显著,这严重限制了模型的通用性。而Uni-3DAR通过层次化八叉树压缩、精细结构token化和二级子树压缩等方法,实现了从微观到宏观3D结构的统一表示。同时,Uni-3DAR提出了Masked Next-Token Prediction策略,构建了一个统一的自回归框架,使得3D结构的生成与理解任务能够在单一模型内同时进行。

在实验结果方面,Uni-3DAR在微观3D结构领域的多个任务中均表现出色,包括分子生成、晶体结构生成与预测、蛋白结合位点预测等。这些成果充分证明了Uni-3DAR不仅能统一不同类型的3D结构数据及任务,而且在效果和速度上均实现了显著提升。

展望未来,Uni-3DAR的实验主要集中在微观结构领域,亟需在宏观3D结构任务中进一步验证其通用性和扩展性。同时,未来的一个重要方向是融合多种数据类型与任务,构建并联合训练一个更大规模的Uni-3DAR基座模型,以进一步提升性能与泛化能力。此外,Uni-3DAR还具备天然的多模态扩展潜力,可以引入更多模态的信息,共同训练一个具备物理世界理解能力的多模态科学语言模型,为构建通用科学智能体打下基础。

Uni-3DAR的诞生,标志着AI在3D结构生成与理解领域取得了重大突破。它不仅为科学研究提供了强大的工具,更为AI for Science的发展开辟了新的道路。我们有理由相信,在未来的科学研究中,Uni-3DAR将发挥越来越重要的作用。

作者:富邦娱乐




现在致电 xylmwohu OR 查看更多联系方式 →

COPYRIGHT 富邦娱乐 版权所有