中国发布全球首个百亿级遥感解译基础模型

© Fotolia / Tomasz Zajda中国发布全球首个百亿级遥感解译基础模型
中国发布全球首个百亿级遥感解译基础模型 - 俄罗斯卫星通讯社, 1920, 22.09.2024
关注
综合中国媒体报道,中国科学院空天信息创新研究院(空天院)9月21日宣布,该院付琨研究员团队联合鹏城实验室自主研制的、全球首个百亿参数级空天一体遥感解译基础模型——“空天·灵眸”3.0版,在当天开幕的第一届空天信息技术大会上正式发布,可为天临空地一体化应用提供一套行之有效的解决方案。
目前,“空天·灵眸”3.0版在覆盖场景分类、目标检测、语义分割、变化检测等6大类任务的23个国际基准数据集上测试,较比当前的主流模型,精度平均提升4%至10%,指标均达到领先水平,并已在应急、国土、海洋、住建等多个行业部署试运行,特别是在最具挑战性的复杂要素精细分类、运动小目标连续跟踪等任务上性能卓越。
“空天·灵眸”自2022年首次推出后,中国科学院空天院研究团队在相关积累上持续探索,2024年3月起与鹏城实验室深度合作,历时数月攻关完成在4亿张国产化多模态空天遥感数据样本上的预训练,基础模型参数规模首次超过百亿。
中国科学院空天院研究员孙显介绍,我们如果把基础模型看作是一个机器人,那么,“参数”就相当于它的“记忆细胞”和“知识细胞”。参数规模越大,这两种细胞就越多,它就能捕捉、记忆和处理更复杂的信息,从而更加准确、精细地完成更困难、更复杂的任务。
“空天·灵眸”3.0版内核工作架构是基于热传导,这是联合团队自主研发的一套小而精的原创性架构。受传热学物理思想启发,联合团队将场景目标间视觉语义传播建模为热能扩散过程,从而使该架构有效突破了遥感模型推理的性能和速度瓶颈,计算速度较传统结构模型提升2.4倍以上。
中国科学院空天院表示,“空天·灵眸”是中国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的行业基础模型。未来,研究团队将持续推动“空天·灵眸”3.0版在国民经济各个行业的落地应用。
斯坦福大学AI团队抄袭中国大模型 - 俄罗斯卫星通讯社, 1920, 05.06.2024
斯坦福大学AI团队抄袭中国大模型
新闻时间线
0