媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

阿里达摩院联合高德发布多模态地理文本预训练模型MGeo,已在魔搭社区开放

2023-02-21来源:TechWeb编辑:

2月21日,达摩院联合高德发布业界首个多模态地理文本预训练模型MGeo,其可充分理解地图上的每一个元素,并精准完成地图搜索、地理位置分析等任务。MGeo是阿里通义模型系列旗下的新模型,目前已在魔搭社区开放(https://modelscope.cn/models/damo/mgeo_backbone_chinese_base/summary)。

地理文本信息处理是导航软件、物流以及零售等行业的基础。然而,目前传统地理文本AI算法对于地理信息的理解仍局限在经纬度以及经纬度的远近上,无法像人类一样理解地图上的元素,该方法难以精准表示景区、园区、商业街等大型地理实体的具体形状,以及不同地图元素之间复杂的临近、包含等关系。

针对上述问题,达摩院联合高德提出地理文本多模态模型,使用对抗MLM预训练、句子对预训练及多模态预训练三大技术,并用多任务预训练将这三种预训练任务进行动态组合,最终训练得到适合于多类地理文本任务的预训练底座MGeo。该模型拥有丰富的地理知识,能像人类一样跨模态理解地图与地理文本的信息,相关研究成果已被EMNLP、AAAI等国际顶级会议收录。

MGeo像人类一样具备跨模态理解能力,可识别地图元素之间的位置关系

据悉,高德基于MGeo研发了全新的模型,不仅显著提高泛化语义的表示能力,还可准确识别不同地图元素之间的位置关系,有效提升用户的搜索体验。例如,当用户在杭州输入“星光荟对面中国美术”时,MGeo能根据位置关系准确定位到中国美术学院象山校区,而传统BERT模型则给出了错误定位结果;此外,在用户书写有误的情况下,该模型也能匹配正确的结果。该能力已逐步在高德灰度上线。

在四平市搜索“佣兵小区”,高德可准确定位“拥军社区”

达摩院语言技术实验室负责人黄非表示:“地理信息与AI的融合已是业界公认的趋势,但传统AI比如文本处理在地理信息应用场景中有一定局限性 ,我们需要让AI学习人类对于空间信息的理解范式,例如,通过地图中的地理实体以及他们之间的关系来判定地理文本中各个元素的归属以及指向。”

作为最早投入预训练语言模型研究的团队之一,达摩院研发了阿里通义AliceMind,该体系涵盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备阅读理解、机器翻译、对话问答、文档处理等多种能力,该模型体系已斩获36项国际赛事冠军。

德系品质邂逅运动风尚 大众途铠R-Line凭实力圈粉年轻消费群体
在竞争激烈的小型SUV市场中,年轻消费者的需求日益多样化,而大众途铠R-Line凭借其独特的运动风格和个性化设计,迅速崭露头角,成为年轻一代的新宠。底盘调校上,途铠R-Line延续了大众品牌一贯的扎实风格,前…

2026-01-25

马斯克布局太空算力与光伏:200GW产能计划开启天地计算新篇章(附报告)
马斯克在达沃斯论坛宣布,SpaceX与特斯拉计划未来三年内分别在美国建设100GW光伏产能,主要用于太空AI卫星和地面数据中心供能,总规模达200GW,远超市场预期。若没有IPO筹集到的资金,这一目标就很难实…

2026-01-25

中科院吴凡团队128页深度解析:全固态电池技术突破与产业化路径全揭秘
液态负极与硫化物电解质结合,在-20至50摄氏度宽温区稳定工作,30摄氏度下库仑效率达99.7%,能量效率超过96%,为固态电池商业化提供了全新技术范式。提出的液态锂金属负极、应变稳定化理论、干法工艺体系等解…

2026-01-25

阿里通义千问:从智能对话到生活管家,开启一站式AI服务新体验
通义千问这套由阿里巴巴推出的AI大模型系列,已然成了全球领先的开源模型,它可不是单纯的聊天工具,而是集成了好些能力的智能助手,能够处理针对文本、图像、代码等一系列任务,还深度融入了阿里生态,能给用户提供从日常…

2026-01-25