媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

阿里通义实验室发布Fun-ASR1.5大模型:多语言方言精准识别,古诗词转写无压力

2026-04-21来源:快讯编辑:瑞雪

阿里通义实验室近日宣布,其自主研发的语音识别大模型Fun-ASR1.5已正式面向公众开放使用。这款模型突破了传统语音识别工具在多语言场景下的应用局限,通过统一的底层架构设计,实现了对全球30种语言的广泛支持,同时深度覆盖汉语七大方言体系及超过20种地方口音的精准识别。

在技术验证阶段,Fun-ASR1.5展现出显著的性能优势。实验室测试数据显示,针对方言场景的识别任务中,该模型较前代版本字错误率(CER)降低56.2%,其中5种方言的识别准确率突破90%阈值,另有15种方言的准确率达到80%以上。特别值得关注的是,模型对古诗词吟诵等特殊语音场景的转写能力达到行业领先水平,能够准确捕捉韵律特征与文化语境。

该模型的创新性体现在其跨语言处理机制上。研发团队通过构建多维度语音特征库,使模型能够自动适配不同语言的声学模型与语言模型,无需针对特定语种单独训练。这种设计不仅降低了多语言应用的开发成本,更显著提升了模型在混合语言场景下的识别稳定性。目前,Fun-ASR1.5已支持包括粤语、吴语、闽南语等在内的汉语方言体系,以及英语、法语、阿拉伯语等国际主流语言。

新能源锂电池行业:S7-200 PLC借以太网模块实现与触摸屏及MES系统高效通讯
项目核心需求:将烧结炉的温度、升温速率、保温时间等关键工艺数据实时上传至工厂MES系统,满足生产追溯与质量管控要求;保留原有触摸屏本地操作功能,确保通讯互不干扰;无需修改PLC程序,实现快速部署;适配车间高…

2026-04-20

上海发力产业互联网:2028年将构建“10+20+X”标杆平台体系
上海市经济和信息化委员会等部门印发《上海市推动产业互联网平台赋能产业发展行动方案(2026-2028年)》。其中提到,聚焦新能源汽车、电子信息、集成电路、具身智能、先进材料等产业链发展需求,发挥产业互联网平…

2026-04-20

谷歌A2UI 0.9发布:为AI智能体打造统一UI设计标准 助力交互体验升级
来源:环球网 【环球网科技综合报道】4月20日消息,据The Decoder报道,谷歌近日正式推出生成式UI设计标准A2UI 0.9,为AI智能体构建用户界面元素提供统一规范,支持从现有应用组件中调用资源,…

2026-04-20

阿里“秒悟”亮相后,上海“灵珠”来袭,零门槛AI创作谁更能精准还原创意?
灵珠页面显示,这是一个零门槛的AI创作平台:只需在网页中输入创意想法,喝杯咖啡的时间,即可生成可实际操作的产品,如小应用、游戏、PPT、海报及旅游攻略等。去年起,Vibe Coding(氛围编程)的风吹到…

2026-04-20