媒体界
行业纵横 资讯速递 科技前沿 企业动态 峰会论坛

国产大模型超顶!文心一言中文理解、数学拿下全球第一

2024-04-24来源:互联网编辑:汪淼

由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0中文理解、数学等多能力全球第一。

图片

评测显示,文心一言4.0表现优异,在中文推理、中文语言等评测上遥遥领先,和其他模型拉开明显差距。中文理解上,文心一言4.0领先优势明显,领先第二名GLM-4 0.41分,GPT-4系列模型表现较差,排在中下游,并且和第一名文心一言4.0分差超过1分。

在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一; GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中,明显落后第一梯队;而在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

在企业选择大模型最看重的安全性评测上,国内模型文心一言4.0表现亮眼,力压国际一流模型GPT-4系列模型和Claude-3拿下最高分(89.1分),Claude-3仅列第四。

科大讯飞年度报告显示:营收增长但扣非净利润大跌 股价应声下跌
【媒体界】4月23日消息,科大讯飞股份有限公司近日发布了其《2023年年度报告》,全面披露了公司去年的业绩情况。报告显示,科大讯飞在2023年实现了营收196.5亿元,同比增长4.41%,显示出公司在激烈的市场竞争中仍保持了稳健的增长态势。值得关注的是,尽管营收有所增长

2024-04-23

Vision Pro热度不再:苹果VR设备遭遇挑战
【媒体界】4月22日消息,彭博社知名记者马克・古尔曼(Mark Gurman)近日在报道中指出,苹果的Vision Pro头显设备在上市初期曾引起热烈反响,用户纷纷涌向实体店进行预约体验。然而,随着时间的推移,这款VR设备的热度似乎正在迅速消退。据媒体报道,苹果零售店内Vision P

2024-04-22

可立享无线视频会议一体机上市成功!
近年来全球兴起混合办公模式潮流,远程协作与视频会议成为趋势,AI技术进一步优化会议体验。作为无线协作技术的领导者,巴可积极打造引领市场趋势的产品与方案,于4月17日在北京infoComm China展会上,隆重举行可立享无线视频会议一体机发布会,正式在中国市场首发一体

2024-04-19

AI技术加持,极空间Z4Pro与绿联DX4600Pro,哪款NAS相册功能更懂你?
当前正值出门旅游的好季节,拍照自然是少不了的,而手机内存有限,因此大多数人都会依靠NAS进行图像备份保存,但NAS光有储存是远远不够的,还要为用户提供优质的相册管理服务,让用户登进NAS就能看到一个个清晰有条理的相册,翻看查找图像也更方便些。而如今AI技术越来

2024-04-18

曹操出行构建MSW安全体系,以智能技术为司乘体验护航
“道路千万条,安全第一条”。作为城市交通的重要参与者,网约车平台是司乘安全的重要保障者,应不断夯实平台责任,筑牢安全底线。近日,曹操出行积极响应行业安全标准建设,创新构建MSW安全应急体系,全面提升司机和乘客的出行体验。这一体系的建立,将进一步加强平台

2024-04-17