媒体界
行业纵横 资讯速递 科技前沿 企业动态 峰会论坛

苹果再出手,300亿参数AI大模型MM1.5来了!

2024-10-13来源:ITBEAR编辑:瑞雪

苹果公司近期为其多模态大模型MM推出了1.5版本,新版本在延续前代MM1数据驱动训练原则的基础上,着重研究了混合不同类型数据对模型性能的影响。相关模型文档已在Hugging Face上发布,并附有论文链接。

MM1.5版本提供了10亿至300亿多种参数规模的选择,具备图像识别和自然语言推理能力。苹果的研发团队在新版本中改进了数据混合策略,显著增强了模型在多文本图像理解、视觉引用与定位以及多图像推理方面的表现。

根据参考论文,苹果在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,大幅提升了模型对富含文本内容的图像的理解能力。研究团队还在监督式微调阶段分析了不同数据类型对模型性能的影响,并优化了视觉指令微调数据的混合方式,使模型实现了更高的效率,即便是小规模的模型(10亿、30亿参数版本)也能展现出优秀的性能。

苹果公司此次还推出了MM1.5-Video模型,专门用于视频理解,以及MM1.5-UI模型,专注于移动设备用户界面的理解。MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI,它能够处理各种视觉引用与定位任务,总结屏幕上的功能,或者通过对话与用户进行交互。

特斯拉Cybercab遭质疑:双座设计,真的实用吗?
10月13日消息,特斯拉前天发布了名为Cybercab的自动驾驶出租车原型,其双座跑车的设计风格与传统出租车截然不同,令投资者和分析师感到困惑。马斯克表示,他希望Cybercab的运营成本低于公共交通…

2024-10-13

宝马MINI Cooper五门版掀背车,11月15日上市?期待了!
10月13日消息,据懂车帝报道,全新MINI五门燃油版有望于今年11月15日(媒体日)开幕的2024广州车展上市,将继续以进口方式销售。这是MINI品牌最后一款仅提供燃油动力的车型,作为参考,前代MI…

2024-10-13