媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

Meta四路并进,深研DeepSeek欲升级Llama大模型

2025-01-27来源:ITBEAR编辑:瑞雪

近期,据Information网站报道,meta公司,即Facebook的母公司,已成立四个专项研究团队,深入探索国产大模型DeepSeek的核心机制。此举旨在通过分析DeepSeek的工作原理,来优化meta自家的大模型Llama。

值得注意的是,就在不久前,DeepSeek-R1推理大模型正式面世。据官方披露,DeepSeek-R1在后训练阶段大规模运用了强化学习技术,即便在标注数据极为有限的情况下,也显著提升了模型的推理能力。在数学、代码编写以及自然语言推理等多项任务上,DeepSeek-R1的性能已可媲美OpenAI的GPT-1正式版。

更令人瞩目的是,Deepseek应用在发布后迅速走红,不仅在中国地区的苹果应用商店免费下载排行榜上夺得榜首,更是在美国地区的应用商店免费下载榜上超越了ChatGPT,展现出强大的市场吸引力和用户基础。

高盛大幅上调闪迪目标价,NAND供需紧张
近日,全球知名投行高盛的一则研报在金融市场掀起波澜——其将存储芯片巨头闪迪的目标价从140美元直接上调至280美元,维持“买入”评级。这一激进动作背后,是NAND闪存行业供需格局的剧烈变化,以及闪迪最新财报释放的超预期信号。

2025-11-13

AMD:未来三到五年获利或超3倍,数据中心业务冲刺千亿美元
近日,处理器行业巨头AMD在美国纽约举办了分析师日活动,这是其近三年来首次举办此类活动。会上,AMD对外公布了乐观的财务预期及市场展望,预计未来

2025-11-12