泰国新闻网XTHAI报道,国产AI大模型DeepSeek的新版本R2发布计划再度引发关注,但这次却伴随着一波“技术坎坷”的小插曲。据悉,DeepSeek原本计划在今年5月推出R2模型,却因在华为昇腾处理器上的训练接连受挫,不得不推迟发布时间。知情人士透露,相关部门曾鼓励DeepSeek继1月R1模型发布后,转而采用华为芯片替代英伟达系统,以推动国产化进程。然而,现实却没那么顺利——即便华为派出了工程师团队驻场支持,DeepSeek依然无法在昇腾芯片上完成模型训练。
无奈之下,DeepSeek最终选择“曲线救国”,转回英伟达芯片进行训练,而华为昇腾芯片则被调整到仅用于推理环节。这样的技术折中方案,虽然让项目得以继续推进,但也直接导致了R2发布时间的延后。据最新市场消息,R2的发布时间窗口可能定在8月15日至30日之间,具体日期仍待确认。
尽管遭遇技术瓶颈,市场对DeepSeek-R2的期待依旧高涨。尤其是在ChatGPT-5已经发布的大背景下,国产AI模型的竞争压力与日俱增。有分析指出,R2将采用先进的混合专家模型(MoE),参数量可能高达1.2万亿,较R1的6710亿大幅提升,同时成本预计比GPT-4低97%,或将对AI服务定价模式带来颠覆性冲击。
更有意思的是,市场似乎早已“嗅到”风声,相关概念股近期表现火爆,比如寒武纪直接涨停,市值突破3550亿元,创历史新高。看来,DeepSeek-R2即便“跳票”,也依然是资本市场的香饽饽。
不过话说回来,这次的芯片风波也让人不禁思考:国产AI技术自主化的路上,究竟是技术优先,还是资源整合更重要?DeepSeek的经历,或许只是这场AI竞赛中一个小小的缩影。未来如何,咱们拭目以待!
加入我们的讨论区 «点我加入»