zbo智博1919com

起源:LCK取缔奖金,选手集体喝风作者

起源:LCK取缔奖金,选手集体喝风作者: 吴承修:

DeepSeek V4一颁布,,,黄仁勋的预言成真了

"一旦DeepSeek率先在华为平台上颁布,,,对美国而言将是苦难性的了局"。。

这里的"我国"指美国

这不是托尼说的,,,而是英伟达黄仁勋在某个播客上的原话。。如今DeepSeek V4的出现,,,让老黄的预言成真了???

作为各人苦等了一年多的 DeepSeek 大版本迭代,,,只看机能差友们可能会略有绝望。。但 DeepSeek V4 是真便宜,,,价值对比国外模型直接腰斩属因而。。

关于模型的具体内容,,,在白日的文章中已经提到,,,就不反复了。。

但托尼感触,,,随着这次颁布,,,意思更重大的,,,是深度求索选择在华为昇腾平台上进行首发,,,结合下午的直播,,,这意味着 DeepSeek 实现了在国产硬件上的训练适配。。

凭据网友爆料,,,这次最先支持国产硬件训练的是 DeepSeek V4 Flash 的后训练过程,,,基于国产硬件的预训练也有望在今年下半年实现。。

换句话说,,,从今天起头,,,各人嚷嚷了很久的 AI 全流程使用国产硬件,,,一下子就实现了!

各人能够把华为的昇腾平台理解为连 AI 芯片都是国产的 AI 推算平台。。

如果一年以前有人跟我说,,,纯国产的AI平台可能支持一款旗舰模型的全链路研发,,,托尼我也不敢相信。。

但此刻它就是成了,,,这对于国产AI的发展影响是很深远的。。

之前老黄没少拿这个事儿游说美国当局 让自己卖货 ,,,依照老黄的意思,,,在 AI 军备较量中,,,从底层的电力,,,冷却,,,消防这些基础设施,,,到芯片、服务器等算力设施,,,再到软件生态和模型的架构演进,,,这些身分都缺一不成,,,样样都赢能力赢麻到最后。。

AI 是一块“五层蛋糕” - NVIDIA 博客- 英伟达

而咱们的优势,,,无疑是祖国壮大的基建能力,,,以及充足的人才储蓄。。这些能让我们打造出好多高性价比的模型。。

但不得不认可,,,zbo智博1919com芯片制程离世界顶端,,,的确有些差距。:迷 AI 必要的芯片,,,打的是规模战、集群战。。所以工程师们想了些法子,,,来解决制程上的不及。。

一来,,,固然制程工艺有限度,,,但芯片能够在不计成本的情况下,,,通过暴力堆规模,,,来提升算力。。而在配套的内存上,,,国产也有自研 HBM(高带宽内存),,,来保障带宽没有瓶颈。。

二来,,,固然单颗芯片机能有限,,,但架不住量大管饱啊,,,把大量的芯片利用起来,,,组合成一个"推算中心",,,塞进机柜里,,,其实就是这两年火热的超节点。。

超节点的概念就是英伟达提出的,,,老黄也做了相应的布局,,,NVL72 系统把 72 个Blackwell GPU 集成到一个液冷机柜中,,,达成了约 180 PFLOPs 的 FP16 算力。。

而国产芯片们想要堆出近似算力,,,就必要拿出更多的芯片。。所以去年华为昇腾拿出了 384 超节点,,,通过 12 个机柜,,,每个机柜 32 张卡,,,硬是堆出 300 PFLOPs 算力,,,靠近 NVL72 的两倍了。。而今年差评更是在 MWC 现场看到了华为最新的 Atlas 950,,,也就是 8192 卡互联的超节点。。

可最严重的一环,,,其实是生态。。

托尼不得不认可,,,老黄是真有远见的。。20年前,,,英伟达就起头为了 CUDA 生态埋伏笔,,,甚至就义掉了 GeForce 游戏显卡的利润,,,导致有一段功夫差点在和 ATi/AMD 的竞争中死掉。。

但英伟达成功熬到了平明。。所以差友们能看到,,,此刻险些所有 AI 有关的基础模型和优化都基于 CUDA 来运行、后起的 GPU、TPU 等 AI 推算生态都要向它低头。。

甚至蕴含之前 DeepSeek 亲手打造的护城河之一:PTX 底层说话优化,,,也是为了把NVIDIA GPU 的机能榨干,,,让模型效能更高,,,从而让 DeepSeek 模型更有性价比。。

也因而,,,对于国内来说,,,在制裁的大布景下,,,不论是华为昇腾的 CANN,,,还是摩尔线程的 MUSA,,,目前还要做对 CUDA 的兼容性支持,,,来让开发者能更快适应自家芯片。。

但咱们也不能一向活在别人屋檐下。。构建属于自己的软件生态,,,火烧眉毛。。所以最近几年托尼也起头看到像 TileLang 这类由中国主导的生态项目,,,尝试在分歧的方向构建出属于自己的护城河。。

就是这些项目对于 CUDA 生态来说,,,并没有什么伤筋动骨的攻击性。。

直到这次的 DeepSeek V4 更进一步,,,直接回绝了英伟达和AMD的提前适配,,,而是选择华为昇腾和国产 CANN 软件生态。。

也就是说,,,这次DeepSeek想要表白的其实是:不用美国的芯片和技术,,,我们自己也能做出足够先进的大模型。。

托尼不得不感伤深度求索的这波操作:一方面是真的争气,,,另一方面,,,其实也是在把 DeepSeek 造成一个标杆,,,向其他国产大模型喊话:全国产链路已经跑通了,,,你们都能够来试试。。

除此之外呢???还有什么理由让国产模型拥抱国产 AI 硬件生态吗???

最近一个月各人应该有感知,,,大模型的能力越来越强,,,强到已经不只是能对话的水平了。。

前段功夫 Anthropic 颁布的 Mythos 模型,,,就号称"强到不敢直接颁布",,,而是首先交给苹果、英伟达、微软等巨头,,,用来检测安全缝隙,,,加强网络防御。。

也就是说,,,AI 已经不仅仅是一个对话窗口,,,一个效能工具,,,一个智能助手。。将来甚至此刻的模型,,,已经进化到能够在网络安全层面进行攻防了。。这意味着 AI 已经从通常人使用的工具,,,成长为国度之间攻防的矛与盾。。

不论若何,,,从硬件到软件,,,从模型到生态,,,全链路国产化,,,是必必要做的。。这样能力真正不被英伟达等国外公司卡脖子。。

当英伟达的GPU不再是唯一选择,,,当CUDA 护城河不再牢固,,,当咱们的AI人才越来越多,,,生态越来越繁华,,,产业界的底气天然也会越来越足。。

回头看DeepSeek V4颁布公告的实现语:不诱于誉,,,不恐于诽,,,率道而行,,,端然正己,,,这不仅是对国内AI公司该当实事求是的宣言,,,更是对国产AI硬件生态,,,这么多年一步一步走过来的注定。。

老黄的预言,,,或许已经成为现实。。

撰文:洛洛

编纂:米罗 & 面线 & 结界

美编:焕妍

图片、资料起源:

英伟达官网

@黄丽名:和记娱乐足球,,,象棋手用手机软件舞弊被禁赛一年
@陈香伦:我国有几多流失文物能被追回
@林国菁:黄埔海关初次截获活体帝王蝎

【网站地图】