起源:快来救救凑企鹅作者: 林冠希
词元驱动AI推理侧发作 国产芯片迎代替黄金窗口
在近期进行的GTC 2026大会上,有关行业概念引发了市场沉思。。。AI产业的重心正在从“训练模型”向“推理当用”转移,将来每一秒钟、、每一次交互,背后都是海量Token的天生与亏损。。。而近期中国发展高层论坛2026年年会上,国度数据局为Token正式定名——“词元”,并明确有关定位:“词元”不仅是智能时期的价值锚点,更是衔接技术供给与贸易需要的“结算单元”。。。中国日均词元挪用量在2026年3月已突破140万亿,今年度三个月功夫又增长40%以上。。。
词元产业的利用与发展趋向,或决定了近期半导体周期的发展态势。。。当市场的焦点还停顿在英伟达新一代GPU的市场阐发与行业格局时,一个深刻的变动正在产生:推理侧的需要,正以远超训练侧的速度膨胀。。。这一变动,不仅重塑了AI算力的结构,也有望为中国半导体产业链及科创50有关领域,带来了相应的发展空间。。。
从前两年,AI算力的主题驱动力是“训练”——巨头们比拼的是谁能用最多的芯片、、最快的速度,训练出参数更大的模型。。。这种模式对芯片的要求近乎刻薄:最先进的制程、、最高的单卡算力、、CUDA生态利用较为宽泛等,英伟达在该阶段占据较高市场利用份额。。。
但当AI进入利用发作期,逻辑产生了底子转变。。。推理,这个将模型能力转化为现实服务的过程,起头占据算力亏损的主导职位。。。与训练分歧,推理场景追求的是“综合成本最低”与“能效比最优”。。。在一个AI客服、、视频平台等规;;睦贸【爸,选取高成本的高端GPU发展全数推理工作,经济性与实用性相对有限。。。这为国产算力提供了重要方向,推理侧的芯片需要出现出了分层的特点:在金融高频买卖、、自动驾驶决策等高端场景,对芯片机能要求较高;;但在占据绝对无数份额的海量推理场景——好比互联网搜索、、内容天生、、企业级利用——主题诉求已转变为“够用、、便宜、、不变”。。。而这刚好是国产芯片通过架构创新(如ASIC、、LPU)和成本优化具备发展潜力的领域。。。
更重要的是,国产芯片的“可用性”正在逐步被验证。。。众多国产算力厂商产品在FP8算力等关键指标上不休优化提升,且在算力生态上正加快适配国产大模型。。。当推理需要起头放量,下游利用厂商为了节制成本和保险供给链不变,偏差于选取性价比更优的国产规划。。。
@何依洁:威尼斯人网址多少啊,弟弟跌倒前被姐姐猛拽一幕太帅了@朱予义:Links|我做了一件从来没有人做过的事
@林佳湖:300斤男医生走红 曾一年猛涨100斤