黄仁勋的Token经济学

来源:@经济观察报微博

黄仁勋的Token经济学

记者 郑晨烨

素有AI行业年度风向标之称的英伟达GTC大会,今年3月16日至19日在美国加利福尼亚州圣何塞举行 。

黄仁勋的Token经济学

当地时间3月16日上午11点 ,也就是北京时间3月17日凌晨2点,英伟达CEO黄仁勋在圣何塞SAP中心发表了超过两小时的主题演讲。

黄仁勋在演讲中预测,到2027年全球AI基础设施相关需求将达到1万亿美元。他还说 ,实际需求可能会比1万亿美元高得多 ,英伟达的产品甚至会供不应求 。

这个数字发布后,英伟达美股股价瞬时跳涨超过4% 。但几个小时后A股开盘,算力产业链股票集体下跌 ,天孚通信(300394.SZ)收盘跌幅超10%,长光华芯(688048.SH)收盘跌幅亦达9.72%,多数龙头股回吐了近5日涨幅。

一边是万亿美元预期 ,一边是产业链股票大跌,落差来自时间尺度。

黄仁勋讲的是未来的需求预期,而他预告的下一代Feynman芯片架构要到2028年才上市 。另外 ,万联证券在3月16日发布的研报中指出,A股电子板块截至3月15日的平均市盈率约为82倍,市场或在担心“高处不胜寒”。

但黄仁勋的这场演讲值得仔细看的地方不在于万亿美元这个数字本身 ,而在于他用两个小时讲了一套新的商业逻辑:数据中心正在从训练模型的地方,变成生产Token的工厂。

Token工厂

Token是大语言模型处理信息的基本单位,可以粗略理解为AI处理或生成的文字片段 ,一个汉字大约对应一到两个Token 。

过去两年 ,Token的消耗量发生了几次量级上的跳跃。

黄仁勋在演讲中把这件事追溯到了三个节点:2022年底ChatGPT上线,AI学会了生成内容,开始大量消耗Token;ChatGPT o1模型出现后 ,AI学会了推理和反思,为了思考,它要在内部生成大量Token给自己看;Claude Code(Anthropic公司开发的AI编程工具)发布后 ,AI能读取文件 、编写代码、编译测试,每完成一个任务消耗的Token比简单对话多出好几个数量级。

黄仁勋提到,英伟达所有的软件工程师都在用AI辅助编程 。

AI的工作分两个阶段:训练是让模型变聪明的过程 ,需要花一次大钱把模型练出来;推理是模型干活的过程,每天都在发生,需求也越来越大。过去全球买GPU(图形处理器 ,目前AI计算的核心硬件)主要是为了训练,现在重心已经在向推理转移。

黄仁勋说,推理服务商的业务规模过去一年增长了100倍 。IDC中国分析师杜昀龙也告诉经济观察报记者 ,目前国内推理服务器不论增速还是占比均已超过训练 ,从服务器出货金额来看,推理占比已接近60%。

推理的需求在爆发,但Token还没有形成市场定价体系。

黄仁勋在演讲中给出了他认为未来会出现的五档价格:免费层 ,Token产出量大但响应速度慢;中等层,每百万Token约3美元;高级层,每百万Token约6美元;高速层 ,每百万Token约45美元;顶级层,每百万Token约150美元 。模型越大、上下文越长 、响应速度越快,Token就越贵 。

他以顶级层举了个例子:一个研究团队每天用5000万Token ,按每百万Token150美元来算也就只有7500美元,对企业来说不算什么。上下文窗口从32K个Token拉到400K个Token之后,AI能一次性读完一整份合同或一整个代码库 ,价格对应的是此前做不了的事情。

有了分层定价,数据中心的经济模型就变了 。

黄仁勋说,每一座数据中心都受电力限制 ,一座1GW(吉瓦 ,一种电力计量单位)的数据中心永远不会变成2GW,这是电力和土地决定的。在固定功率下,谁消耗每瓦电力能产出的Token最多 ,谁的生产成本就最低。也就是说,同样耗一度电,谁能生产更多Token ,谁就能赚得更多 。

他在演讲时展示了一组数字:同一个1GW数据中心,假设把算力分配给不同价格层级,使用英伟达当前的Blackwell架构年营收约300亿美元 ,换成新一代Vera Rubin约1500亿美元,再加上Groq LPU推理加速器约3000亿美元。同一座数据中心,换一套设备 ,营收可以相差10倍。

英伟达2026财年全年营收2159亿美元,数据中心业务贡献了其中的1937亿美元 。

按黄仁勋的逻辑,客户现有的数据中心还没有被充分利用 ,换上新一代设备 ,同样的电力条件下收入可以翻好几倍。万亿美元预期就是这么来的,不是芯片涨价,是同样的电力能生产出更多 、更贵的Token。

黄仁勋说 ,未来每一位CEO都会盯着自己Token工厂的效能,因为那直接就是收入 。

他还描述了一个正在硅谷出现的变化:现在越来越多工程师日常用AI写代码、做研究、处理文档,这些操作都要消耗Token ,企业需要为员工使用AI的开销买单。

黄仁勋预测这笔开销会大到需要单独列预算,就像企业给员工配电脑和软件一样。

他还说,未来每个工程师入职时都会拿到一份年度Token预算 ,金额大约相当于基础薪资的一半 。

两种芯片

黄仁勋的这套Token经济学对应的硬件,是GTC上正式发布的Vera Rubin平台 。

黄仁勋在演讲中说,过去谈Hopper架构的时候他会举起一块芯片 ,但Vera Rubin不是一块芯片的事,它是一整个系统。这套系统做到了百分之百的液冷,安装时间从过去的两天压缩到了两个小时。

Vera Rubin由七款芯片组成 。核心机架NVL72集成72颗Rubin GPU和36颗Vera CPU ,通过NVLink 6(英伟达自研的芯片间高速互连技术)相连。与上一代Blackwell相比 ,每瓦推理吞吐量最高提升10倍,单Token成本降至十分之一。

英伟达同时发布了全新88核Vera CPU,为AI智能体场景下的工具调用和数据处理做了专门优化 。

黄仁勋在演讲中称 ,微软CEO纳德拉已向他确认,首批Vera Rubin机架已在Azure(微软的云计算平台)上运行。

但Vera Rubin有一个短板,黄仁勋在演讲时说 ,当每个用户每秒需要生成超过400个Token时,NVL72的带宽就不够用了。补上这个缺口的,是Groq这家成立于2016年的美国AI加速芯片公司 。英伟达此前收购了Groq的技术授权和核心团队。

Groq的LPU(语言处理单元)和GPU是完全不同的两种芯片。GPU内存大 、算力强 ,单颗Rubin GPU有288GB内存,适合处理复杂计算 。LPU内存小但读写速度极快,单颗只有500MB存储 ,装不下大模型的完整参数,但生成Token的速度和延迟远优于GPU。

英伟达通过一套叫Dynamo的推理调度软件,把推理过程拆成了两步:需要大量算力和内存的上下文理解交给Vera Rubin处理 ,对延迟敏感的Token生成交给Groq LPU。两者通过以太网高速连接协同工作 ,延迟减少约一半 。

黄仁勋管这种方式叫解耦推理(即把推理过程拆分给不同芯片处理),核心想法是承认高吞吐和低延迟天然矛盾,不如让两种芯片各干各擅长的事 。

他说 ,这套组合在45美元和150美元的高价格层级实现了相比上一代35倍的性能提升。

从更长的时间维度看,同一个1GW的数据中心,两年时间 ,Token生成速率可以从每秒2200万提升到7亿。

黄仁勋给客户的建议是,如果工作以高吞吐的批量推理为主,就完全用Vera Rubin;如果有大量编程、实时交互等需求 ,可以拿出25%的数据中心算力配Groq LPU 。

黄仁勋表示,Groq 3 LPU由三星代工,已在量产 ,预计今年三季度出货。

软件方面,英伟达发布了企业级智能体平台NemoClaw,支持近期火爆的开源项目OpenClaw。OpenClaw在几周之内成为GitHub(全球最大的开源代码托管平台)上增长最快的开源项目 ,黄仁勋把它的地位抬到和Linux同一级别 ,说它是智能体计算机的操作系统 。

但企业环境下直接用开源的OpenClaw有安全风险,因为智能体可以访问公司的敏感数据、执行代码和外部通信。NemoClaw就是英伟达给OpenClaw加上的企业安全层。Adobe 、Salesforce、SAP等17家企业软件公司已宣布采用英伟达的Agent Toolkit(智能体开发工具包) 。

路线图方面,英伟达预告了2028年上市的下一代Feynman架构 ,首次同时支持铜缆和CPO(将光通信元件直接集成到芯片上的技术)两种互连方式。

今年也是CUDA(英伟达开发的GPU通用计算平台,被视为英伟达软件生态的基石)诞生20周年。据黄仁勋在演讲中介绍,英伟达目前60%的业务来自全球前五大云服务商 ,另外40%分布在主权AI、企业 、工业、机器人等各个领域 。

在本次GTC大会上,英伟达还宣布了与Uber、比亚迪 、吉利、现代、日产 、五十铃在自动驾驶领域的合作。受此消息推动,港股汽车板块17日集体走强 ,吉利汽车(00175.HK)盘中一度涨超5%,最终收涨4.55%。

本文来自作者[一心只为一人]投稿,不代表点新号立场,如若转载,请注明出处:https://www.dxalshfzz.com/cshi/202603-1007.html

(40)

文章推荐

  • 原油:美油创纪录最大周涨幅 伊朗战事持续冲击能源供应

      美国原油价格录得有纪录以来最大单周涨幅,因伊朗战事扰乱关键能源市场流动,经由霍尔木兹海峡的航运几乎全面停摆。  WTI周五上涨12%,收于每桶91美元下方,创下近六年来最大单日涨幅。  布伦特原油收于接近每桶93美元。  伊朗警告称,如果欧盟参战,将成为伊朗报复的“合法”目标。  因储存

    2026年03月07日
    56313
  • 大宗商品指数飙升至历史新高 战争引发石油、金属等普涨

      周五石油引领大宗商品市场全面反弹。伊朗战争引发的混乱波及全球,同时也影响了金属供应。  商品现货指数跃升3.7%,创下历史新高。这也是该指数自2022年7月以来的最大单日涨幅。  由于通过霍尔木兹海峡的船舶交通几乎完全陷入停滞,美国原油期货创下史上最大单周涨幅。西德克萨斯中质原油(WTI)周

    2026年03月07日
    55322
  • 租房合同陷阱避雷指南(常见的租房合同猫腻)

    本文目录一览:1、杭州租房避雷指南!!!2、大理租房避雷指南:10个细节让你远离不讲信用房东3、法官“拍了拍”你:送你一份租房合同避雷指南4、血的教训!租房一定要避雷5、【租房不再是噩梦】佛山打工人的租房自救指南杭州租房避雷指南!!!选择正规中介:通过正规中介租房可以

    2026年03月08日
    62316
  • 下周影响市场重要资讯前瞻:CPI、PPI数据发布在即,成品油将迎调价窗口,多个行业盛会将陆续召开

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  【重磅新闻】  CPI、PPI数据发布在即  3月9日,国家统计局将公布2月CPI、PPI数据。此前数据显示,1月,居民消费需求持续恢复,CPI环比上涨0.2%,同比上涨0.2%,扣除食品和能源价格的核心CPI同比

    2026年03月09日
    56307
  • 宁德时代拟10派69.57元!大额分红来了

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  3月9日晚,宁德时代发布2025年年报。年报显示,2025年,公司实现营收约4237亿元,同比增长17.04%;归属于上市公司股东的净利润约722亿元,同比增长42.28%。  同时,公司披露2025年年度利润分配预

    2026年03月10日
    52305
  • 鹰王重生培训每日心得分享(鹰王重生具体步骤)

    本文目录一览:1、企业培训总结企业培训总结我推荐培训总结精辟句子如下:培训是成长的阶梯,实践是检验真理的唯一标准。知识改变命运,技能决定未来,培训只是开始。学习是为了更好地实践,别让学到的知识躺在脑袋里睡大觉。培训只是加油站,真正的比赛在实践中。理论是基础,实践是关键,用心去做才能

    2026年03月11日
    52313
  • 欧盟据悉考虑放宽碳配额规则并扩大国家援助 以遏制电价飙升

      据知情人士透露,欧盟委员会考虑放宽碳排放配额供应规则,并允许提供更多国家援助,以作为应急方案的一部分来遏制电价飙升。  因讨论未公开信息而要求匿名的知情人士表示,欧盟委员会还在研究是否暂时放宽企业获得免费排放配额的规定,同时允许降低电网费用和能源税。  欧盟委员会将于3月19日在布鲁塞尔举行

    2026年03月13日
    48303
  • 东京电力将推迟柏崎刈羽核反应堆商业启动

      东京电力公司周五宣布,由于输电系统出现轻微泄漏,柏崎刈羽核电站的商业运营启动可能会推迟。  东京电力公司宣布已决定暂停该电站6号机组的输电。电力泄漏是由6号机组的警报器检测到的。  该公司一位发言人表示,该公司原计划于3月18日重启商业运营,但现在需要时间“调查此问题”。目前尚不清楚此次延迟

    2026年03月14日
    59300
  • 特朗普顾问建议美国“宣布胜利并从伊朗脱身”

      特朗普的一位白宫亲密顾问建议,美国是时候想办法找到从伊朗冲突中脱身之计了。  特朗普的人工智能和加密货币顾问大卫·萨克斯近日在他共同主持的播客节目《All-In》中说道:“我们应该想办法找到脱身之计。现在是宣布胜利并撤军的好时机。然而,你会看到有一部分人,我认为主要是共和党人,但也不全是,他们

    2026年03月14日
    50318
  • 家电维修上门费合法吗(家电维修上门费和维修费)

    本文目录一览:1、空调上门啥也没干收了50-没有维修收上门费是否合法2、家电维修师傅上门维修要上门费合理吗3、啄木鸟维修上门就拆开看了下没有维修怎么收费704、电器上门维修,上门费合理吗,要注意什么5、空调上门啥也没干收50合理吗?空调上门啥也没干收了50-没有维修收上

    2026年03月15日
    56312
  • 中东地区冲突升级引爆避险潮(中东爆发)

    本文目录一览:1、中东战火引爆避险股票代码2、避险情绪爆发:市场如何解读最新中东冲突?3、中东战火对a股影响有多大?4、中东大战一旦爆发,后果会怎样?5、中东大规模冲突,黄金猛烈上攻中东战火引爆避险股票代码中东战火引爆的避险相关股票代码主要涉及石油/油服类、黄金/贵金

    2026年03月16日
    48304
  • 欧洲债市:油价上涨促使交易员提高加息押注

      由于伊朗能源设施遭袭加剧了人们对通胀冲击长期化的担忧,货币市场提高了对欧洲央行和英国央行加息的押注,德国国债和英国国债收益率曲线熊市走平。2年期德国国债收益率触及2024年8月以来的最高水平。  德国、英国和法国2年期国债跑输美国国债,收益率上涨6-7个基点。  债券市场当日开盘走强,收益率

    2026年03月19日
    39303

发表回复

本站作者才能评论

评论列表(3条)

  • 一心只为一人的头像
    一心只为一人 2026年03月17日

    我是点新号的签约作者“一心只为一人”

  • 一心只为一人
    一心只为一人 2026年03月17日

    本文概览:来源:@经济观察报微博 记者 郑晨烨 素有AI行业年度风向标之称的英伟达GTC大会,今年3月16日至19日在美国加利福尼亚州圣何塞举行。 当地时间3月16日上午11点,也就是北...

  • 一心只为一人
    用户031710 2026年03月17日

    文章不错《黄仁勋的Token经济学》内容很有帮助