来源:NVIDIA 技术博客
社区热议:
-
当生成速度接近每用户每秒 1000 token,模型就从对话速度交互迈向「思维速度计算」。 —— NVIDIA 技术博客
-
NVIDIA 用 200 亿美元「许可+挖人」的结构性交易绕过了反垄断审查,四个月内就有了集成进 Vera Rubin 推理栈的系统概念。 —— Dylan Patel(SemiAnalysis)
-
黄仁勋宣布:到 2027 年我看到至少 1 万亿美元的 AI 计算需求,实际上我们甚至可能面临供应短缺。 —— Jensen Huang(NVIDIA CEO)
-
Vera Rubin 实现两年 350 倍加速;Groq 填补了超高速推理的空白。 —— panewslab.com
-
每个数据中心每个工厂本质上都受电力限制。1GW 的工厂永远不会变成 2GW——在固定电力下,谁的每瓦吞吐最高,谁的生产成本就最低。 —— Jensen Huang(Token 工厂经济学)
海外技术社区热点采集。