AI 摘要
前往原文
本轮测量推理吞吐量的MLPerf Inference v5.0测试中,CoreWeave、英伟达和IBM使用2496块GB200 Blackwell芯片,构成MLPerf基准测试中规模最大的英伟达GB200 NVL72集群。在基准测试套件中最大、最复杂的Llama 3.1 405B基础模型训练中,该集群仅用27.3分钟就完成整个流程,相比相似规模集群测试提交结果,训练性能提升超过两倍。
相关资讯
AI 摘要
本轮测量推理吞吐量的MLPerf Inference v5.0测试中,CoreWeave、英伟达和IBM使用2496块GB200 Blackwell芯片,构成MLPerf基准测试中规模最大的英伟达GB200 NVL72集群。在基准测试套件中最大、最复杂的Llama 3.1 405B基础模型训练中,该集群仅用27.3分钟就完成整个流程,相比相似规模集群测试提交结果,训练性能提升超过两倍。
AI 摘要
测试结果显示,相比前代英伟达Hopper GPU,GB200 NVL72服务器能帮助Cohere在1000亿参数模型的训练实现高达3倍的性能提升,此外,IBM和Mistral AI也已成为CoreWeave GB200云服务的首批用户。
AI 摘要
摩根大通认为,散热和高电压等问题在新产品引入过程中较为常见,预计不会对大规模生产计划造成实质性影响,2025年一季度Blackwell 系列GPU将占上游GPU生产的半数以上。
AI 摘要
在美国爆火的个股杠杆和反向ETF在港股上市了,不用熬夜就能交易英伟达、特斯拉、MicroStrategy等热门美股两倍涨跌,而且当DeepSeek震撼AI市场、特朗普政策牵动全球时,亚洲投资者可以抢先一步利用信息差抓住美股暴涨暴跌的机会。
AI 摘要
英伟达GB200 AI服务器机架的过热及液冷泄漏等关键技术难题已解决,富士康等合作伙伴确认,GB200机架已于第一季度末开始出货,目前产能正快速爬升。该突破缓解了市场担忧,为周三财报注入信心。
AI 摘要
此前就有海外科技博主预测,英伟达即将发布的新版显卡,其GPU性能,又要提升一大截。而在今天的演讲中,黄仁勋发布了英伟达RTX 50系列显卡。按英伟达的说法,RTX 5090整体性能是上一代RTX 4090的两倍。
73W
·
·
·
2025年1月08日
·
AI 摘要
英伟达新 AI 芯片 GB200 被曝因设计缺陷「跳票」至少 3 个月;马斯克展示 SpaceX 首台 Raptor 3 引擎;传漫威内部大清洗
0W
·
·
·
2024年10月24日
·
AI 摘要
GB300相比GB200,综合性能、可维护性、定制灵活性等方面都有明显改善。GB300的成功量产,是真正的里程碑时刻,意味着NVL机柜这种跨时代产品,真的被英伟达“完全工程化实现”了。
相关榜单
热点推荐
换一批