相关资讯
AI 摘要
英伟达主任工程师陈源博士发文称:De­e­p­S­e­ek是用模型蒸馏技术做出来的,它是通过已有的大模型蒸馏出小模型,再用少量数据对这些小模型进行微调而成。(by NVIDIA ( 英伟达 )主任工程师,硅谷陈源博士)兼听则明。推特上这篇关于DeepSeek的分析非常全面和很...
254万热度
·
·
·
2025年2月02日
·
AI 摘要
DeepSeek做了PTX级别的优化不意味着完全脱离了CUDA生态,但确实代表他们有优化其他GPU的能力。来自Mirae Asset Securities Research的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。
AI 摘要
近日,复旦大学微电子学院官网更新显示曾在美国苹果公司担任首席工程师的孔龙已入职复旦大学,担任研究员、博导,职称为正高级。...
39W
·
·
·
2025年3月30日
·
AI 摘要
据悉,航天员王浩泽是中国目前唯一的女航天飞行工程师,也将是中国第三位执行载人航天飞行任务的女性。
166W
·
·
·
2024年10月29日
·
相关榜单
热点推荐
换一批