AI 摘要
前往原文
混元T1正式版沿用混元Turbo S架构,是工业界首次无损应用混合Mamba架构的超大型推理模型,在可比参数量下的解码性能高于行业2倍,首字秒出,吐字速度60至80 token/秒,擅长超长文处理。在体现推理模型基础能力的公开基准测试中,混元T1达到业界领先水平,其中逻辑推理测试得分93.1,高于OpenAI的o1、GPT 4.5和DeepSeek的R1。
相关资讯
AI 摘要
混元T1正式版沿用混元Turbo S架构,是工业界首次无损应用混合Mamba架构的超大型推理模型,在可比参数量下的解码性能高于行业2倍,首字秒出,吐字速度60至80 token/秒,擅长超长文处理。在体现推理模型基础能力的公开基准测试中,混元T1达到业界领先水平,其中逻辑推理测试得分93.1,高于OpenAI的o1、GPT 4.5和DeepSeek的R1。
AI 摘要
《哪吒 2》杀入全球影史前 9;腾讯自研的混元 T1 深度思考模型开启小范围灰测;Ilya Sutskever 的创业公司被曝正筹资超 10 亿美元
1W
·
·
·
2025年2月21日
·
AI 摘要
OpenAI科学家Noam Brown提出了一个震惊的理论:让AI模型思考20秒带来的性能提升,相当于将模型扩大10万倍并训练10万倍的时间。其中,“系统二思维”是让AI模型性能大幅提升的关键所在,能通过自我对弈等强化学习训练方式提升推理能力。
相关榜单
热点推荐
换一批