相关资讯
AI 摘要
智东西7月17日消息,昨日据VentureBeat报道,法国AI创企Mistral AI近日推出了两款新AI模型,一个是面向程序员和开发人员的代码生成模型Codestral Mamba 7B,另一个是专为数学相关推理和科学发现而设计的AI模型Mathstral 7B。 Codestral Mamba 7B具有更快的推理速度和更长的上下文,即使在输入文本较长的情况下也能提供快速响应时间。同时,该模型可处理多达256000个token的输入......
35万热度
·
·
·
2024年7月19日
·
AI 摘要
全新的大语言模型(LLM)架构TTT发布,据传有望代替至今在AI领域如日中天的Transformer,性能也比Mamba更好,它真的能替代Transformer吗?
5.9万热度
·
·
·
2024年7月21日
·
AI 摘要
7月24日消息,巴黎奥运会将大量采用中国AI技术,应用在赛事解说、360度直播、视觉搜索等领域。阿里巴巴的通义大模型,在与众多国际科技公司的竞争中获胜,成为奥运首个AI大模型应用的技术提供方。采用中国AI技术!阿里巴巴成奥运首个AI大模型应用技术提供方
68万热度
·
·
·
2024年7月25日
·
AI 摘要
从披露的数据来看,我们可以认为Scaling Law有效,不过这次不是堆数据而是堆机器和优化算法。那不管多贵,都意味着这个行业解决问题的价值在增加,所以这个行业安全了。但很多AI大模型公司是真的危险了,因为下一步跟进的成本越来越贵。
AI 摘要
9月19日云栖大会,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录,通义在卷基模这件事情上是没有停过的,国内大模型会实现弯道超车吗?
26万热度
·
·
·
2024年9月19日
·
热点推荐
换一批