5.9万热度
·
·
·
2024/10/24 20:42:20
·
AI 摘要
前往原文
全新的大语言模型(LLM)架构TTT发布,据传有望代替至今在AI领域如日中天的Transformer,性能也比Mamba更好,它真的能替代Transformer吗?
相关资讯
AI 摘要
全新的大语言模型(LLM)架构TTT发布,据传有望代替至今在AI领域如日中天的Transformer,性能也比Mamba更好,它真的能替代Transformer吗?
5.9万热度
·
·
·
2024年10月24日
·
AI 摘要
从2017年Google Brain团队推出Transformer架构逐步取代长短期记忆(LSTM)等“循环神经网络(RNN)模型”成为首选模型,到后来首个线性时间序列架构Mamba推出又对Transformer架构构成挑战,大语言模型底层架构的迭代正在迅速改变人们对于AI的认知和理解。 美东时间周一(7月8日),一种全新的大语言模型(LLM)架构有望代替至今在AI领域如日中天的Transformer,性能也比Mamba更好。 在预印本......
36万热度
·
·
·
2024年10月24日
·
AI 摘要
最近使用大语言模型开发应用时,常常需要llm直接输出JSON格式的内容。但经常会出现输出的格式不符合要求。有什么比较好的方法吗?
热度累计中
·
·
·
2024年12月27日
·
AI 摘要
2023年12月至2024年5月,Anthropic发布的三篇论文不仅证明大语言模型会'说谎',更揭示了一个堪比人类心理的四层心智架构——而这可能是人工意识的起点。要回答大语言模型是否有意识,我们得回到动机上看。
80W
·
·
·
2025年4月24日
·
AI 摘要
当地时间4月14日,谷歌CEO皮猜激动官宣:隆重推出DolphinGemma,基于多年积累的海豚声音数据训练而成,有助于实现跨物种交流。不过别着急,从DeepMind联创兼CEO哈萨比斯透露的想法来看,没准下一个就是狗了。
100W
·
·
·
2025年4月15日
·
AI 摘要
刚刚,当地时间2025年4月5日,Meta 发布了 Llama 4 系列模型。 其中的Maveric的预览版已经登录LMArena,以1417分排行第2。 发布博客:https://ai.meta.com/blog/llama-4-multimodal-intelligence/ 模型卡:https://www.llama.com/docs/model-cards-and-prompt-formats/llama4_omni/ 模型地址......
48万热度
·
·
·
2025年4月06日
·
AI 摘要
该架构采用纯64位设计,今年9月,Intel发布了x86S架构的1.2规范,优化了设计,增加了32位兼容模式。 不过近期TomHardware表示Intel声明不再致力于x86S规范。 该计划再次停止。
8万热度
·
·
·
2025年1月03日
·
相关榜单
热点推荐
换一批