如何评价大语言模型架构 TTT ？Transformer这次真的要没了？

2024年10月24日

全新大语言模型架构 TTT 匹敌Transformer和Mamba，12人团队半数为华人，有哪些突破？

AI 摘要

从2017年Google Brain团队推出Transformer架构逐步取代长短期记忆（LSTM）等“循环神经网络（RNN）模型”成为首选模型，到后来首个线性时间序列架构Mamba推出又对Transformer架构构成挑战，大语言模型底层架构的迭代正在迅速改变人们对于AI的认知和理解。美东时间周一（7月8日）,一种全新的大语言模型（LLM）架构有望代替至今在AI领域如日中天的Transformer，性能也比Mamba更好。在预印本......

36万热度

2024年10月24日

如何评价当前大语言模型和生成式 AI 的成就？

5.8万热度

2024年10月24日

AI 摘要

最近使用大语言模型开发应用时，常常需要llm直接输出JSON格式的内容。但经常会出现输出的格式不符合要求。有什么比较好的方法吗？

热度累计中

2024年12月27日

AI 摘要

66W

2025年4月22日

AI 摘要

2023年12月至2024年5月，Anthropic发布的三篇论文不仅证明大语言模型会'说谎'，更揭示了一个堪比人类心理的四层心智架构——而这可能是人工意识的起点。要回答大语言模型是否有意识，我们得回到动机上看。

80W

2025年4月24日

AI 摘要

当地时间4月14日，谷歌CEO皮猜激动官宣：隆重推出DolphinGemma，基于多年积累的海豚声音数据训练而成，有助于实现跨物种交流。不过别着急，从DeepMind联创兼CEO哈萨比斯透露的想法来看，没准下一个就是狗了。

100W

要闻热榜

腾讯新闻

2025年4月15日

如何评价OpenRouter这样的大模型API聚合平台？

70万热度

2025年4月26日

如何评价Meta刚刚发布的LLama 4系列大模型？

AI 摘要

刚刚，当地时间2025年4月5日，Meta 发布了 Llama 4 系列模型。其中的Maveric的预览版已经登录LMArena，以1417分排行第2。发布博客：https://ai.meta.com/blog/llama-4-multimodal-intelligence/ 模型卡：https://www.llama.com/docs/model-cards-and-prompt-formats/llama4_omni/ 模型地址......

48万热度

2025年4月06日

AI 摘要

该架构采用纯64位设计，今年9月，Intel发布了x86S架构的1.2规范，优化了设计，增加了32位兼容模式。不过近期TomHardware表示Intel声明不再致力于x86S规范。该计划再次停止。

8万热度

2025年1月03日