12月12日消息,今天凌晨,谷歌正式发布了为新智能体时代构建的下一代模型——Gemini 2.0。 这是谷歌迄今为止功能最强的AI模型,带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。 Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升,速度甚至达到了后者的两倍。 支持图像、视频和音频等多模态输入与输出,例如与文本混合的原生文生图和可自定义的文本转语音(TTS)多语言音频内容。 此外还支持原生调用工具,如Google搜索、代码执行以及第三方用户定义函数等,为用户提供了更为便捷和强大的功能。 在技术层面,Gemini 2.0采用了最新的机器学习和深度学习算法,提升了神经网络的结构和效率,特别是在自然语言处理(NLP)领域表现出色。 这些技术的创新使得Gemini 2.0能够更好地理解和生成自然语言,增强了人机交互的智能性。 https://baijiahao.baidu.com/s?id=1818189056096063847&wfr=spider&for=pc 即日起,开发人员便可在AI Studio和Vert......