相关资讯
AI 摘要
今天凌晨1点,OpenAI进行了技术直播发布了三款全新语音模型,专用于开发语音AI Agent。 两个是语音转文本模型GPT-40 Transcribe和GPT-4 Mini Transcribe;一个是文本转语音模型GPT-40 Mini TTS。OpenAI还特意开发了一个新网站来展示新功能。 值得一提的是,开发者可以控制GPT-40 Mini TTS模型的语音情绪和风格,包括兴奋、平静、鼓励、严肃、热闹等,这对于搭建不同业务场景的......
55万热度
·
·
·
2025年3月21日
·
AI 摘要
实时互动与 AI 结合的所有想象力,都会展现在今年的 RTE 大会上。
0W
·
·
·
2024年10月24日
·
AI 摘要
报道称,Meta计划在其即将推出的Llama 4中引入改进的语音功能。该模型将致力于使用户与其语音模型间的对话更具互动性,接近自然对话,而不仅仅是单向的问答。
AI 摘要
为了打造可靠、精准、灵活的语音智能体,OpenAI推出三种先进音频模型:两款优于 Whisper 的语音转文本模型(GPT-4o-transcribe 和 GPT-4o-mini-transcribe)及一款可精细控制发声的文本转语音模型(GPT-4o-mini-tts)。同时,升级 Agent SDK,支持语音能力、流式处理优化,助力开发者快速构建语音智能体。新模型基于真实音频数据集预训练,性能卓越且价格亲民。
热点推荐
换一批