7 月 20 日消息,ElevenLabs 昨日(7 月 19 日)发布博文,介绍推出了全新的 Turbo v2.5 文本到语音 AI 模型,支持普通话等 32 种语言,为全球近 80% 的地区提供高质量、低延迟的 AI 对话。
Turbo v2.5 模型首次支持越南语、匈牙利语和挪威语,这些语言的使用人数分别为 8500 万、1300 万和 530 万。
本次更新还重点提高了印地语、法语、西班牙语、普通话和其他 27 种语言的响应速度,最高提升了 3 倍;英语的速度提高了 25%。IT之家附上宣传视频如下:
https://www.bilibili.com/video/BV18w4m1k7Bb?t=0.0
Turbo v2.5 模型结合了先进的文本到语音技术和最新的低延迟模型架构,用户基本上不需要等待,就能提供高质量的 AI 生成音频输出。
Turbo 模型实现了快速语音合成,同时保持流畅和自然的高品质音质,响应时间不超过 400 毫秒。
ElevenLabs 成立于 2022 年,总部位于伦敦,专注于开发人工智能语音模型和工具,可以创建不同语言、口音和情感的合成语音。
公司首席执行官 Mati Staniszewski 表示,ElevenLabs 目前拥有约 40 名远程办公员工,分布在全球各地,并计划到年底将团队扩大至 100 人。
ElevenLabs 非常重视人工智能内容的透明度,并开发了 AI Speech Classifier 等工具帮助识别合成音频,同时也在开发用于电影配音的工具,并正在开发一个允许用户生成 AI 语音并通过授权赚钱的平台。