VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为……
基于大模型的智能助手、音频分析、todo list任务管理等产品和服务
iMyFone Filme provides multiple voice editing tools to turn your powerful moment
一个简单而可控的音乐生成LM,具有文本和旋律调节。
在几秒钟内克隆您的声音或从我们可用的 AI 声音中进行选择,每个版本都会添加更多.
Quickie是一个人工智能驱动的扩展,允许用户生成文本转语音、摘要器、扩展器、推特、歌词和其他功能。它还提供自定义快捷方式,允许用户使用提示和输入建立自己的快捷方式。Quickie是免费的,每个学分1个Quickie,有无限的Quickie付费计划,保存的结果,和无限的自定义Quickie。
Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练