Fish Audio

✓免费

优势：仅需 15 秒音频，即可克隆任意声音并合成自然语音

标签：

名人语音生成

模型

文本转语音

语音克隆

语音生成

网站月访问量：1.7M

Fish Audio是什么？

Fish Speech 是一款极速 TTS 引擎，仅凭 15 秒音频即可还原说话者的音色、口音与情绪，并以自然流畅的效果朗读任意文本。平台基于成熟的 So-VITS-SVC 与 Bert-VITS2 架构，内置数十种社区音色，也支持用户上传私有模型，自由调节语速、音高与情绪，输出广播级 WAV 或 MP3，供视频、游戏或电话系统使用，无需高价重录。