Fish Speech 是一款极速 TTS 引擎,仅凭 15 秒音频即可还原说话者的音色、口音与情绪,并以自然流畅的效果朗读任意文本。平台基于成熟的 So-VITS-SVC 与 Bert-VITS2 架构,内置数十种社区音色,也支持用户上传私有模型,自由调节语速、音高与情绪,输出广播级 WAV 或 MP3,供视频、游戏或电话系统使用,无需高价重录。
手机上专属主动型的谷歌 AI 助手,轻松搞定工作、学习与日常事务
最快接入Gemini多模态模型的通道,支持200万token上下文、缓存与搜索增强
通过文本、图像或现有片段生成理解物理规律、长达一分钟的逼真视频
开源枢纽,托管无限ML模型、数据集与应用,并提供企业级算力与协作
独立实验室,通过设计、基础设施与小团队AI研究扩展人类想象力