开源播客TTS模型神器:Muyan-TTS,0.33秒生1秒音频,零样本语音合成 快速生成:约 0.33 秒生成 1 秒音频,适合批量生成长语音内容;说话人适配:支持自定义说话人,进行个性化语音定制;支持长内容连贯合成:无需打断,可自然连续地朗读 5 分钟甚至更长文本;离线部署友好:Hugging Face 提供模型权重,支持本地推理。 开源 播客 tts 音频 tts模型 2025-05-13 14:24 7