一个开源的高性能文本转语音(TTS)代理服务

B站影视 内地电影 2025-09-29 07:55 1

摘要:edgetts-edgeone-pages是一个部署在 EdgeOne Pages 上的高性能文本转语音(TTS)代理服务。它巧妙地将微软 Edge 强大且自然的语音合成服务,封装成了一个兼容 OpenAI API 格式的接口。这使得开发者可以无缝地将各种现有

edgetts-edgeone-pages 是一个部署在 EdgeOne Pages 上的高性能文本转语音(TTS)代理服务。它巧妙地将微软 Edge 强大且自然的语音合成服务,封装成了一个兼容 OpenAI API 格式的接口。这使得开发者可以无缝地将各种现有应用对接到这个免费、高质量的 TTS 服务上。

项目包含两个核心部分:

edge-functions/index.js: 部署在 EdgeOne Pages 上的核心服务脚本(Edge Functions);index.html: 一个功能完备的网页,用于方便地测试和调用服务。 OpenAI 兼容: 完全模拟 OpenAI 的 /v1/audio/speech 接口,可被官方的 OpenAI SDK 或任何现有工具直接调用。️ 高质量音色: 利用微软 Edge TTS 提供的多种自然、流畅的神经网络语音。 STREAMING: 支持流式和标准(非流式)两种响应模式,流式响应可极大降低长文本的首次播放延迟。 智能文本清理: 内置强大的"文本清理流水线",可自动处理从 PDF 或网页复制的杂乱文本。️ 灵活的参数配置: 支持通过 API 请求动态调整所有核心参数。 零依赖部署: 脚本完全自包含,无需配置 KV、队列等任何外部服务。 便捷的测试工具: 提供一个功能丰富的 index.html,让用户无需编写任何代码即可测试所有功能。

这个项目附带了从零部署 +使用的步骤,下面是整理出来的:

准备工作

你需要一个 EdgeOne Pages 账户(目前免费可用);准备一个 Git 仓库(GitHub /GitLab 等),用于存放这个项目代码。

上传代码

克隆或上传项目代码到你的 Git 仓库,保持文件结构如下:

your-repo/
├── edge-functions/
│ └── api/
│ └── v1/
│ ├── speech.js
│ └── models.js
├── index.html
├── README.md
└── deploy.md

确认 edge-functions/index.js / speech.js etc. 存在且语法正确。

创建 EdgeOne Pages 项目

在 EdgeOne 控制台里选择 “创建项目 /从 Git 仓库导入”;指定你的仓库;构建设置通常简单,因为是静态 +边缘脚本:构建命令留空或默认,输出目录为根目录等。

配置环境变量

在 EdgeOne Pages 项目设置中设置 API_KEY(默认示例值是 hello,你可以改为你想要的);设置为 Production 环境或你所需环境。

部署 &访问

点击部署;部署完成后你会获得一个 URL,比如 https://.edgeone.app;可以绑定自定义域名以便更正式地使用或用于国内访问(有可能 EdgeOne Pages 在部分地区访问速度更好)。

API 调用 /测试

使用前端 index.html 测试页面输入文本 + 设置参数进行测试;或使用命令行 (curl) 调用 API,例如:

POST https:///api/v1/audio/speech
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json
{
"model": "tts-1-alloy",
"input": "你好,这是一段测试文本",
"voice": "zh-CN-XiaoxiaoNeural",
"speed": 1.0,
"pitch": 1.0,
"stream": false
// 可选 chunk_size, concurrency, cleaning_options 等
}

注意限制

单次请求的文本字符数建议不超过 ~12 万字符;并发限制(默认并发数为 10);Edge Functions 执行有 CPU 时间限制(例如单次执行时间/资源消耗)可能有限制(比如 200 ms CPU 时间)。

来源:一斚一点号

相关推荐