语音合成功能使用指南

了解如何配置和使用 Reeden 的语音合成功能，实现朗读、试听与自定义音源接入

语音合成功能概述

Reeden 支持将书籍内容转换为语音进行朗读，方便您在阅读时切换到听书模式。

通过语音合成功能，您可以：

为书籍选择不同的声音和语言
在阅读时直接试听和切换音色
使用系统自带语音，也可以接入云端语音服务
根据需要配置自定义 HTTP 音源或动态脚本音源

当前支持的语音来源

Reeden 当前支持的语音来源包括：

系统语音
微软 Azure
阿里云
AWS Polly
火山引擎
自定义 HTTP 合成
自定义动态音源
OpenAI 兼容 AI 语音音源

其中：

系统语音适合快速开箱即用
云端语音服务通常音质更自然、音色更多
自定义音源适合接入第三方或自建的语音服务

使用前准备

在使用语音合成功能前，通常需要完成以下步骤：

打开 Reeden 的「语音合成」设置页面
选择您想使用的语音来源
如为云端服务，填写对应的鉴权信息
获取或导入可用声音列表
试听确认后，在阅读时使用

适合怎样选

想尽快使用

建议优先使用：

系统语音

配置简单，适合先快速体验。

想要更多自然音色

建议考虑：

微软 Azure
阿里云
AWS Polly
火山引擎

这类服务通常提供更多云端音色，适合对音质、语言覆盖或角色感更敏感的场景。

想接入自己的服务

建议使用：

自定义 HTTP 合成
自定义动态音源
OpenAI 兼容 AI 语音音源

适合已经有第三方接口、自建服务，或需要复杂鉴权、多步骤请求、流式合成的场景。

常见配置项说明

不同语音来源的配置项不完全相同，但常见内容包括：

API 密钥或访问令牌

功能：用于调用云端语音服务
建议：妥善保管，不要泄露给他人

区域 / Region

功能：指定服务所在区域
建议：优先选择离您更近、响应更稳定的区域

App ID / AppKey / Voice / Model

功能：用于指定应用身份、音色或模型
建议：按对应服务商的控制台信息填写

声音列表

功能：显示当前可用音色
说明：有些服务支持自动获取声音列表，有些需要手动配置或导入

不同类型语音的区别

系统语音

优点：无需额外注册服务，配置简单
适合：先快速使用、离线环境、本机试听
注意：不同设备上的可用声音可能不同

云端语音

优点：音色丰富，通常更自然
适合：长期听书、追求音质或特定语言音色
注意：通常需要联网，也可能产生费用

自定义 HTTP 合成

优点：适合接入简单的第三方 TTS 接口
适合：已有标准 HTTP 接口的服务
注意：一般更适合单次请求、固定参数的场景

自定义动态音源

优点：灵活度最高
适合：需要多步骤认证、WebSocket、Token 缓存、复杂签名逻辑的场景
注意：需要编写脚本，适合更熟悉接口接入的用户

使用建议

第一次使用时，先从系统语音开始，确认整体流程正常
接入云端服务后，先试听几种不同音色，再决定常用声音
如果需要长期听书，建议优先选择音色更自然、响应更稳定的服务
自定义音源建议先用少量文本测试，再正式使用
如果某个服务保存后没有声音列表，优先检查鉴权信息和网络连接
云端语音服务可能有免费额度和计费限制，建议关注服务商说明

相关阅读

如果您已经确定要使用某个具体服务，可以继续查看对应教程，例如：

Azure
阿里云
火山引擎
自定义 HTTP 合成
自定义动态音源

七牛云同步

七牛云 S3 同步配置教程

Azure 语音合成

Azure 语音合成

On this page

语音合成功能概述当前支持的语音来源使用前准备适合怎样选想尽快使用想要更多自然音色想接入自己的服务常见配置项说明 API 密钥或访问令牌区域 / Region App ID / AppKey / Voice / Model 声音列表不同类型语音的区别系统语音云端语音自定义 HTTP 合成自定义动态音源使用建议相关阅读