语音合成功能使用指南
了解如何配置和使用 Reeden 的语音合成功能,实现朗读、试听与自定义音源接入
语音合成功能概述
Reeden 支持将书籍内容转换为语音进行朗读,方便您在阅读时切换到听书模式。
通过语音合成功能,您可以:
- 为书籍选择不同的声音和语言
- 在阅读时直接试听和切换音色
- 使用系统自带语音,也可以接入云端语音服务
- 根据需要配置自定义 HTTP 音源或动态脚本音源
当前支持的语音来源
Reeden 当前支持的语音来源包括:
- 系统语音
- Edge TTS
- 微软 Azure
- 阿里云
- AWS Polly
- 火山引擎
- 自定义 HTTP 合成
- 自定义动态音源
- OpenAI 兼容 AI 语音音源
其中:
- 系统语音适合快速开箱即用
- 云端语音服务通常音质更自然、音色更多
- 自定义音源适合接入第三方或自建的语音服务
使用前准备
在使用语音合成功能前,通常需要完成以下步骤:
- 打开 Reeden 的「语音合成」设置页面
- 选择您想使用的语音来源
- 如为云端服务,填写对应的鉴权信息
- 获取或导入可用声音列表
- 试听确认后,在阅读时使用
适合怎样选
想尽快使用
建议优先使用:
- 系统语音
- Edge TTS
这两类配置相对简单,适合先快速体验。
想要更多自然音色
建议考虑:
- 微软 Azure
- 阿里云
- AWS Polly
- 火山引擎
这类服务通常提供更多云端音色,适合对音质、语言覆盖或角色感更敏感的场景。
想接入自己的服务
建议使用:
- 自定义 HTTP 合成
- 自定义动态音源
- OpenAI 兼容 AI 语音音源
适合已经有第三方接口、自建服务,或需要复杂鉴权、多步骤请求、流式合成的场景。
常见配置项说明
不同语音来源的配置项不完全相同,但常见内容包括:
API 密钥或访问令牌
- 功能:用于调用云端语音服务
- 建议:妥善保管,不要泄露给他人
区域 / Region
- 功能:指定服务所在区域
- 建议:优先选择离您更近、响应更稳定的区域
App ID / AppKey / Voice / Model
- 功能:用于指定应用身份、音色或模型
- 建议:按对应服务商的控制台信息填写
声音列表
- 功能:显示当前可用音色
- 说明:有些服务支持自动获取声音列表,有些需要手动配置或导入
不同类型语音的区别
系统语音
- 优点:无需额外注册服务,配置简单
- 适合:先快速使用、离线环境、本机试听
- 注意:不同设备上的可用声音可能不同
云端语音
- 优点:音色丰富,通常更自然
- 适合:长期听书、追求音质或特定语言音色
- 注意:通常需要联网,也可能产生费用
自定义 HTTP 合成
- 优点:适合接入简单的第三方 TTS 接口
- 适合:已有标准 HTTP 接口的服务
- 注意:一般更适合单次请求、固定参数的场景
自定义动态音源
- 优点:灵活度最高
- 适合:需要多步骤认证、WebSocket、Token 缓存、复杂签名逻辑的场景
- 注意:需要编写脚本,适合更熟悉接口接入的用户
使用建议
- 第一次使用时,先从系统语音或 Edge TTS 开始,确认整体流程正常
- 接入云端服务后,先试听几种不同音色,再决定常用声音
- 如果需要长期听书,建议优先选择音色更自然、响应更稳定的服务
- 自定义音源建议先用少量文本测试,再正式使用
- 如果某个服务保存后没有声音列表,优先检查鉴权信息和网络连接
- 云端语音服务可能有免费额度和计费限制,建议关注服务商说明
相关阅读
如果您已经确定要使用某个具体服务,可以继续查看对应教程,例如:
- Azure
- 阿里云
- 火山引擎
- 自定义 HTTP 合成
- 自定义动态音源
Reeden