ReedenReeden

语音合成功能使用指南

了解如何配置和使用 Reeden 的语音合成功能,实现朗读、试听与自定义音源接入

语音合成功能概述

Reeden 支持将书籍内容转换为语音进行朗读,方便您在阅读时切换到听书模式。

通过语音合成功能,您可以:

  • 为书籍选择不同的声音和语言
  • 在阅读时直接试听和切换音色
  • 使用系统自带语音,也可以接入云端语音服务
  • 根据需要配置自定义 HTTP 音源或动态脚本音源

当前支持的语音来源

Reeden 当前支持的语音来源包括:

  • 系统语音
  • Edge TTS
  • 微软 Azure
  • 阿里云
  • AWS Polly
  • 火山引擎
  • 自定义 HTTP 合成
  • 自定义动态音源
  • OpenAI 兼容 AI 语音音源

其中:

  • 系统语音适合快速开箱即用
  • 云端语音服务通常音质更自然、音色更多
  • 自定义音源适合接入第三方或自建的语音服务

使用前准备

在使用语音合成功能前,通常需要完成以下步骤:

  1. 打开 Reeden 的「语音合成」设置页面
  2. 选择您想使用的语音来源
  3. 如为云端服务,填写对应的鉴权信息
  4. 获取或导入可用声音列表
  5. 试听确认后,在阅读时使用

适合怎样选

想尽快使用

建议优先使用:

  • 系统语音
  • Edge TTS

这两类配置相对简单,适合先快速体验。

想要更多自然音色

建议考虑:

  • 微软 Azure
  • 阿里云
  • AWS Polly
  • 火山引擎

这类服务通常提供更多云端音色,适合对音质、语言覆盖或角色感更敏感的场景。

想接入自己的服务

建议使用:

  • 自定义 HTTP 合成
  • 自定义动态音源
  • OpenAI 兼容 AI 语音音源

适合已经有第三方接口、自建服务,或需要复杂鉴权、多步骤请求、流式合成的场景。

常见配置项说明

不同语音来源的配置项不完全相同,但常见内容包括:

API 密钥或访问令牌

  • 功能:用于调用云端语音服务
  • 建议:妥善保管,不要泄露给他人

区域 / Region

  • 功能:指定服务所在区域
  • 建议:优先选择离您更近、响应更稳定的区域

App ID / AppKey / Voice / Model

  • 功能:用于指定应用身份、音色或模型
  • 建议:按对应服务商的控制台信息填写

声音列表

  • 功能:显示当前可用音色
  • 说明:有些服务支持自动获取声音列表,有些需要手动配置或导入

不同类型语音的区别

系统语音

  • 优点:无需额外注册服务,配置简单
  • 适合:先快速使用、离线环境、本机试听
  • 注意:不同设备上的可用声音可能不同

云端语音

  • 优点:音色丰富,通常更自然
  • 适合:长期听书、追求音质或特定语言音色
  • 注意:通常需要联网,也可能产生费用

自定义 HTTP 合成

  • 优点:适合接入简单的第三方 TTS 接口
  • 适合:已有标准 HTTP 接口的服务
  • 注意:一般更适合单次请求、固定参数的场景

自定义动态音源

  • 优点:灵活度最高
  • 适合:需要多步骤认证、WebSocket、Token 缓存、复杂签名逻辑的场景
  • 注意:需要编写脚本,适合更熟悉接口接入的用户

使用建议

  1. 第一次使用时,先从系统语音或 Edge TTS 开始,确认整体流程正常
  2. 接入云端服务后,先试听几种不同音色,再决定常用声音
  3. 如果需要长期听书,建议优先选择音色更自然、响应更稳定的服务
  4. 自定义音源建议先用少量文本测试,再正式使用
  5. 如果某个服务保存后没有声音列表,优先检查鉴权信息和网络连接
  6. 云端语音服务可能有免费额度和计费限制,建议关注服务商说明

相关阅读

如果您已经确定要使用某个具体服务,可以继续查看对应教程,例如:

  • Azure
  • 阿里云
  • 火山引擎
  • 自定义 HTTP 合成
  • 自定义动态音源