XSwitch支持的TTS语音对比

之前一直有同学问是否可以出一篇专门关于XSwitch支持TTS的介绍文章,今天,它来了~

XSwitch支持国内主流ASR/TTS厂商,这篇文章从示例出发,所有语音文件均通过XSwitch内部模块与TTS Server交互生成。

本篇文章内测试实例均使用同一文本:

您好,欢迎致电烟台小樱桃网络科技有限公司。烟台小樱桃是高新技术企业,坐落在美丽 的黄海之滨。让互联互通更顺畅,让实时互动更高效,小樱桃将竭诚为您服务。

阿里

  • 耗时:800.311 ms

讯飞

  • 耗时:214.198ms
  • 合成音频存在噪音,修复中

百度

  • 耗时:761.342 ms

华为

  • 耗时:1270.315 ms

espeak-ng

  • 耗时:25ms

edge-tts

  • 耗时:1675ms

小结

注意,阿里、讯飞、百度、华为四种TTS语音均为在线合成,使用这些服务不仅需要有相应的账号,而且大部分也需要付费才能使用。

espeak-ngedge-tts为容器内部可执行程序合成,无需额外申请账号,但目前只用于测试阶段。具体操作方法可参考如何在XSwitch中使用Edge TTS

如您有如何需求和问题,请及时联系我们!