azure-tts.el --- Emacs 集成 Azure 文字转语音 API

BlindingDark · 2023 年3 月 15 日 12:24

原理很简单，调用官方 API 下载音频文件，然后使用 ffplay (FFmpeg) 或 afplay (MacOS 自带) 播放音频。未来计划调用 azure sdk 生成播放带口型的视频（鸽鸽）。

官方的 API 每月免费额度 50 万单词，足够用了。注册帐号需要信用卡，国内信用卡可用。

功能特点：

依赖少，只调用了外部播放器
异步，下载和播放的时候不会卡住 Emacs
有缓存，相同的文本内容不会重复下载，省钱
用法简单，选中文本之后 M-x azure-tts-play-region 即可，行为非常容易预测
C-u + azure-tts-play-region 可以减速 20% 乘以 C-u 次数进行播放
单文件，纯 emacs lisp 实现，方便修改扩展
吹不下去了 …

欢迎试用 ~

链接： https://gitee.com/blindingdark/BEmacs/raw/master/vendor/azure-tts.el

manateelazycat · 2023 年3 月 15 日 14:12

从我的研究看，语音生成的时间是音频时间的2倍， Azure 的语音生成时间是多少呢?

BlindingDark · 2023 年3 月 15 日 14:27

挺快的，不过我这个还不是流式播放，所以大段内容需要全部下载下来才能播放，所以这样跟网速有关

manateelazycat · 2023 年3 月 22 日 11:53

有个免费的库 GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python (without needing Microsoft Edge/Windows or an API key)

不需要API

但是微软这个是不是只能说英文啊？我用了中文没效果呀。

manateelazycat · 2023 年3 月 22 日 12:00

换一下 voice 就可以说中文了。

BlindingDark · 2023 年3 月 23 日 01:30

你可以用 en-US-JennyMultilingualNeural，这个会 13 种语言，包括中日韩，第一语言是英语，不过除了英文别的语言不能调速。

github.com

MicrosoftDocs/azure-docs/blob/c2cc5e4945b305b16b243c534f145ba7b246e699/articles/cognitive-services/Speech-Service/rest-text-to-speech.md?plain=1#L113


      
              "SampleRateHertz": "24000",
              "VoiceType": "Neural",
              "Status": "GA",
              "ExtendedPropertyMap": {
                "IsHighQuality48K": "True"
              },
              "WordsPerMinute": "152"
          },
          // Redacted for brevity
          {
              "Name": "Microsoft Server Speech Text to Speech Voice (en-US, JennyMultilingualNeural)",
              "DisplayName": "Jenny Multilingual",
              "LocalName": "Jenny Multilingual",
              "ShortName": "en-US-JennyMultilingualNeural",
              "Gender": "Female",
              "Locale": "en-US",
              "LocaleName": "English (United States)",
              "SecondaryLocaleList": [
                "de-DE",
                "en-AU",
                "en-CA",

如果你想注册 API 的话，注册地点记得选美国东部也就是 East US，这个地区支持最多的功能，比如别的地区可能不支持这个多语言的模型

system · 2025 年3 月 22 日 01:30

此话题已在最后回复的 730 天后被自动关闭。不再允许新回复。