最近做了一个 MP3 转文字工具，分享一下踩过的一些坑

kukmp7g72jn9 · 2026 年6 月 30 日 23:59

最近在做一个音频转文字的小工具，主要是为了方便把课程、会议录音、播客等内容快速整理成文本。

整个过程踩了不少坑，记录一下，也欢迎大家交流。

主要遇到的几个问题：

目前做了一个在线 Demo，主要用于自己测试，也欢迎大家体验并提建议：

https://mp3totext.ai/

如果大家也做过 Whisper、Faster-Whisper 或者其他语音识别相关项目，也欢迎交流一下部署、性能优化或者模型选择方面的经验。