找到一些字幕时间轴生成/校准的工具都不符合需求:
- GitHub - SubtitleEdit/subtitleedit: the subtitle editor :)
- GitHub - baxtree/subaligner: Automatically synchronize and translate subtitles with pretrained deep neural networks, forced alignments and transformers. https://subaligner.readthedocs.io/
- GitHub - kaegi/alass: "Automatic Language-Agnostic Subtitle Synchronization"
这些工具,要么直接生成字幕文本,然后人工修订错别字。而有声书/杂志的文本是现成的,无须修订。
要么需要提供一份时间轴错误的字幕,然后生成正确的时间轴,而有声书/杂志的文本不带初始时间轴。
我希望:
$ tool book.wav book.txt > book.lrc
而不是:
$ tool1 book.wav > book_to-be-revised.lrc
$ tool2 book.wav incorrect.lrc > correct.lrc