在 MacOS 上提供了中文分词。Windows 上 WinRT API 和跨平台的 ICU 也支持分词,于是我搓了个兼容的模块:
安装方式参照 emt,但用我提供的 dll/so/dylib 替换原项目的 libEMT.dylib。
libEMT.dylib
欢迎大家使用。
跨平台是指 macOS 也支持吗?
支持。但分词库并非 emt 原作者用到的 NLTokenizer,而是 ICU。你可以自己比较两种库的效果好坏。
NLTokenizer