为rime的输入方案启用语言模型

请问,我使用用了语言模型之后,词典里的词条就不出现在候选项里了,这是可能是什么问题?我是 ibus-rime,下面图片里是抄来的配置和现象。

我的主要配置:

# file: default.custom.yaml
patch:
  schema_list:
    - schema: luna_pinyin_simp

# file: luna_pinyin_simp.custom.yaml
patch:
  translator:
    dictionary: luna_pinyin_simp.extended

  __include: octagram   # 启用语言模型
  # 语言模型
  octagram:
    __patch:
      grammar:
        language: amz-v2n3m1-zh-hans
        # 命中的最长词组
        collocation_max_length: 5
        # 命中的最短词组,搭配词频健全的词库时候应当最小值设为3避开2字
        # 高频词
        collocation_min_length: 2
      translator/contextual_suggestions: true
      translator/max_homophones: 7
      translator/max_homographs: 7

# file: luna_pinyin_simp.extended.dict.yaml
# Rime dictionary
# encoding: utf-8
#
---
name: luna_pinyin_simp.extended
version: "2015.12.02"
sort: by_weight
use_preset_vocabulary: false
import_tables:
  - luna_pinyin
  - dicts/base
  - dicts/ext
  - dicts/others
  - dicts/tencent
  - dicts/41448
  - dicts/8105
...


另外,默认情况下,rime 是不是不支持带有声调的词典?

# Rime dictionary
# encoding: utf-8
#https://github.com/amzxyz/RIME-LMDG
# ------- 诗词-------
---
name: poetry
version: "LTS"
sort: by_weight
...
霭霭春空        ǎi ǎi chūn kōng 8
哀此孤生        āi cǐ gū shēng  8
哀此鳏寡        āi cǐ guān guǎ  8

你可能遇到的是这个问题,可以看看:为什么要关闭调频以及与之关联的措施有哪些 · amzxyz/RIME-LMDG Wiki · GitHub

之前我用wanxiang也是这样,模型和调频是有一定冲突的,有时候觉得模型很不错,有时候发现问题又挺大,挺苦恼。

1 个赞

我已经习惯关闭自动调频,手动造词调频了

推荐一些小型语言模型:

1 个赞

有推荐的模型吗?哪个使用体验更好?

另外,怎么知道语言模型生效了呢?

楼主上面发的那些长句子就可以验证是不是开启了语言模型。

看上去是生效了, 效果不错

image

看了懒猫更新的博客找过来的,确实好用

PS:怪,在 emacs 中用 emacs-rime 同样的配置不行

PPS:好吧是第一句这个打不出来,后面的都是可以的

1 个赞

跟用的方案有关。

输入长度比较长(习惯于整句输入)就用词级模型,华宇模型还有上面提到的万象模型都不错。

我习惯打字、词和短语,一般用字级模型,用 S1 模型觉得还可以。

Rime 自己的八股文模型字级和词级的都有,不过和雾凇衍生出来的词库有点不搭配,如果用朙月拼音或八股文词库的话可以选用。

2 个赞

这模型是否生效,效果如何有时真的很难评估。在不同的机器上,操作系统环境配置基本一样,但是出来的效果不同。另外,我直接用wanxiang的配置,青花瓷歌词也不行,第一句就是错的。自己配置雾凇+大模型,也不行。歌词有时对有时错,甚是苦恼!大家的配置能打青花瓷歌词之类的吗?

1 个赞

其实我想说的是基础词库更重要。白霜词库加万象的模型,准确率独一档的高。 最新评测结果表明,白霜拼音以及万象拼音使用ngrams模型均超越了微软拼音。

2026.4.25日评测结果白霜拼音在不使用模型时领先其他方案;使用模型时,已超越商业输入法的准确率([白霜拼音用模型]句子正确率: 71.54% (176/246 句完全匹配),手心输入法句子正确率: 71.14% (175/246 句完全匹配))。

感谢指路,我去试试