语言模型经验

https://cloud.tencent.com/developer/article/1116533

我们首先使用 n-gram LM 生成了词网格（word lattices），而我们最好的声学模型由 ResNet 和两个 LSTM 组成。然后我们使用 model-M 对该词网络进行了重新评分并从这些被重新评分的网格中生成了 n 最佳列表。最后，我们应用了这四种基于 LSTM 的 LM 和基于卷积的 LM。注意其 LM 概率是被线性地内插（interpolated）进去的，且所有 LM 的插值权重（interpolation weights）都使用了 heldout 数据进行估计。

先用ngram LM生成lattice，然后用NN rescore