语言模型经验
我们首先使用 n-gram LM 生成了词网格(word lattices),而我们最好的声学模型由 ResNet 和两个 LSTM 组成。然后我们使用 model-M 对该词网络进行了重新评分并从这些被重新评分的网格中生成了 n 最佳列表。最后,我们应用了这四种基于 LSTM 的 LM 和基于卷积的 LM。注意其 LM 概率是被线性地内插(interpolated)进去的,且所有 LM 的插值权重(interpolation weights)都使用了 heldout 数据进行估计。
先用ngram LM生成lattice,然后用NN rescore