训练ngram G
1 | 训练LM |
生成 TLG种的 Lexicon.txt:
/home/yelong/data/wenet/examples/aishell/s0
1 | 生成lexicon.txt: |
用新的词典,对文本
其中,split_sentence_oov.py为:
1 | import re |
生成 TLG:
1 | 生成L.fst和T.fst: |
解码测试集
1 | 解码 |
1 | # 训练LM |
/home/yelong/data/wenet/examples/aishell/s0
1 | # 生成lexicon.txt: |
用新的词典,对文本
其中,split_sentence_oov.py为:
1 | import re |
1 | # 生成L.fst和T.fst: |
1 | # 解码 |