单一唤醒词识别模型 Posted on 2022-01-11 | In 命令词 | 单一唤醒词识别模型思路 与DNN-HMM的ASR任务相同,逐帧分类,按音素建模,不同的是KWS任务分类数量比ASR任务分类数量更少,只有唤醒词包含的音素,其他通用音素都视为非唤醒词音素,采用一个非唤醒 ... Read more »
编译Wenet runtime Posted on 2022-01-04 | In 语音识别 | 编译Wenet runtime需要有cmake、g++ 在wenet/runtime/server/x86 进行:mkdir build && cd bu ... Read more »
Wenet脚本 LM Posted on 2022-01-04 | In 语音识别 | 语言模型 LM for WeNet 没有LM,用CTC prefix beam search来产生N-best 有LM,用CTC WFST search来产生N-best,其中CTC WFST ... Read more »
Wenet脚本 BPE Posted on 2022-01-04 | In 语音识别 | Wenet脚本 BPE multi_cn构建dict:把英文词用▁连起,得到▁英文词串,▁英文词串过一遍(不带▁英文文本训练的)bpe.model得子词,去重得dict librispeech构建di ... Read more »
Wenet脚本 解码 Posted on 2022-01-04 | In 语音识别 | 解码decode_maindecode_main参数: rescoring_weight:如果为0,不需要rescore;不为0的任意值,要做rescore ctc_weight:rescore中, ... Read more »
BPE编码 Byte Pair Encoding 字节对编码 Posted on 2022-01-04 | In 语音识别 | BPE编码 Byte Pair Encoding 字节对编码 Neural Machine Translation of Rare Words with Subword Units github: h ... Read more »
chain model Posted on 2022-01-04 | In 语音识别 | chain model kaldi中的chain model(LFMMI)详解 对应kaldi中的结构定义为: 1 2 3 4 5 6 7 8 … 0 0 1 0 0.5 1 ... Read more »
调试decoder_main Posted on 2022-01-04 | In 语音识别 | 调试decoder_main用的cgdb调试 首先之前编译cmake时,没有加可选debug的选项,因此不可调试,在CMakeLists.txt加入 1234SET(CMAKE_BUILD_TYPE ... Read more »
decoder_main修改blank概率 Posted on 2022-01-04 | In 语音识别 | 修改blank概率 孙思宁 知乎 Tiny-Transducer(1) 设备端轻量级ASR模型 方法 只对最大概率为非blank的帧进行解码 不过由于Transducer模型的特性,大多数帧的输 ... Read more »