单一唤醒词识别模型

Posted on 2022-01-11 | In 命令词 |

单一唤醒词识别模型思路与DNN-HMM的ASR任务相同，逐帧分类，按音素建模，不同的是KWS任务分类数量比ASR任务分类数量更少，只有唤醒词包含的音素，其他通用音素都视为非唤醒词音素，采用一个非唤醒 ...

基于Wenet的语音识别

Posted on 2022-01-04 | In 语音识别 |

基于Wenet的语音识别 2022.5.7 带L ...

Posted on 2022-01-04 | In 语音识别 |

编译Wenet runtime需要有cmake、g++ 在wenet/runtime/server/x86 进行：mkdir build && cd bu ...

Posted on 2022-01-04 | In 语音识别 |

语言模型 LM for WeNet 没有LM，用CTC prefix beam search来产生N-best 有LM，用CTC WFST search来产生N-best，其中CTC WFST ...

Posted on 2022-01-04 | In 语音识别 |

Wenet脚本 BPE multi_cn构建dict：把英文词用▁连起，得到▁英文词串，▁英文词串过一遍（不带▁英文文本训练的）bpe.model得子词，去重得dict librispeech构建di ...

Posted on 2022-01-04 | In 语音识别 |

解码decode_maindecode_main参数： rescoring_weight：如果为0，不需要rescore；不为0的任意值，要做rescore ctc_weight：rescore中， ...

Posted on 2022-01-04 | In 语音识别 |

BPE编码 Byte Pair Encoding 字节对编码 Neural Machine Translation of Rare Words with Subword Units github: h ...

Posted on 2022-01-04 | In 语音识别 |

chain model kaldi中的chain model(LFMMI)详解对应kaldi中的结构定义为： 1 2 3 4 5 6 7 8 … 0 0 1 0 0.5 1 ...

Posted on 2022-01-04 | In 语音识别 |

调试decoder_main用的cgdb调试首先之前编译cmake时，没有加可选debug的选项，因此不可调试，在CMakeLists.txt加入 1234SET(CMAKE_BUILD_TYPE ...

Posted on 2022-01-04 | In 语音识别 |

修改blank概率孙思宁知乎 Tiny-Transducer（1）设备端轻量级ASR模型方法只对最大概率为非blank的帧进行解码不过由于Transducer模型的特性，大多数帧的输 ...