yelong的博客


  • Home

  • Tags

  • Categories

  • Archives

  • Search

单一唤醒词识别模型

Posted on 2022-01-11 | In 命令词 |
单一唤醒词识别模型思路 与DNN-HMM的ASR任务相同,逐帧分类,按音素建模,不同的是KWS任务分类数量比ASR任务分类数量更少,只有唤醒词包含的音素,其他通用音素都视为非唤醒词音素,采用一个非唤醒 ...
Read more »

基于Wenet的语音识别

Posted on 2022-01-04 | In 语音识别 |
基于Wenet的语音识别​ 2022.5.7 带L ...
Read more »

编译Wenet runtime

Posted on 2022-01-04 | In 语音识别 |
编译Wenet runtime需要有cmake、g++ 在wenet/runtime/server/x86 进行:mkdir build && cd bu ...
Read more »

Wenet脚本 LM

Posted on 2022-01-04 | In 语音识别 |
语言模型 LM for WeNet 没有LM,用CTC prefix beam search来产生N-best 有LM,用CTC WFST search来产生N-best,其中CTC WFST ...
Read more »

Wenet脚本 BPE

Posted on 2022-01-04 | In 语音识别 |
Wenet脚本 BPE multi_cn构建dict:把英文词用▁连起,得到▁英文词串,▁英文词串过一遍(不带▁英文文本训练的)bpe.model得子词,去重得dict librispeech构建di ...
Read more »

Wenet脚本 解码

Posted on 2022-01-04 | In 语音识别 |
解码decode_maindecode_main参数: rescoring_weight:如果为0,不需要rescore;不为0的任意值,要做rescore ctc_weight:rescore中, ...
Read more »

BPE编码 Byte Pair Encoding 字节对编码

Posted on 2022-01-04 | In 语音识别 |
BPE编码 Byte Pair Encoding 字节对编码 Neural Machine Translation of Rare Words with Subword Units github: h ...
Read more »

chain model

Posted on 2022-01-04 | In 语音识别 |
chain model kaldi中的chain model(LFMMI)详解 对应kaldi中的结构定义为: 1 2 3 4 5 6 7 8 … 0 0 1 0 0.5 1 ...
Read more »

调试decoder_main

Posted on 2022-01-04 | In 语音识别 |
调试decoder_main用的cgdb调试 首先之前编译cmake时,没有加可选debug的选项,因此不可调试,在CMakeLists.txt加入 1234SET(CMAKE_BUILD_TYPE ...
Read more »

decoder_main修改blank概率

Posted on 2022-01-04 | In 语音识别 |
修改blank概率 孙思宁 知乎 Tiny-Transducer(1) 设备端轻量级ASR模型 方法 只对最大概率为非blank的帧进行解码 不过由于Transducer模型的特性,大多数帧的输 ...
Read more »
<1…151617…21>

203 posts
21 categories
25 tags
© 2025 Long Ye
Powered by Hexo
|
Theme — NexT.Muse v5.1.4
访客数 人 总访问量 次