RNN-T

李宏毅语音课程-RNN-T模型

rnn-t decoder：给一个输入h，输出多个字符直到输出空字符Φ。接着输入下一个MCCC特征实际会在输出字符的后面会加一个 RNN(最上面的蓝色块)。把原来的RNN剔除(中间黄色块)。原因：1. 增加的RNN相当于一个语言模型LM，可以提前从text中训练。2. 方便RNN-T的训练。 ......

语音模型课程 RNN-T RNN更新时间 2023-05-29

RNN-T语音模型记录

RNN-T 模型最后一层的输出是一个 4-D 的 tensor，维度是 (N, T, U, C), 其中 N: batch size。数值大小: 一般是几十 T: encoder 的输出帧数。数值大小：一般是好几百 U: decoder 的输出帧数。数值大小：几十至上百 C: vocabulary ......

语音模型 RNN-T RNN更新时间 2023-05-25

LAS、CTC、RNA、RNN-T 等

这些都是大名鼎鼎的 seq2seq model。本文可看作是台大李宏毅教授 DLHLP 课程的学习笔记，学习传送门：https://www.bilibili.com/video/BV12T411X7Nz/ 1 Listen，Attend and Spell（LAS） paper：https://a ......

RNN-T LAS CTC RNA RNN更新时间 2023-04-20

共3篇 :1/1页 首页上一页1下一页尾页

526互联

RNN-T

李宏毅语音课程-RNN-T模型

RNN-T语音模型记录

LAS、CTC、RNA、RNN-T 等