序列模型 Tag

注意力机制

如果从源头来讲，注意力机制（Attention）最先是应用在 NLP 领域的机器翻译任务上的。之前的机器翻译任务通常是 Seq2Seq 模型（Encoder-Decoder 结构）来解决的，Encoder 负责学习句子的表征，将其总结为一个定长的向量（hidden vector），然后输入给 Decoder 来解码翻译，但注意只有第一个 Decoder 接收 hidden stat ...

Echo in Beijing

2020-11-20

序列模型

面试前整理的一些自己不熟悉的知识点，好想拥有一个硬盘一样的脑袋，可以不忘掉的那种。 --> 循环神经网络全称 Recurrent Neural Networks, RNN，它可以应对多对多，多对一，一对一，一对多的任务，其模型可以表示为下图。 <img :src="$withBas ...

Echo in Beijing

2020-09-18

序列模型循环神经网络深度学习