一个干净明亮的地方

论文笔记 : Show, Attend and Tell: Neural Image Caption Generation with Visual Attention

发表于 2018-03-23 |

首先先贴一下论文链接，在上一篇笔记中介绍了NIC，它使用的是encoder-decoder框架，使用CNN作为encoder提取特征，将softmax的前一层的vector作为encoder端的输出，然后将其输入进使用LSTM的decoder中进行解码并生成句子。总体来讲模型还是很直观的，而且相对于 ...

阅读全文 »

论文笔记 : Show and Tell: Lessons learned from the 2015 MSCOCO Image Captioning Challenge

发表于 2018-03-22 |

这篇论文提出的模型也叫NICv2(Neural Image Caption)，提到这篇文章，就要先贴一下它的原型NIC。 NICv2相对于之前做了一些改进，并取得了2015年COCO比赛的第一名。这里我们先介绍一下原始的NIC，然后讲讲NICv2的改进。 1 模型结构NIC模型的结构很容易理解：就 ...

阅读全文 »

Image Caption 初步入门

发表于 2018-03-21 |

图像标注(Image Caption)是一个结合了CV和NLP两个领域的比较综合的任务，其对应的模型输入为一幅图像，输出为描述该图像的一段文字。通俗的讲，就是训练模型去识别图像中的物体，并且理解物体之间的联系，并用一句话来进行描述。 1 任务描述目前大部分Image Caption的任务还是基于英文 ...

阅读全文 »