盗泉

一个干净明亮的地方


  • 首页

  • 标签

  • 归档

论文笔记 : Show, Attend and Tell: Neural Image Caption Generation with Visual Attention

发表于 2018-03-23 |
首先先贴一下论文链接,在上一篇笔记中介绍了NIC,它使用的是encoder-decoder框架,使用CNN作为encoder提取特征,将softmax的前一层的vector作为encoder端的输出,然后将其输入进使用LSTM的decoder中进行解码并生成句子。总体来讲模型还是很直观的,而且相对于 ...
阅读全文 »

论文笔记 : Show and Tell: Lessons learned from the 2015 MSCOCO Image Captioning Challenge

发表于 2018-03-22 |
这篇论文提出的模型也叫NICv2(Neural Image Caption),提到这篇文章,就要先贴一下它的原型NIC。 NICv2相对于之前做了一些改进,并取得了2015年COCO比赛的第一名。 这里我们先介绍一下原始的NIC,然后讲讲NICv2的改进。 1 模型结构NIC模型的结构很容易理解:就 ...
阅读全文 »

Image Caption 初步入门

发表于 2018-03-21 |
图像标注(Image Caption)是一个结合了CV和NLP两个领域的比较综合的任务,其对应的模型输入为一幅图像,输出为描述该图像的一段文字。通俗的讲,就是训练模型去识别图像中的物体,并且理解物体之间的联系,并用一句话来进行描述。 1 任务描述目前大部分Image Caption的任务还是基于英文 ...
阅读全文 »
Pythonix Huang

Pythonix Huang

3 日志
2 标签
GitHub
© 2018 Pythonix Huang
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.4