细粒度tutorial
前言
整理自《Fine-Grained Image Analysis with Deep Learning》特邀讲师魏秀参教授
细粒度介绍
细粒度分析-Fine-Grained Image Analysis
计算机视觉中,细粒度分析是指对同一大类的物种进行进一步的分析,识别出该图片是哪一个子类。比如鸟是一个大类,但是鸟会有很多种,什么麻雀,燕子等等,细粒度做的就是要识别出是哪种鸟。
挑战:细粒度分析问题有其独有的挑战。
- 数据不平衡。有些种类其数据多,而有些种类在现实生活中出现的次数就少,这种就像二八定律,称为长尾分布。
- 类与类之间的差异小,一个类的图片差异大。与传统的图像分类--粗粒度分类的正好相反。
细粒度图像识别--Fine-grained image recognition
汇总常用方法。
Recognition by 'localization-classification subnetworks'
基于定位和分类的子网络的方法
主要解决如何定位部件,定位哪些部件。
有一些常用的方法:
- Employing detection or segmentation methods
- Utlizing deep filters
- Leveraging attention mechanisms
- Other representative methods
Recognition by 'end-to-end feature encoding'
主要通过获取更有信息的特征,来解决细粒度的问题
有一些常用的方法:
- Performing high-order feature interactions
- Designing specifc loss functions
- Other methods
Recognition with 'external information'
通过增加一些额外的信息来解决细粒度的问题
有一些常用的方法:
- Recognition with neural network data (先学习一些其他信息,这些信息作为辅助信息)
- Recognition by using multi-modality data (使用多模态数据,比如文本,视频)
- Recognition with humans-in-the-loop (在训练中,人为的对一些信息进行标记)
Fine-grained retrieval 细粒度图像检索
近年来比较火的一个方向/领域。
Content-based fine-grained image retrieval
基于内容的一个细粒度检索
比如有个图片数据库,然后输入一个待查询的图片,然后返回与该图片相似的图片。这个感觉是未来搜索引擎的一个发展方向,搜索引擎不应该只能用文字来搜索,可以用语音,图片等等进行搜索。
Sketch-based fine-grained image retrieval
基于轮廓的细粒度搜索
输入一个轮廓图,比如自己手画的物体的骨架图,然后在有真实物体的数据库哦中进行检索相似图片。