NetVLAD1是一个较早的使用 CNN 来进行图像检索或者视频检索的工作,后续在此工作的基础上陆续出了很多例如 NetRVLAD、NetFV、NetDBoW 等等的论文,思想都是大同小异。 一、图像检索 VLAD 和 BoW、Fisher Vector 等都是图像检索领域的经典方法,这里仅简介下图像检索和 VLAD 的基本思想。 图像检索(实例搜索)是这样的一个经典问题: 1、我们有一个图像数据库 通过函数可以得到每一个图像的特征 ; 2、我们有一个待查询图像 通过函数得到它的特征 ; 3、则我们获得的欧氏距离 应该满足越相近的图像 越小。 二、VLAD (Vector of Locally Aggregated Descriptors) 而 VLAD...