Abstract

  • 本文分析了各种用于识别和检测多样尺度物体的技术
  • 对输入数据不同处理,比较特定尺度设计和尺度不变设计检测器
  • 为了检验上采样对检测小物体是否必须,我们在ImageNet上评估了不同网络架构检测小目标的性能
  • 基于此,我们提出一个深度端到端的可训练图像金字塔网络用于物体检测,其在训练和测试时使用相同图像尺寸
  • 小物体和大物体分别在小尺寸和大尺寸图像想较难检测,我们提出一个新的训练架构:Scale Normalization for Image Pyramids,其选择不同尺寸物体实例的梯度反向传播,并视作图片尺寸的函数
  • 单模型性能为45.7%,3网络组合mAP为48.3%,Imagenet-1000预训练,COCO数据仅使用bbox监督
  • COCO 2017挑战 Best Student Entry
  • Code
阅读全文 »

Abstract

  • Omni-supervised learning: 全方位学习:一种特殊的半监督学习,包括所有可学习的数据和来自Internet的为标记数据
  • Data Distillation: 数据蒸馏:一种集成预处理方法,将未标记的数据进行多种变化,使用单一模型自动生成新的训练标记
  • 作者主张,目前的视觉识别模型已经具有足够的精度进行自学习(self-learning),从而挑战真实世界的数据
  • 实验表面,使用数据蒸馏训练的模型超过完全使用标注数据训练的方法
阅读全文 »

1515674206560

Abstract

深度卷积网络在许多特性识别任务上取得成果,然而在视频任务上单帧检测太慢,因此将先进的图像识别网络迁移到视频任务上意义重大。我们提出深度特征流(Deep Feature Flow)框架用于快速精确的视频识别。该框架仅在稀疏关键帧上运行卷积网络的子网络,并通过流场将特征传递到其他帧,由于流场计算相对较快因此速度得到显著提升。端到端训练整体框架,识别精度显著提升。深度特征流框架灵活且通用,该方法在两个视频数据集上验证。

  • MSA
  • 视频识别
  • Deep Feature Flow
阅读全文 »

![](http://zavix-image.oss-cn-shenzhen.aliyuncs.com/note/Training Region-based Object Detectors with Online Hard Example Mining/f1.png)

Abstract

region-based ConvNets(R-CNN)极大的推动了目标检测领域的发展,但是其训练过程仍然包括很多启发知识和超参来进行优化。我们提出一种简单但是非常有效的在线困难样本挖掘算法online hard example mining(OHEM)用于训练R-CNN检测器。我们的动机是:在被检测的数据集中总是包含大量简单的样本和少量困难样本。自动的选择这些困难样本进行训练能够更加快速和有效。OHEM是一种简单直观的算法,能够避免一些常用的启发只是和超参。更重要的是,其对检测性能有稳定和显著的提升。在数据集变得越来越大的今天,如MS COCO,这项工作是十分有意义的。最后,OHEM与该领域先进的方法结合后,在PASCAL VOC 2007和2012数据集上实现78.9%和76.3%的mAP。

  • OHEM
  • FAIR
  • Ross Girshick
  • Hard Example Mining
阅读全文 »
0%