<img src=”http://zavix-image.oss-cn-shenzhen.aliyuncs.com/note/IndividualnessDPP/1511942386442.png"/ width=”80%”>

Abstract

本文,我们介绍了检测候选的个体性作为一个补充用于评价行人检测。个体性从目标推荐和滑窗得到的原始检测候选中分配一个检测结果给每个物体。我们表明,传统的方法,如NMS,是次优的,因为其仅基于周围检测结果的得分来抑制。我们使用行列式点过程(determinantal point process)结合个体性优化选择最后的结果。该方法使用质量和相似性对每个检测结果建模。然后,检测结果中具有高检测得分和低相关性(通过矩阵行列式计算概率)的作为最后的结果。此矩阵由quality terms作为对角元素,其他位置是相似性元素。具体地,我们专注于行人检测问题,该问题由于其频繁的遮挡和不可预知的运动使其称为最具挑战的问题之一。实验结果显示本文提出的方法比NMS和不受约束的二次优化问题更好。

阅读全文 »

1509936888557

Abstract

将图像目标检测器用于视频是具有挑战性的,其精度受外观变化的影响很大,例如,运动模糊、失焦、奇特姿势等。目前很多方法尝试引入box级别的时间信息,但是都没有实现端到端的训练。我们提出一个 flow-guided 特征集合框架实现视频目标检测端到端的学习。它在特征层面上的时间相关性。通过聚合运动路径上的临近的特征能够改善前帧特征,从而改进视频目标检测精度。本文提出的方法显著的改善ImageNet VID的单帧检测基准方法,特别是对于快速运动的目标。代码会公开。

阅读全文 »

Abstract

Non-maximum suppression(NMS)是目标检测流程中重要的组成部分。首先根据得分对bbox排序,然后选择得分最高的bbox M, 将与M有较大重叠的bbox抑制掉。以前的方法中,如果一个bbox重叠率大于设定的阈值则称为漏检。所以,提出 Soft-NMS, 一个衰减得分与重叠率成函数关系。该方法在coco-style mAP评价尺度上都有提升。计算复杂度,参数都没有特别增加,很容易集成到任何目标检测框架中。

阅读全文 »

![1508501321087](http://zavix-image.oss-cn-shenzhen.aliyuncs.com/note/Rethink Atrous/1508501321087.png)

Abstract

本文我们回顾了atrous 卷积,一个调整filter感知域并控制特征图分辨率的强大工具。为了处理多尺度目标分割,我们的模型使用不同空率(atrous rates)的atrous卷积进行级联或平行,以此来获得不同尺度的语义信息。并且,我们提出Atrous Spatial Pyramid Pooling (ASPP) 孔空间池化模型,探索多尺度上卷机特征具有图像级的全局特征编码并提升性能。本文提出的 DeepLabv3 比之前的版本提升,并且没有DenseCRF后处理,在VOC 2012图像分割benchmark上,实现与其他先进方法类似的性能。

阅读全文 »

1508297031192

Abstract

本文主要提出了一个多分支的检测网络来匹配多尺度目标的感知域和anchor尺寸。

  • multi-scale CNN for fast multi-scale object detection
  • proposal sub-network detect at multi output layer
  • scale-specific detectors combined
  • optimizing a multi-task loss
  • feature upsampling by deconvolution
阅读全文 »

最近跟什么大开会相关,好像大部分的VPN都失效了。蓝灯(Lantern)稳定性速度都不错但是每个月500MB的流量还是不够用。因此,还是考虑自己搭一个VPN来得稳妥。

1. 方案准备

  • VPS服务商:Bandwagon(搬瓦工)
  • VPN Server:shadowsocks 和 v2ray(速度没有shadowsocks稳定)
  • VPN 软件:showdsocks(Win,Ubuntu,android) 和 shadowray SuperWingy(iOS)
阅读全文 »

Abstract

CNN在行人检测上的发展显著,但是考虑训练数据和模型架构上仍有需要解决的问题。我们回顾CNN的设计和适应性使得Faster R-CNN在Caltech上实现先进的结果。

为了从更多更好的数据中得到改进,我们提出CityPersons行人数据集,该数据集在Cityscapes数据集的基础上标注。CityPersons的多样性使得我们第一次实现训练一个的CNN模型能够在多个基准数据集上具有较好的泛化性能。并且使用CityPerson训练的FasterR-CNN模型在Caltech上实现更高的检测率和定位精度。

阅读全文 »

Abstract

目前先进的目标检测网络依赖区域推荐算法来推测目标位置。SSPnet和Fast R-CNN在减少网络运行时间的基础上发现,区域推荐是计算瓶颈。本文提出Region Proposal Network(RPN)区域推荐网络与检测网络的共享全图卷积特征,从而实现接近0成本的区域推荐。RPN作为一个全卷积网络能够在图像各个位置预测物体的边界和得分。RPN采用端到端的训练方法实现高质量的区域推荐,Fast R-CNN作为检测器。通过简单的联合优化,RPN和Fast R-CNN可以贡献卷积特征进行训练。对于VGG16模型,我们的检测系统在GPU的速度能够实现5fps。在每个图片提取300个候选区的情况下 ,PASCAL VOC 2007上精度为73.2% mAP,PASCAL VOC 2012精度为70.4% mAP。

阅读全文 »
0%