马氏距离计算实例_CVPR 2020 | PolarMask:将实例分割统一到FCN,有望在工业界大规模应用...
日期: 2020-11-28 分类: 个人收藏 487次阅读
CVPR 2020 在前几天刚刚公布录用结果,其中有效投稿 6656 篇,最终录用 1470 篇,接收率 22.1 % 。CVPR 2020 将于6月14日-6月19日在美国西雅图举办。
虽然在近三年来,CVPR 的论文投稿量都在持续大涨(CVPR 2018有 3300 篇有效投稿、CVPR 2019有 5160 篇有效投稿、CVPR 2020有效投稿达6656),然而在接收率方面,已是“二连降”(CVPR 2018 收录论文 979 篇、接收率为 29%左右;CVPR 2019 收录论文 1300 篇,接收率为25%左右;CVPR 2020 收录论文 1470篇、接收率为 22%左右)。
我今天要介绍的是我们在CVPR 2020上被录用的文章《PolarMask: Single Shot Instance Segmentation with Polar Representation》,介绍一种single shot的实例分割框架PolarMask。
Mask R-CNN
首先回顾一下之前最经典的实例分割方法,‘先检测再分割’,在这方面做到极致的算法是Mask RCNN。
PolarMask
我们的PolarMask提出了一种新的instance segmentation建模方式,通过寻找物体的contour建模,提供了一种新的方法供大家选择。 两种实例分割的建模方式: 1、像素级建模 类似于图b,在检测框中对每个pixel分类; 2、轮廓建模 类似于图c和图d,其中,图c是基于直角坐标系建模轮廓,图d是基于极坐标系建模轮廓。
网络结构


Polar CenterNess
如何在Polar Coordinate下定义高质量的正样本?我们通过如下公式定义


Polar IoU Loss
在PolarMask中,需要回归k(k=36)根射线的距离,这相比目标检测更为复杂,如何监督regression branch是一个问题。我们提出Polar IoU Loss近似计算出predict mask和gt mask的iou,通过Iou Loss 更好的优化mask的回归。通过实验证明,Polar IoU Loss相比Smooth L1loss可以明显提高2.6个点,同时Smooth L1loss还面临和其他loss不均衡的问题,需要精心调整权重,这是十分低效的,Polar IoU loss不需要调整权重就可以使mask分支快速且稳定收敛。 那么,Polar IoU Loss如何计算呢?如下图所展示


上限分析
看到这里,很多人心里都会有一个疑问,射线这种建模方式,对于凹的物体会有性能损失,上限达不到100mAP,PolarMask怎么处理这个问题? 答案是这样,PolarMask相比Mask R-CNN这种pixel建模的方法,对于形状特别奇怪的mask的确建模会失败,但是这并不代表polarmask毫无意义。原因有两个,(1)Mask R-CNN的上限也到不了100 mAP 因为有下采样这类操作使得信息损失。(2)不管Mask R-CNN还是PolarMask,他们的实际性能距离100mAP的上限都特别远。 所以我们目前应该关注如何让实际网络性能去更好地趋近于上限。 定量分析分析射线建模的上限:
实验
最终,配上一图一表展示一下相比sota的结果

后记
我们会尽快完善并放出带多尺度训练和增长训练时间的代码和模型,以提供给大家并和上述模型公平比较,做instance segmentation非常费卡和时间,希望大家理解。 一些调参的碎碎念: 这个工作在今年4月FCOS出来的同时,我和沈春华老师就在讨论如何进行FCOS进行single shot anchor free实例分割,以及在CVPR开会的时候,和文海,彦伟, 宋林等小伙伴就论证过contour regression的可行性,因为大家可以看出,anchor free 物体检测已经是大势所趋,下一个领域必然是anchor free实例分割,预测一下,再下一个领域是全景分割。在和沈老师这么多月的讨论中以及一次又一次实验的失败中,polarmask逐渐成型。最开始mask regression无数次无法收敛,写mask iou loss又复杂效果还不怎么好,直到某一天想出了polar iou loss。发现性能很好,不用调参,一把出结果。感觉平时做研究还是需要多思考,而不是盲目的做实验。同时,polar centerness也是我在旅游的过程中想到的,然后立马找了个咖啡厅写代码调试,裸涨1.4个点。这两个方法在不增加计算量的情况下,充分发挥了polarmask的性能,看起来其实很简单,但是实际上是背后很多次思考和化简的结果。 总得来说,我最喜欢这篇文章就两点, 1、足够简单,不加任何trick, 也没有任何复杂的操作,比如deformable conv和roi align操作,有希望在工业界大规模应用; 2、找到了一种表达方式,把bbox detection和mask segmentation统一了起来,和FCOS是一种传承的工作,FCOS理论上可以看成PolarMask的特殊版,而PolarMask是FCOS的泛化版,因为bbox本质上是最简单的Mask。PolarMask本质上可以看成一个目标检测和实例分割统一的框架。只需要简单修改就可以退化到FCOS。 本文首发于知乎: https://zhuanlan.zhihu.com/p/84890413 作者 | 谢恩泽 转载来源: AI科技评论

历史文章推荐
CNN真的需要下采样(上采样)吗?
面对新型肺炎疫情,AI 能做什么?
人体姿态估计的过去,现在,未来
2018-2019年度 Top10 综述
【Awesome】Few-Shot Learning论文阅读列表
你有哪些deep learning(rnn、cnn)调参的经验?
给研究新生的建议,光看论文是学不好的,一定要看书,看书,看书!
So Young Sohn:信用评级与专利保护中的AI技术概览
Shai Ben-David:无监督学习中的鲜花与荆棘
不是我们喜新厌旧,而是RAdam确实是好用,新的State of the Art优化器RAdam
机器学习中的评价指标
CVPR2019 |《胶囊网络(Capsule Networks)综述》,附93页PPT下载
AiLearning:一个 GitHub万星的中文机器学习资源
深度学习中的数据增强方法总结
你正在看吗??
除特别声明,本站所有文章均为原创,如需转载请以超级链接形式注明出处:SmartCat's Blog
标签:马氏距离计算实例
精华推荐