博客
关于我
FSAF 让网络自己决定实例输出层
阅读量:260 次
发布时间:2019-03-01

本文共 795 字,大约阅读时间需要 2 分钟。

FSAF 模块简介

全称 Feature Selective Anchor-Free Module (FSAF) 是一种用于目标检测的轻量级模块,主要用于 Pyramid Network (FPN) 中的单阶段检测框架。FSAF 模块通过网络自主选择哪一层来预测目标实例,避免了传统方法中对预设锚框 (anchor) 的依赖。

传统一阶段检测框架的实例选择问题

在传统的单阶段目标检测框架中,实例选择通常基于锚框 IOU (Intersection Over Union) 的比较。具体来说,输入图像经过 FPN 后,会与每个特征图中的锚框计算 IOU,选择 IOU 最大的锚框所在的特征图来预测目标实例。例如,汽车实例与 P4 层的第一个锚框 IOU 最大,因此由 P4 层负责输出。

这种方法虽然简单,但依赖于预设锚框,实质上是基于启发式的经验性选择。这种经验性选择是否最优,如何让网络自主决定实例的分类和偏移,成为一个值得探索的问题。

FSAF 模块的设计与架构

为了解决上述问题,FSAF 模块被引入到 FPN 中。该模块通过在原有的两个分支结构中增加两个小分支,分别负责输出分类和偏移信息。与传统方法不同,FSAF 模块完全不依赖锚框,完全由网络自主决定实例的分类和偏移。

FSAF 模块的实例选择机制

FSAF 模块通过对两个新增加的分支进行训练,分别计算分类损失和回归损失。最终,根据两个损失值的总和来判断哪个分支对应的实例损失最小。例如,在上述示意图中,P3 层的 FSAF 模块对汽车实例的损失最小,因此由 P3 层负责该实例的输出。

总结

FSAF 模块通过轻量级的检测子网络辅助传统锚框检测模块,实现了实例选择的自动化。与传统方法相比,FSAF 模块的选择基于网络学习结果,效果显著优于经验性启发式方法。

参考资料

  • 作者:冷夏LX
  • 作者:ChenJoya
  • 作者:孙杨威

转载地址:http://bvzx.baihongyu.com/

你可能感兴趣的文章
Openlayers高级交互(14/20):汽车移动轨迹动画(开始、暂停、结束)
查看>>
Openlayers高级交互(15/20):显示海量多边形,10ms加载完成
查看>>
Openlayers高级交互(16/20):两个多边形的交集、差集、并集处理
查看>>
Openlayers高级交互(17/20):通过坐标显示多边形,计算出最大幅宽
查看>>
Openlayers高级交互(18/20):根据feature,将图形适配到最可视化窗口
查看>>
Openlayers高级交互(19/20): 地图上点击某处,列表中显示对应位置
查看>>
Openlayers高级交互(2/20):清除所有图层的有效方法
查看>>
Openlayers高级交互(20/20):超级数据聚合,页面不再混乱
查看>>
Openlayers高级交互(3/20):动态添加 layer 到 layerGroup,并动态删除
查看>>
Openlayers高级交互(4/20):手绘多边形,导出KML文件,可以自定义name和style
查看>>
Openlayers高级交互(5/20):右键点击,获取该点下多个图层的feature信息
查看>>
Openlayers高级交互(6/20):绘制某点,判断它是否在一个电子围栏内
查看>>
Openlayers高级交互(7/20):点击某点弹出窗口,自动播放视频
查看>>
Openlayers高级交互(8/20):选取feature,平移feature
查看>>
Openlayers高级交互(9/20):编辑图形(放缩、平移、变形、旋转),停止编辑
查看>>
Openlayers:DMS-DD坐标形式互相转换
查看>>
openlayers:圆孔相机根据卫星经度、纬度、高度、半径比例推算绘制地面的拍摄的区域
查看>>
OpenLDAP(2.4.3x)服务器搭建及配置说明
查看>>
OpenLDAP编译安装及配置
查看>>
Openmax IL (二)Android多媒体编解码Component
查看>>