本文共 795 字,大约阅读时间需要 2 分钟。
全称 Feature Selective Anchor-Free Module (FSAF) 是一种用于目标检测的轻量级模块,主要用于 Pyramid Network (FPN) 中的单阶段检测框架。FSAF 模块通过网络自主选择哪一层来预测目标实例,避免了传统方法中对预设锚框 (anchor) 的依赖。
在传统的单阶段目标检测框架中,实例选择通常基于锚框 IOU (Intersection Over Union) 的比较。具体来说,输入图像经过 FPN 后,会与每个特征图中的锚框计算 IOU,选择 IOU 最大的锚框所在的特征图来预测目标实例。例如,汽车实例与 P4 层的第一个锚框 IOU 最大,因此由 P4 层负责输出。
这种方法虽然简单,但依赖于预设锚框,实质上是基于启发式的经验性选择。这种经验性选择是否最优,如何让网络自主决定实例的分类和偏移,成为一个值得探索的问题。
为了解决上述问题,FSAF 模块被引入到 FPN 中。该模块通过在原有的两个分支结构中增加两个小分支,分别负责输出分类和偏移信息。与传统方法不同,FSAF 模块完全不依赖锚框,完全由网络自主决定实例的分类和偏移。
FSAF 模块通过对两个新增加的分支进行训练,分别计算分类损失和回归损失。最终,根据两个损失值的总和来判断哪个分支对应的实例损失最小。例如,在上述示意图中,P3 层的 FSAF 模块对汽车实例的损失最小,因此由 P3 层负责该实例的输出。
FSAF 模块通过轻量级的检测子网络辅助传统锚框检测模块,实现了实例选择的自动化。与传统方法相比,FSAF 模块的选择基于网络学习结果,效果显著优于经验性启发式方法。
转载地址:http://bvzx.baihongyu.com/