老师,请问rpn一开始的3*3卷积的作用是什么?

来源:5-4 Fast rcnn介绍

Py_Minh

2020-02-05

输入正文

写回答

1回答

会写代码的好厨师

2020-02-10

一般3*3卷积的作用都是加大网络深度,提高非线性表达能力,进而提取更有效的特征,为后续的预测提供保障

0
1
Py_Minh
1.对于faster rcnn,我宏观的理解是:cnn网络从原始图片上获得feature map作为rpn的输入,rpn以feature map的每个点作为anchor中心生成9*h*w个推荐框,这9*h*w个推荐框截取一开始输入rpn的feature map的特征,做一些筛选之后将含有前景的框的内容输入两个fc层。 不知道理解的对不对,但这样理解的话我就不明白rpn一开始的3*3卷积在里面起到了什么作用了; 2.还有您视频里说的"原始图片和3*3区域之间的对应关系"那一段,也没太听懂, 对于sppnet和fast rcnn,是将选择性搜索的结果映射到feature map上,这个能理解, 但faster rcnn是如何做到类似这种“映射”的?(跟上面说的3*3卷积有什么联系吗?) 3.还有既然anchor是基于feature map生成的,那训练时那么多anchor推荐框是如何进行标注的? 1和2感觉还是我没能理解3*3滑动窗口导致的,3应该也是跟“映射”相关的,还望老师解惑。
2020-02-11
共1条回复

深度学习之目标检测常用算法原理+实践精讲

从原理到场景实战,掌握目标检测核心技术

877 学习 · 221 问题

查看课程