20220302显著性算法:Itti

0 说明

本篇文章主要了解了Itti显著性检测算法,并阅读相关的代码,最后在SAR图像上进行实验和测试。
原理部分本文主要参考了:https://blog.csdn.net/weixin_42647783/article/details/82532179
代码部分主要参考了https://zhuanlan.zhihu.com/p/441836726

1 简介

Itti视觉显著性模型的结构如下图[1]。
20220302显著性算法:Itti

2 Itti算法

2.1 输入

文章中图片的尺寸为640×480静态彩色照片,包括RGB三个通道。

2.2 构建高斯金字塔

先将输入图像表示成0层的高斯金字塔。其中第0层表示输入图像,第1-8层分别采用3×3的高斯滤波器进行滤波和下采样,大小分别为输入图像的1/2、1/4、1/8…1/256,即可得到9个尺度下的三通道图像r%28%5Csigma%29%E3%80%81g%28%5Csigma%29%E3%80%81b%28%5Csigma%29,其中%5Csigma%20%5Cin%5C%7B0%20.%20.8%5C%7D
(1)构建亮度高斯金字塔
在九个尺度下计算I%3D%28r%2Bg%2Bb%29%20/%203,我们可以得到I%28%5Csigma%29

(2)构建颜色高斯金字塔
在9个尺度下,分别计算:
红色特点:R%28%5Csigma%29%3Dr%28%5Csigma%29-%28g%28%5Csigma%29%2Bb%28%5Csigma%29%29%20/%202
绿色特点:G%28%5Csigma%29%3Dg%28%5Csigma%29-%28r%28%5Csigma%29%2Bb%28%5Csigma%29%29%20/%202
蓝色特点:B%28%5Csigma%29%3Db%28%5Csigma%29-%28r%28%5Csigma%29%2Bg%28%5Csigma%29%29%20/%202
黄色特点:Y%28%5Csigma%29%3D%28r%28%5Csigma%29%2Bg%28%5Csigma%29%29%20/%202-%7Cr%28%5Csigma%29-g%28%5Csigma%29%7C%20/%202-b%28%5Csigma%29

(3)构建方向金字塔
接下来采用Gabor滤波器构建方向金字塔O%28%5Csigma%2C%20%5Ctheta%29,其中%5Csigma%20%5Cin%5C%7B0%20.%20.8%5C%7D%5Ctheta%20%5Cin%5Cleft%5C%7B0%5E%7B%5Ccirc%7D%2C%2045%5E%7B%5Ccirc%7D%2C%2090%5E%7B%5Ccirc%7D%2C%20135%5E%7B%5Ccirc%7D%5Cright%5C%7D

2.3 特征图的构建

获得亮度、颜色、方向高斯金字塔之后,采用Center-Surround方法,其中Center(c)表示精细尺度,Surround(s)表示粗尺度计算对应的特征图。计算方法为:
I%28c%2C%20s%29%3D%7CI%28c%29%20%5Cominus%20I%28s%29%7C
R%20G%28c%2C%20s%29%3D%7C%28R%28c%29-G%28c%29%29%20%5Cominus%28G%28s%29-R%28s%29%29%7C
B%20Y%28c%2C%20s%29%3D%7C%28B%28c%29-Y%28c%29%29%20%5Cominus%28Y%28s%29-B%28s%29%29%7C
O%28c%2C%20s%2C%20%5Ctheta%29%3D%7CO%28c%2C%20%5Ctheta%29%20%5Cominus%20O%28s%2C%20%5Ctheta%29%7C
其中c%20%5Cin%5C%7B2%2C3%2C4%5C%7Ds%3Dc%2B%5Cdelta%2C%20%5Cdelta%20%5Cin%5C%7B3%2C4%5C%7D。上面的%5Cominus表示将粗尺度插值到细尺度后减去矩阵元素。 I表示亮度特征图,R%20G%28c%2C%20s%29表示颜色特征图,O表示方向特征图。

2.4 显著图的构建

本文提出了一种特征图归一化算子%5Cmathcal%7BN%7D%28%5Ccdot%29,它可以增强具有少量活动峰(即尖锐值)的特征图,并抑制具有大量活动峰的特征图。操作方法如下:
(1)首先对输入的特征图归一化到范围%5B0%20.%20.%20.%20M%5D
(2) 找到该特征图的全局最大值M所在位置并计算其他所有局部最大值的均值%5Cbar%7Bm%7D,然后把整 个特征图同乘以%28M-%5Cbar%7Bm%7D%29%5E%7B2%7D
如下图所示,中间一列的上图是具有大量活动峰的特征图。 %5Cmathcal%7BN%7D%28%5Ccdot%29操作后得到的特征图整体比较平滑,活动峰被抑制。中间一列的下图是具有少量活动峰的特征图。 %5Cmathcal%7BN%7D%28%5Ccdot%29 操作后得到的特征图在原来的活跃峰值处得到增强。
20220302显著性算法:Itti
通过以上操作,可以得到最终的视觉显着性图,计算方法如下:
%5Cbar%7BI%7D%3D%5Cstackrel%7B4%7D%7B%5Coplus%7D%20%5Cunderset%7Bc%3D2%20s%3Dc%2B3%7D%7B%5Coplus%7D%5E%7Bc%2B4%7D%20%5Cmathcal%7BN%7D%28I%28c%2C%20s%29%29
%5Cbar%7BC%7D%3D%5Cstackrel%7B4%7D%7B%5Coplus%3D2%7D%7B%5Coplus%7D%20%5Cunderset%7Bs%3Dc%2B3%7D%7B%5Coplus%7D%5B%5Cmathcal%7BN%7D%28R%20G%28c%2C%20s%29%29%2B%5Cmathcal%7BN%7D%28B%20Y%28c%2C%20s%29%29%5D
%5Cbar%7BO%7D%3D%5Csum_%7B%5Ctheta%20%5Cin%5Cleft%5C%7B0%5E%7B%5Ccirc%7D%2C%2045%5E%7B%5Ccirc%7D%2C%2090%5E%7B%5Ccirc%7D%2C%20135%5E%7B%5Ccirc%7D%5Cright%5C%7D%7D%20%5Cmathcal%7BN%7D%28%5Cstackrel%7B4%7D%7B%5Coplus%7D%20%5Cunderset%7Bc%3D2%7D%7B%5Cstackrel%7Bc%2B4%7D%7B%5Coplus%7D%7D%20%5Cmathcal%7BN%7D%28O%28c%2C%20s%2C%20%5Ctheta%29%29%29

其中%7B%5Coplus%7D是指将多个图像调整至同一个尺寸后相加的操作,于是得到了亮度、颜色和方向显著图,最终的显著图S为,
S%3D%28%5Cmathcal%7BN%7D%28%5Cbar%7BI%7D%29%2B%5Cmathcal%7BN%7D%28%5Cbar%7BC%7D%29%2B%5Cmathcal%7BN%7D%28%5Cbar%7BO%7D%29%29%20/%203

一般在目标检测中,根据设定的阈值检测显着性目标。设定的阈值逐渐降低,得到的显着性目标会逐渐增加,检测时间也会增加。论文的实验如图所示。
20220302显著性算法:Itti

3 论文实验

论文在不同加性噪声下对同一图像的检测效果如下图所示
20220302显著性算法:Itti
论文还对比了Reinagel和Zador提出的SFC(Spatial Frequency Content,空间频率内容模型)在检测目标上的效果,实验结果表明,ITTI模型对于噪声具有较好的鲁棒性,而SFC模型则做没有[1]。实验对比如下图所示,(a)是待处理的图像,(b)是ITTI模型得到的视觉显著图,©是SFC模型得到的显著图,(d)是两种模型对检测目标的标记,标记显著图中大于最大值的98%的部分,其中黄色的标记是ITTI模型得到的结果,红色的标记是SFC模型得到的结果。
20220302显著性算法:Itti

4 相关代码

自己整理的相关代码(matlab)整理如下:
链接:https://pan.baidu.com/s/1DNKAPcIyVFsGHHVdGr_YRw
提取码:ynk8
20220302显著性算法:Itti
文件夹说明:(1)input中为SAR图像示例图片;(2)myitti2.m为主程序文件;(3)paper43.m为我整理的,复现论文43[4]的改良的Itti算法,c%3D%5C%7B2%5C%7Ds%3D%5C%7B4%2C5%2C6%5C%7D

5 SAR图像实验结果

下图是在paper43.m运行出现的结果,可以发现对于彩色图片来说可以很好的检测,但是对于SAR图像来说效果并不是很好。会出现锯齿状的边缘,没有初始图像好。作为引导显著性网络有待考量,还需要经过网络的学习得到。另一个思考就是对于c和s的设置属于超参数,对于不同尺度的目标进行检测的时候需要设置不同的值。
20220302显著性算法:Itti

6 参考文献

[1]L。Itti, C。Koch and E。Niebur, “A model of saliency-based visual attention for rapid scene analysis,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol。20, no。11, pp。1254-1259, Nov。1998, doi: 10.1109/34.730558.
[2]https://blog.csdn.net/weixin_42647783/article/details/82532179
[3]https://zhuanlan.zhihu.com/p/441836726
[4]L。Du, L。Li, D。Wei and J。Mao, “Saliency-Guided Single Shot Multibox Detector for Target Detection in SAR Images,” in IEEE Transactions on Geoscience and Remote Sensing, vol。58, no。5, pp。3366-3376, May 2020, doi: 10.1109/TGRS.2019.2953936.

版权声明:本文为博主pure-pure原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/pure9/article/details/123223349

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2022年3月4日 下午4:47
下一篇 2022年3月4日 下午5:09

相关推荐

此站出售,如需请站内私信或者邮箱!