视频的多尺度时空显著性提取方法研究开题报告

 2022-12-24 03:12

1. 研究目的与意义

现阶段的科技发展速度已经超出了我们的想象,互联网的发展使得人们都相互联系在了一起。与此同时,人们对于图片视频的需求也更加旺盛,因为网络上的娱乐化信息,无非是由文字、图片和视频构成的,文字的出现在我们人类的发展史上有着里程碑的意义。进入互联网时代以后,图片和视频的发掘显得更加重要了。对图像和视频的内容实现快速准确的分析已成为当今时代急待解决的难题。社交app的出现更是增加了图片和视频的需求量。

多尺度体现为金字塔结构,金字塔是一种以多分辨率来解释图像的有效但概念简单的结构。应用于图像分割,机器视觉和图像压缩。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。

视频拥有比图像更丰富的信息,视频显著性检测算法不仅要考虑单帧图像的空间显著性特征,还要考虑时间轴上的运动特征的影响,如物体的运动、相机的运动等。由人类视觉系统的原理还可以知道,人眼对运动中的物体更加敏感,这使得视频显著性检测算法更加关注于正在运动的物体。因为视频是由一幅幅的图像构成的,所以基于图像的显著性方法都可以直接用在视频中的空间特征提取方面。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容与预期目标

研究表明,视频与图像有很多的相似之处,由于视频统计相似性中的相似性就对应着视频的冗余部分,因此视频统计相似性的固有规律同样可以让人眼很大程度的去除可视区域内冗余的信息。大量对视频数据的研究结果证明,视频的幅度谱对数坐标分布都趋向于正比,与自然图像的统计特征类似,视频幅度谱在局部满足线性的条件。

传统的图像金字塔是通过降采样加平滑得到的。首先将原始图像作为最底层图像G0(第0层,利用高斯核函数对其进行卷积,然后对卷积后的图像进行下采样,得到上一层的图像G1(第1层),重复上面的卷积和下采样操作,反复迭代多次,便得到一个金字塔形的多层图像。自下而上每一层的像素数都不断减少,变得越来越粗糙,进行高斯平滑操作是为了降采样后的像素点能更好地代表原图像的像素点。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究方法与步骤

研究方法:

传统的图像金字塔是通过降采样加平滑得到的。首先将原始图像作为最底层图像G0(第0层,利用高斯核函数对其进行卷积,然后对卷积后的图像进行下采样,得到上一层的图像G1(第1层),重复上面的卷积和下采样操作,反复迭代多次,便得到一个金字塔形的多层图像。自下而上每一层的像素数都不断减少,变得越来越粗糙,进行高斯平滑操作是为了降采样后的像素点能更好地代表原图像的像素点。

时间谱残差是采用三维傅里叶变换对视频信息进行了处理,先将视频数据中需要的数据提取出,对运动的信息通过二维傅里叶变换可以得到检测图像的 幅值 A(f) 和 相位 P(f) ,谱残差R(f) ,其中

,R(f)是显著性区域的频域表示,让人能够更加直观的看到显著图的结果,需要再将R(f)和P(f)结合,即通过傅里叶反变换到空间灰度表示。若想要最后的结果显得更加平滑,则要对显著图在进行一次高斯滤波,高斯滤波的作用就是将得到的显著图中的噪声去除并对结果进行平滑。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] 张巧荣. 利用背景先验的显著性检测算法[J]. 中国图象图形学报, 2016, 21(2):165-173.[2] 牟丽, 张学武, 张卓,等. 自然场景下的显著性检测优化方法[J]. 激光与光电子学进展, 2016(12):187-194.[3] 张旭东, 吕言言, 缪永伟,等. 结合区域协方差分析的图像显著性检测[J]. 中国图象图形学报, 2016, 21(5):605-615.[4] 李波, 金连宝, 曹俊杰,等. 分层信息融合的物体级显著性检测[J]. 中国图象图形学报, 2016, 21(5):595-604.[5] 王文豪, 周静波, 高尚兵,等. 基于HSV空间改进的多尺度显著性检测[J]. 计算机工程与科学, 2017, 39(2):364-370.[6] 朱玲, 徐蔚鸿, 陈沅涛,等. 应用图像局部特征和全局特征对比的显著性检测模型[J]. 小型微型计算机系统, 2016, 37(9):2109-2113.[7] 李敬娜. 基于时空域的视频显著性的研究与应用[D]. 北京邮电大学, 2015.[8] 刘宇光,陈耀武. 基于运动谱残差的视频显著性检测算法[J]. 计算机工程, 2014, 40(12):247-250.

[9]Xinyi Cui and Qingshan Liu, Temporal spectralresidual: fast motion saliency detection, Proc.MM’09, 2009

[10]Xinyi Cui and Qingshan Liu, Temporal spectralresidual for fastsalient motiondetection,Neurocomputing,86: 24~32,2012

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

2.20--3.12,熟悉课题背景, 查阅中英文资料, 完成毕设开题。

3.13--4.30,开展课题内容,完成课题的主要实验工作和程序调试。

5.01--5.20,撰写毕设论文初稿并完成中英文翻译。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付