OpenCV4学习笔记(34)——Farneback稠密光流算法-程序员宅基地

技术标签: 计算机视觉  学习笔记  opencv  

在上次的博文OpenCV4学习笔记(33)——KLT稀疏光流跟踪算法中,整理记录的OpenCV中对于KLT稀疏光流跟踪的实现,同时也提到了光流跟踪算法除了稀疏光流跟踪以外,还有稠密光流跟踪算法。所以今天要整理的笔记内容就是在OpenCV中对于稠密光流跟踪算法的实现。

先来回顾一下KLT稀疏光流跟踪算法,它是基于shi-tomas角点检测来实现的,只需要每个特征角点的邻域空间窗口内的局部信息来实现光流跟踪。这种基于局部点的光流跟踪方法带来的优点是运行速度快,但是缺点则是跟踪效果较为一般。

而Farneback稠密光流算法则是基于前后两帧图像中所有像素点的移动估算算法,通过前后两帧图像中所有像素点的位移矢量来实现光流跟踪。由于Fb稠密光流算法需要检测所有像素点的光流,所以其效果比稀疏光流算法要更好,但是相对而言其速度更慢,如果没有经过特殊优化的化是不适合用于实时处理的。

Farneback稠密光流算法的主要实现思路是通过每个像素点的邻域信息(由邻域像素点的像素值大小和位置来确定权重)来对该像素点的坐标位置进行多项式展开,得到一个以原坐标(x0,y0)为自变量,新坐标(x,y)为因变量的多项式,并代入坐标数据来求取该像素点在x和y方向上的移动量(dx,dy)。这样就得到了每个像素点在前后两帧图像中的位移矢量,包含振幅和相位。

如果我们将每个像素点位移矢量的振幅和相位信息转化为H、S、V三通道信息,就可以在视频流中直观地观察运动物体的运动情况了,也就实现了对于运动物体的稠密光流跟踪。

在OpenCV中提供了calcOpticalFlowFarneback()这个API来进行稠密光流的计算,这个API使用的是图像金字塔的FB稠密光流算法,它是对上一帧和当前帧图像分别建立图像金字塔,再分别对两个图像金字塔自顶向底地对同一层图像进行FB算法的计算。由于在低分辨率层图像中,运动速度较快的物体不易逃脱检测窗口的捕捉,有利于检测运动程度较大的目标,所以使用图像金字塔的FB稠密光流算法相比一般的FB稠密光流算法具有更好的鲁棒性,能够允许目标比较大程度的运动。

calcOpticalFlowFarneback()的参数含义如下:

第一个参数prev:输入的上一帧图像,为8位单通道图;

第二个参数next:输入的当前帧(或者叫下一帧)图像,为8位单通道图;

第三个参数flow:输出的光流矩阵,其尺寸和输入图像一致,矩阵中每个元素都是一个Point2f类型的点,表示在输入图像中相同位置的像素点在上一帧和当前帧图像中分别在x方向和y方向的位移,即(dx,dy);

第四个参数pyr_scale:生成图像金字塔时上下两层的缩放比例,取值范围是0~1;当该参数为0.5时,即为经典的图像金字塔;

第五个参数level:生成的图像金字塔的层数;当level=0时表示不使用图像金字塔的FB稠密光流算法;一般取level=3;

第六个参数winsize:表示滤波和检测的窗口大小,该参数越大对噪声抑制能力越强,并且能够检测快速移动目标(目标像素点不会移出窗口),但会引起运动区域的模糊;

第七个参数iterations:对每层金字塔图像进行FB算法时的迭代次数;

第八个参数poly_n:对当前像素点进行多项式展开时所选用的邻域大小,该参数值越大,运动区域模糊程度越大,对目标运动检测更稳定,会产生更鲁棒的算法和更模糊的运动场,官方推荐poly_n = 5或7;

第九个参数poly_sigma:进行多项式展开时的高斯系数;推荐值为:当poly_n = 5时,poly_sigma = 1.1;当poly_n = 7时,poly_sigma = 1.5;

第十个参数flag:进行光流估算的滤波器,有以下两种选择:
(1)OPTFLOW_USE_INITIAL_FLOW使用输入流作为初始流近似值,并使用盒子滤波器进行光流估算;
(2)OPTFLOW_FARNEBACK_GAUSSIAN使用高斯滤波器进行光流估算,高斯滤波器相比盒子滤波器的估算结果更精确,但运行速度较慢。

下面是具体的代码演示:

	VideoCapture capture;
	//capture.open("D:\\opencv_c++\\opencv_tutorial\\data\\images\\video.avi");
	capture.open("D:\\OpenCV\\opencv\\sources\\samples\\data\\vtest.avi");
	if (!capture.isOpened())
	{
    
		return 0;
	}
	Mat pre_gray, now_gray;
	capture.read(pre_gray);
	cvtColor(pre_gray, pre_gray, COLOR_BGR2GRAY);
	Mat flow = Mat::zeros(pre_gray.size(), CV_32FC2);

	Mat frame, move_x, move_y;
	move_x = Mat::zeros(flow.size(), CV_32F);
	move_y = Mat::zeros(flow.size(), CV_32F);
	while (capture.read(frame))
	{
    
		cvtColor(frame, now_gray, COLOR_BGR2GRAY);
		calcOpticalFlowFarneback(pre_gray, now_gray, flow, 0.5, 3, 9, 1, 7, 1.5, OPTFLOW_FARNEBACK_GAUSSIAN);
		for (int row = 0; row < flow.rows; row++)
		{
    
			for (int col = 0; col < flow.cols; col++)
			{
    
				//遍历光流矩阵,将x和y方向上的移动值分别存放为独立的矩阵
				Point2f move_x_y = flow.at<Point2f>(row, col);
				move_x.at<float>(row, col) = move_x_y.x;
				move_y.at<float>(row, col) = move_x_y.y;
			}
		}

		Mat mag, ang;
		cartToPolar(move_x, move_y, mag, ang);		//将移动矢量从笛卡尔坐标转换极坐标,输出像素点移动的幅度和相位(弧度)
		Mat H, S, V;
		//以相位值来确定色调H,像素点的不同移动方向形成不同颜色
		H = ang * 180 / CV_PI / 2;			//将弧度转为角度,且在OpenCV中H取值范围是0~180°
		convertScaleAbs(H, H);
		//饱和度S设置最大255,色彩最浓,有利于观察
		S = Mat::zeros(move_x.size(), CV_8UC1);
		S = Scalar(255);
		//亮度V由像素点的移动幅度决定,幅度越大则亮度越大
		normalize(mag, V, 0, 255, NORM_MINMAX);
		convertScaleAbs(V, V);

		vector<Mat> HSV(3);
		HSV[0] = H;
		HSV[1] = S;
		HSV[2] = V;
		Mat result;
		merge(HSV, result);
		//转换到RGB色彩空间进行显示
		cvtColor(result, result, COLOR_HSV2BGR);
		imshow("result", result);

		char ch = cv::waitKey(20);
		if (ch == 27)
		{
    
			break;
		}
		//将当前帧图像,置为上一帧图像
		swap(pre_gray, now_gray);

	}
	capture.release();

当调用calcOpticalFlowFarneback()后,我们得到一个包含x、y两个方向移动量的矩阵,于是我们通过双重for循环来遍历光流矩阵,将x和y方向上的移动量分别存放到两个独立的矩阵中去。这两个矩阵相当于位移矢量在x、y方向的分量,组合起来就表示每个像素点在前后两帧图像中移动的位移矢量。

接着,再通过cartToPolar()这个API,将上述得到的两个位移矢量分量从笛卡尔坐标系变换到极坐标系中,从而得到位移矢量的振幅和相位。
cartToPolar()这个API的参数如下:
第一个参数x:输入的x分量数据,也就是dx;
第二个参数y:输入的y分量数据,也就是dy;
第三个参数magnitude:输出的振幅信息;
第四个参数angle:输出的相位信息。

随后我们将振幅和相位信息转化到HSV空间中。由于相位和色调的取值范围都是 0~2Π ,所以可以利用相位信息来计算出色调H的值,计算公式为H = ang * 180 / CV_PI / 2,将相位由弧度转为角度,且在OpenCV中色调H取值范围是0~180°,所以再除以2。这样通过不同方向的位移计算得到的色调H是不一样的,就给不同移动方向的像素点分配了不同显示色彩,便于观察。

对于饱和度S,我们统一设置为最大值255,用最浓的色彩来显示同样便于我们观察。

最后通过振幅来计算亮度V,也就是将振幅归一化到0~255之间,如果振幅越大则亮度V越大,也就是目标物体的运动程度越大,则显示得更亮。

最后将得到的HSV图像转化为RGB图像,就能够直观得显示出对运动物体的光流跟踪效果了。

下面是演示效果的截图:
在这里插入图片描述
在这里插入图片描述
从效果图中可以看出,Farneback稠密光流跟踪算法能够将视频中走动的人检测出来,而且不同方向和不同运动程度都能够直观地显示出来,这样我们就可以实现基于Farneback稠密光流算法的运动检测。然而,这种方式实现运动检测的实时性很差,在视频播放过程可以看出非常明显的卡顿现象,可能在运算速度上的缺陷也一定程度上限制了Farneback算法的应用吧。

好的,今天的笔记就记录到这里,下次有空再来写博客啦~

PS:本人的注释比较杂,既有自己的心得体会也有网上查阅资料时摘抄下的知识内容,所以如有雷同,纯属我向前辈学习的致敬,如果有前辈觉得我的笔记内容侵犯了您的知识产权,请和我联系,我会将涉及到的博文内容删除,谢谢!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_45224869/article/details/105100996

智能推荐

敏捷测试:探索灵活高效的软件测试方法_敏捷开发环境中,软件测试如何适应和变化-程序员宅基地

文章浏览阅读118次。通过尽早开始测试、持续集成和自动化、小步快跑、频繁交付和协作与沟通等原则,团队可以提高测试效率和质量,及时交付可用的软件版本。通过遵循敏捷测试的原则和实践,团队可以提高测试效率和质量,及时交付可用的软件版本。缺乏足够的时间和资源:由于敏捷开发的迭代周期较短,测试人员可能面临缺乏足够的时间和资源的问题。敏捷测试的概念:敏捷测试是一种基于敏捷软件开发理念的测试方法,强调快速响应变化、持续交付价值和紧密协作。因此,敏捷测试需要采用灵活的需求管理方法,如故事地图、用户故事等,以便更好地理解和管理需求。_敏捷开发环境中,软件测试如何适应和变化

STM32实现呼吸灯和流水灯_stm32103r6做呼吸灯仿真实验代码-程序员宅基地

文章浏览阅读5.3k次,点赞3次,收藏35次。单片机 呼吸灯 流水灯_stm32103r6做呼吸灯仿真实验代码

php支付宝接口实例文档,支付宝接口实例php版-程序员宅基地

文章浏览阅读179次。支付页面:$payr['paymethod']=2;if($payr['paymethod']==0)//双接口{$use_service='trade_create_by_buyer';}elseif($payr['paymethod']==2)//担保接口{$use_service='create_partner_trade_by_buyer';}else//即时到帐接口{$use_servi..._payment_type=1&out_trade_no=ncre_51-2024010312-8051852778∂ner=208822

华为jdk镜像-程序员宅基地

文章浏览阅读1.5k次。https://repo.huaweicloud.com/java/jdk/8u202-b08/https://repo.huaweicloud.com/java/jdk/华为jdk镜像地址,无需登录即可下载jdk。感觉华为_华为jdk镜像

linux文件权限修改_linux不是所有者不能更改权限-程序员宅基地

文章浏览阅读324次。修改linux文件权限命令:chmodLinux系统中的每个文件和目录都有访问许可权限,用它来确定谁可以通过何种方式对文件和目录进行访问和操作。  文件或目录的访问权限分为只读,只写和可执行三种。以文件为例,只读权限表示只允许读其内容,而禁止对其做任何的更改操作。可执行权限表示允许将该文件作为一个程序执行。文件被创建时,文件所有者自动拥有对该文件的读、写和可执行权限,以便于对文_linux不是所有者不能更改权限

vue中的better-scroll横向滚动案例,美团前端面试难度_better-scroll 横向滚动-程序员宅基地

文章浏览阅读808次,点赞12次,收藏15次。if (!} else {});},//新建滚动实例 并监听竖轴滚动的高度click: true, //better-scroll 默认会阻止浏览器的原生 click 事件。当设置为 true,better-scroll 会派发一个 click 事件,我们会给派发的 event 参数加一个私有属性 _constructed,值为 true。probeType: 3, //这个属性设置之后可以监听得到了});//监听滚动事件// 当允许滚动并滚动的y轴小于0。_better-scroll 横向滚动

随便推点

基于ssm高校工会提案管理信息系统的设计与开发的设计与实现(源码+lw+部署文档+讲解等)-程序员宅基地

文章浏览阅读583次,点赞17次,收藏21次。功能对照表的目的是帮助开发团队了解软件的功能状况,及时修复功能缺陷和错误,并提高软件的质量和稳定性。功能编号功能名称功能描述功能状态备注1用户登录用户可以通过提供用户名和密码登录系统正常用户名和密码的验证机制安全性2用户注册用户可以通过提供用户名、密码和电子邮件地址注册新的账户正常无3密码修改用户可以通过提供原密码和新密码修改已有账户的密码正常用户密码的修改操作是否需要提供安全认证4用户信息查看用户可以查看自己的个人信息,如用户名、电子邮件地址、角色等正常无。

《奔跑吧Linux内核》之处理器体系结构_奔跑吧linux内核(第2版)卷1:基础架构-程序员宅基地

文章浏览阅读3.1k次。本文摘自人民邮电出版社异步社区《奔跑吧Linux内核》 第1章 处理器体系结构京东购书:https://item.jd.com/12152745.html 试读地址:http://www.epubit.com.cn/book/details/4835本章思考题 1.请简述精简指令集RISC和复杂指令集CISC的区别。 2.请简述数值0x12345678在大小端字节序处理器的存储器中的存储方_奔跑吧linux内核(第2版)卷1:基础架构

【路径规划】基于matlab吉萨金子塔建造算法栅格地图机器人路径规划【含Matlab源码 2835期】_matlab栅格图路径规划-程序员宅基地

文章浏览阅读582次。吉萨金子塔建造算法栅格地图机器人路径规划完整的代码,方可运行;可提供运行操作视频!适合小白!_matlab栅格图路径规划

如何在命令行中运行 MATLAB_命令行调用matlab-程序员宅基地

文章浏览阅读702次。通过命令行运行 MATLAB,我们可以更高效地执行 MATLAB 相关任务,并将其集成到自动化脚本和批处理任务中。我们将探讨如何设置 MATLAB 运行环境,以及如何在命令行中执行 MATLAB 脚本和命令。首先,我们需要确保 MATLAB 已经正确安装在我们的计算机上,并且 MATLAB 的可执行文件路径已经添加到系统的环境变量中。除了运行脚本,我们还可以在命令行中直接执行 MATLAB 的命令。运行上述命令后,MATLAB 将执行 “sum.m” 脚本,并将结果打印到命令行中。_命令行调用matlab

Python零基础入门篇 - 12 - Python中的布尔类型与空类型-程序员宅基地

文章浏览阅读625次,点赞15次,收藏28次。数字、字符串在布尔类型上的应用(内置函数bool)空类型 None关于 布尔类型 与 空类型的演示小栗子布尔类型的比较运算布尔类型的与或非逻辑运算或运算非运算小结什么是布尔类型及布尔类型的使用场景对于真假的判断 即 布尔类型布尔值类型的数据表示逻辑运算结果,有两种取值:真,使用 True 关键字表示。假,使用 False 关键字表示。 代表布尔类型,也可以对于结果进行真假判断布尔类型的使用场景常备用来判断一件事儿的真假数字、字符串在布尔类型上的应用(内置函数bool)其实在数字与字符串中,有一些固定的值是与

美妆护肤品商城小程序的作用是什么?-程序员宅基地

文章浏览阅读70次。覆盖电脑手机端+手机端打造品牌官网,多种信息呈现及产品上架,客户多渠道进入商城购买产品并多种形式配送,美妆产品品牌多且规格广,基于完善的商品上架流程,分类模块规格化展示产品,让用户进入商城可以快速找到所需产品购买。,产品/订单/数据都能很好的管理及查看,节省大量人力成本,数据分析进一步生意扩张,多种支付方式及配送方式,无论是商城网站还是美妆小程序商城都有多个流量入口,方便商家推广及用户点击/分享/搜索进入查看内容并购物咨询。7、然后上传产品、设置支付、营销、分销等各功能及完善信息,并在商城里呈现。

推荐文章

热门文章

相关标签