立体视觉是计算机视觉中最为重要的方向之一,在视差检测方面KITTI、MiddleBury提供的数据集常被作为Benchmark。

一、重要的立体视觉BenchMark

        MiddleBury计算机视觉网站  http://vision.middlebury.edu/

        CVLIBS计算机视觉网站       http://www.cvlibs.net/

二、MiddleBury双目BenchMark

1.数据集

        最新的数据集是2014年发布的,也是该系列数据的第三版,分为训练集和测试集,训练集有15对双目图像,并提供groundtrues(GT),还有30对测试集

2.SDK

        为了数据可视化和提交结果的需要,该网站还提供了一些SDK,SDK的使用比较简单,看Readme即可,使用Readme中的demo可以很清楚的知道,我们应该如何使用MiddleBury

        编译好的sdk(如何编译就不讲了,缺什么就装什么,直接sudo apt-get install XXXX)提供了很多工具,大多都是视差图格式转换的

middleburysdk3

        这些工具都可以在readme中找到使用说明

middleburysdk1

算法生成的文件disp0myalg.pfm、timemyalg.tx中,myalg替换成自己的算法,然后使用runeval 就可以得到评价结果了,runeval是根据myalg后缀名来进行判断的,具体参见demo的readme

middleburysdk2

        至于其中的pfm文件,这是一种非正式的浮点图片格式,我的另一篇博客写有Matlab读写pfm格式文件的方法,当然,你也可以使用官方提供的sdk或者cvkit工具来转换。

        cvkit安装好之后,bin文件夹中有imgcmd.exe,用命令行可以把png灰度图转化为pgm格式图像,再用sdk中编译好的工具或者我另一篇博客中写的Matlab工具转化为pfm格式,然后导入就可以了(opencv是支持pgm格式的哦,可以直接写成pgm,然后再转pfm)

三、工具使用

1. 使用OpenCV彩色化MiddleBurry视差图

2. 提取MiddleBurry中的立体匹配算法代码

———————————————————————————————-

留个坑,以后长期更新

发表评论

电子邮件地址不会被公开。 必填项已用*标注