深度学习综述(二)深度学习用于目标检测

        目标识别、目标检测、目标分割、目标跟踪是计算机视觉领域最热门的方向之一。传统机器学习方法中较为常见的做法是在滑动窗口中手工提取特征(例如Hog、SIFT等),然后将提取的特征送入分类器(例如SVM、Adaboost等)中,训练分类器预测输出。而每一类物体都有不同的特征,我们也很难提前知道哪种特征更加优秀,于是近年来目标识别的研究方向转向了深度学习。

        目标识别(检测)问题与分类问题不同,识别或检测要求精准定位目标。一种解决问题的思路是将其看作一个回归问题,这种思路解决问题的效果可能并不理想,另一种更为普遍的做法还是使用滑动窗口进行检测。

阅读更多

Caffe源码精读笔记(一)之caffe.cpp

        博客正式进入caffe源码精读系列,博主会在阅读源码的过程中将自己认为重要的部分记录下来,整理成笔记。由于博主之前粗略浏览过一遍源码,对caffe的架构和caffe中使用的库有了了解,这些笔记介绍整体工作流程和框架的同时,还将偏重于源码的细节。第一篇博客主要由程序入口开始介绍caffe训练的流程。

阅读更多

机器学习中的偏离(bias)与偏差(variance)

        在机器学习中,有两个很重要的概念,bias and variance,根据学习曲线判断当前的状态是high bias还是high variance来调整机器学习中的参数,以达到理想的效果。多年前学习斯坦福机器学习教程时对这两个概念的影响尤为深刻,鉴于这两个概念又是如此重要,特此整理。

阅读更多

Caffe的图像转换工具convert_imageset源码分析

        caffe提供了将图像转换为lmdb或者leveldb格式的工具,在tool文件夹下的convert_imageset中可以找到对应文件,这个工具在很多例子中都有用到,比如mnist和imagenet,由于caffe默认使用lmdb这种又快又小的格式,我们在处理大量图像时也会用到,而我们如果要根据自身需求进行修改,那就需要读源码了。

阅读更多

利用python生成供给Caffe的hdf5数据

        caffe中需要将数据存储为lmdb、hdf5等数据库格式,caffe自带的convert_image工具可以完成lmdb数据格式的转换,但是遇到浮点数,这个工具就不行了,所以,只有存成hdf5了。对于python存储hdf5,本文分析多个demo的数据生成代码,并作出总结(主要就是贴代码了):

阅读更多

python版protobuf的安装和使用

        谷歌的开源项目protobuf,官方支持四种语言版本,C++、Java、Go、Python,使用protobuf的诸多优点就不多介绍了,在我之前的博客中使用过C++版本的protobuf,如果有兴趣可以参考,这里提供python版protobuf的使用方法,博主在学习caffe,将protobuf数据存为hdf5格式,于是protobuf就也成了C++和python数据交互的接口了,好,我们开始吧!

阅读更多

使用Caffe进行图像分类

我们参考caffe中ImageNet的例子来完成图像分类,我们的流程如下

1.参考ImageNet的代码,构建我们自己的数据集,jpg格式的图像分为train和val,即训练集和测试集

2.在文本文件中列出图像和标注

3.修改create_convert脚本,将图像转化为lmdb格式,注意,一定是jpg格式的图像,如果没有进行大小归一化,最好在脚本中进行缩放操作

4.使用make_mean脚本,计算图像均值

5.修改solver_prototxt文件和train_val_prototxt文件中的参数,进行训练

阅读更多

Ubuntu下Caffe的编译、配置、导入eclipse

        Caffe的作者是贾扬清(伯克利大学博士期间成果),其在深度学习科学研究中有着非同一般的地位,尤其是其代码在github上开源,以及CUDA加速的使用,使得普通学者也可以较为轻松的进行训练,介绍就不多说了,作为Caffe的第一课,首先就是Caffe环境配置、编译以及导入IDE中方便调试了,我们开始吧。

阅读更多

MFC绘图介绍

        对于MFC绘图,博主也没有什么真知灼见,只是将自己在学习MFC绘图中遇到的问题进行整理,大部分内容并非原创,博主都在醒目位置给出了出处。包含的内容有DC设备描述表、绘图基础、双缓冲、鼠标控制和MFC中使用OpenGL。希望能有帮助,我们开始吧。

阅读更多

MFC中VSLISTBOX控件的使用

        在VS2010之后陆续加入许多控件,其中就有看上去比较好看的vslistbox,然而vslistbox的资料非常少,这篇博客就来稍稍解读一下vslistbox控件。vslistbox与其它list控件不同,它们的类从CStatic的继承时已经分开了,并且vslistbox比较封闭,没有提供任何消息时间和命令,我们使用该控件的唯一方法是子类化CVSListBox类,通过重载其中虚函数的方式来实现我们的功能。虽然vslistbox非常封闭,但是我们依然可以从微软MSDN的文档中窥见一隅,实现一些并不十分复杂的功能。

阅读更多

Windows下多个库的快速配置——opencv/ boost/opengl/glew/freeglut/glog/protobuf

        点击下载,解压好之后只有一个usr目录,其中包含了opencv、opengl、glew、freeglut、glog、protobuf等,你只需要经过下列三个步骤,就可以一次性永久配置好环境,当然,如果你对库原本就有一些理解,那你应该马上就懂了,如果你常在Linux上配置环境,那你会发现我做的事情其实很简单,就是把各个库集中起来,有点类似于linux中库的安装方法,因此配置变得非常便捷了,博主采用全静态编译,在使用时只需要注意使用静态库就可以了。让我们开始吧。

阅读更多

跨平台的protobuf安装配置方案

        现在有很多介绍protobuf的文章,而本篇博客与其它文章的不同在于,为不同平台及不同编译环境下适配protobuf提供一体化的解决方案,包括linux,windows系统,同时在Windows系统中控制台 MFC等框架下也会有不同的编译环境,比如你可以选择使用静态库还是动态库等,偶尔,我们还会需要google的其它库,比如glog,接下来将进行详细介绍。

阅读更多

MFC中显示Mat格式图像——Mat转CImage方法

        Mat是opencv中的图像格式,如果想要图像在MFC中显示,将Mat格式转为MFC支持的CImage格式是一种较为优秀的解决方案,这篇博客就来介绍在MFC中显示Mat图像的方法。虽然原理相同,但博主还是要介绍两种方式:一种是通过子类化显示控件的方式进行显示,第二种是在父窗口中调用。如果你做的工程比较庞大,博主建议使用子类化控件的方法,当然,如果你是小工程,博主也依然建议你使用子类化的方法,这样不仅使代码结构简单封装良好,而且方便了控件的拓展。

阅读更多

简洁的OpenGL窗口截图——opengl+opencv实现

        在前面的博客中,我们介绍了在MFC中使用OpenGL绘图,现在我们需要将OpenGL窗口中所展示的图形绘制出来,或者保存为图像,坊间使用的很多代码都过于复杂,冗余的代码都浪费在了手写Bmp格式,内存数据格式转换等问题上。我们通常需要简洁强大且高校的代码,于是opencv库成为了我们的首选,并将这些功能封装在类中使得其易于使用。感谢这篇博客的内容,建立了glGraber类,使得我们可以摆脱繁重的代码,特此收录。

阅读更多

在MFC中使用工具条(Toolbar控件及其消息事件)

        MFC中的Mene和Toolbar都是常用的控件,如果你觉得按钮控件不容易组织结构,Menu和Toolbar将是一个不错的选择,你可以参照微软官方的代码添加控件,这篇不可介绍的是最简方法,直接开始吧。过程分为三步:

        1.在资源管理器中添加Toolbar控件

        2.在控件编辑器中添加图标和按钮

        3.为按钮添加消息事件

阅读更多