我们参考caffe中ImageNet的例子来完成图像分类,我们的流程如下
1.参考ImageNet的代码,构建我们自己的数据集,jpg格式的图像分为train和val,即训练集和测试集
2.在文本文件中列出图像和标注
3.修改create_convert脚本,将图像转化为lmdb格式,注意,一定是jpg格式的图像,如果没有进行大小归一化,最好在脚本中进行缩放操作
4.使用make_mean脚本,计算图像均值
5.修改solver_prototxt文件和train_val_prototxt文件中的参数,进行训练
老外的教程果然还是非常赞的
这里,我们首先释出编译好的读取wrl文件的程序,如左图所示,是打开的一个CASIA-3D-Face数据库的三维模型文件,使用Opengl进行了绘制。这个程序还提供了一些快捷键,使我们可以方便的移动模型和视角,如ASDW等。