2016-10-23

Caffe学习系列——4使用训练好的模型进行分类

本文主要介绍如何用训练好的模型进行分类，如何训练模型可以查看上一篇博文，本文用到的模型即上一篇博文训练好的模型。当然如果你还没有自己训练模型，也可以使用Caffe官网提供的利用imagenet图片和caffenet模型训练好的一个caffemodel。
首先需要准备三个文件：

Caffemodel文件
可以直接在浏览器里输入地址下载，也可以运行脚本文件下载。下载地址为：http://dl.caffe.berkeleyvision.org/bvlc_reference_caffenet.caffemodel
文件名称为：bvlc_reference_caffenet.caffemodel，文件大小为230M左右，为了代码的统一，将这个caffemodel文件下载到caffe根目录下的 models/bvlc_reference_caffenet/ 文件夹下面。也可以运行脚本文件进行下载：
1
# sudo ./scripts/download_model_binary.py models/bvlc_reference_caffenet
均值文件
有了caffemodel文件，就需要对应的均值文件，在测试阶段，需要把测试数据减去均值。这个文件我们用脚本来下载，在caffe根目录下执行：
1
# sudo sh ./data/ilsvrc12/get_ilsvrc_aux.sh

执行并下载后，均值文件放在 data/ilsvrc12/ 文件夹里。用自己训练的模型的话，就需要相应的替换成自己数据集的均值文件。

synset_words.txt文件
在调用脚本文件下载均值的时候，这个文件也一并下载好了。里面放的是1000个类的名称。
deploy.prototxt
这是进行分类时的网络结构，需要与你训练时的网络结构文件大体一致，不同的是没有测试那层，若是用官网的caffenet网络以及他训练好的caffemodel，则该文件也在model/bvlc_reference_caffenet目录下。你可以参考里面的deploy.prototxt来修改自己的train_val.prototxt并重命名为deploy.prototxt

本文使用python方法来进行分类，python代码如下

# -*- coding: utf-8 -*-
#加载必要的库
import numpy as np
import argparse
import sys,os,shutil
import caffe
#将结果输出到txt中
def writeouput(result,path):
    if os.path.isfile(path):
        f=open(path,'a')
        f.write(result+'\n')
        f.close()
    else:
        f=open(path,'w')
        f.write(result+'\n')
        f.close()
#定义输入的参数
def main(argv):
    #设置caffe的根目录
    caffe_root='/home/linbiyuan/caffe/'
    sys.path.insert(0,caffe_root+'python')
    os.chdir(caffe_root)
    #定义输入参数，可设定默认参数
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "input_file",
        help="Input image, directory, or npy."
    )
    parser.add_argument(
        "output_file",
        help="Output npy filename."
    )
    parser.add_argument(
        "output_image_file",
        help="Output npy filename."
    )
    #caffemodel等等也可以使用参数，这里为了简单故注释掉了
    # # Optional arguments.
    # parser.add_argument(
    #     "--model_def",
    #     default=os.path.join(caffe_root,"examples/wow_style/deploy.prototxt"),
    #     help="Model definition file."
    # )
    # parser.add_argument(
    #     "--pretrained_model",
    #     default=os.path.join(caffe_root,"examples/wow_style/wow_style3_iter_50000.caffemodel"),
    #     help="Trained model weights file."
    # )
    # parser.add_argument(
    #     "--mean_file",
    #     default=os.path.join(caffe_root,'python/caffe/imagenet/ilsvrc_2012_mean.npy'),
    #     help="Data set image mean of [Channels x Height x Width] dimensions " +
    #          "(numpy array). Set to '' for no mean subtraction."
    # )
    args=parser.parse_args()

    caffe.set_mode_gpu()
     #deploy.prototxt文件的位置
    net_file=caffe_root+'examples/blog_img/deploy.prototxt'
    #caffemodel文件的位置
    caffe_model=caffe_root+'examples/blog_img/blogimg_type.caffemodel'
     #定义net
    net=caffe.Net(net_file,caffe_model,caffe.TEST)

    #均值文件的位置
    mean_file = caffe_root + 'python/caffe/imagenet/ilsvrc_2012_mean.npy'
    transformer=caffe.io.Transformer({'data':net.blobs['data'].data.shape})
    transformer.set_transpose('data',(2,0,1))
    transformer.set_mean('data',np.load(mean_file).mean(1).mean(1))
    transformer.set_raw_scale('data',255)
    transformer.set_channel_swap('data',(2,1,0))

     #读取图片
    im=caffe.io.load_image(args.input_file)
    net.blobs['data'].data[...]=transformer.preprocess('data',im)
    #获得结果
    out=net.forward()
    #准确率最高的一个结果
    output_prob=out['prob'][0]
    #标签文件位置
    labels_file=caffe_root+'examples/wow_style/synset_words.txt'
    labels=np.loadtxt(labels_file,str,delimiter='\t')
    #根据标签文件获得标签名字，否则输出的是标签的ID
    labels_name = labels[output_prob.argmax()]
    image_name=args.input_file.split('/')[-1]
    #结果保存
    writeouput(image_name+" "+labels_name,args.output_file)
    #将得到分类结果的图片复制到相应类别的目录下，前提需要在该目录下建立各个类别的文件夹，看个人需求，可以注释掉这两行代码，
    topath=args.output_image_file+labels_name+'/'+image_name
    shutil.copy(args.input_file,topath)

    # print 'output label:',labels_name
    # return labels_name
if __name__ == '__main__':
    main(sys.argv)

输出的结果是：
使用上一篇博文训练好的网络进行分类的结果还是不错，
分类的效果如下：

你也可以使用caffe开发团队编写了一个python版本的分类文件，路径为 python/classify.py
运行这个文件必需两个参数，一个输入图片文件，一个输出结果文件。而且运行必须在python目录下。假设当前目录是caffe根目录，则运行：

1	# cd python# sudo python classify.py ../examples/images/cat.jpg result.npy

分类的结果保存为当前目录下的result.npy文件里面，是看不见的。而且这个文件有错误，运行的时候，会提示Mean shape incompatible with input shape的错误。因此，要使用这个文件，我们还得进行修改：

修改均值计算
定位到
mean = np.load(args.mean_file)
这一行，在下面加上一行：
mean=mean.mean(1).mean(1)
则可以解决报错的问题。

修改文件，使得结果显示在命令行下：
定位到

# Classify. 
start = time.time() 
predictions = classifier.predict(inputs, not args.center_only) 
print("Done in %.2f s." % (time.time() - start))

这个地方，在后面加上几行，如下所示：

# Classify. start = time.time() predictions = classifier.predict(inputs, not args.center_only) print("Done in %.2f s." % (time.time() - start)) imagenet_labels_filename = '../data/ilsvrc12/synset_words.txt' labels = np.loadtxt(imagenet_labels_filename, str, delimiter='\t') top_k = predictions.flatten().argsort()[-1:-6:-1] for i in np.arange(top_k.size): print top_k[i], labels[top_k[i]]

就样就可以了。运行不会报错，而且结果会显示在命令行下面。

BeaLin's Blog

Study, Think, Record

Caffe学习系列——4使用训练好的模型进行分类

Contents

Contents