城堡守卫战学习笔记TF029:实现进阶卷积网络

来源:http://www.98ju.net 作者:城堡守卫战 人气:196 发布时间:2019-10-14
摘要:卓绝数据集CIFAENCORE-10,五千0张32x32彩色图像,练习集50000张,测量检验集一千0张。标记10类,每类图片五千张。airplance、automobile、bird、cat、deer、dog、frog、horse、ship、truck。未有别的重叠

卓绝数据集CIFAENCORE-10,五千0张32x32彩色图像,练习集50000张,测量检验集一千0张。标记10类,每类图片五千张。airplance、automobile、bird、cat、deer、dog、frog、horse、ship、truck。未有别的重叠。CIFA奥德赛-100,100类标明。深度学习之父 吉优ffrey Hinton和学生Alex Krizhevsky、Vinod Nair采摘。图片来自80 million tiny images数据集。State-of-the-art 3.5%错误率,GPU演习十几钟头。详细Benchmark和排名在 。LeCun,现存卷积神经网络已经减轻CIFAHighlander-10数据集难点。

根据亚历克斯 cuda-convnet模型修改,两千个batch,种种batch 1二十七个样本,到达73%准确率。GTX1080单显卡几十秒模型磨练时间。CPU慢比很多。如用100k batch 结合学习进程decay(每间隔一段时间下跌学习速率二个比率),正确率可到86%。模型练习参数100万个,预测四则运算总的数量两千万次。对weights举行L2正则化。图片翻转、随机剪切等数据增加,创设更各样本。每一种卷积-最大池化层后用L汉兰达N层,巩固模型泛化才能。

下载TensorFlow Models库,使用个中提供CIFA昂科威-10数据类。git clone

载入常用库,NumPy、time,TensorFlow Models自动下载、读取CIFA中华V-10数据类。

定义batch_size,陶冶轮数max_steps,下载CIFA奥德赛-10数据暗中认可路径。

城堡守卫战学习笔记TF029:实现进阶卷积网络。概念早先化weight函数,tf.truncated_城堡守卫战学习笔记TF029:实现进阶卷积网络。normal截断正态布满初步化权重。Weight加L2 loss ,做L2 正则化。减少特征或惩罚不重大特征权重,缓慢解决特征过多导致过拟合。正则化补助找到该处以的风味权重。为运用有个别特征,需付出loss代价。L1正则创立荒疏特征,大多数无用特征权重被置0。L2正则让特征权重可是大,特征权重较平均。wl调整L2 loss大小,tf.nn.l2_loss函数总计weight L2 loss,tf.multiply L2 loss 乘以wl,得最终 weight loss。tf.add_to_collection weight loss统一存在collection losses,总计神经互连网总体loss使用。

用cifar10类下载数据集,解压、张开到私下认可地方。

用cifar10_input类 distorted_inputs函数产生磨炼多少,蕴涵特征、label,重返封装tensor,每一遍实行生成一个batch_城堡守卫战学习笔记TF029:实现进阶卷积网络。size数量样本。Data Augmentation(数据增进),cifar10_input.distorted_inputs函数,随机水平翻转(tf.image.random_flip_left_城堡守卫战学习笔记TF029:实现进阶卷积网络。right)、随机剪切一块24x24图纸(tf.random_crop)、设置随机亮度对比度(tf.image.random_brightness、tf.image.random_contrast),数据标准(tf.image.per_image_whitening,数据减均值,除方差,保障数据零均值,方差1)。拿到更四种本,带噪声,一张图纸样本变多张图片,扩充样本量,升高精确率。数据增加操作消耗多量CPU时间,distored_inputs用17个单身线程加速职分,函数内部爆发线程池,通过TensorFlow queue调治。

用cifar10_input.inputs函数生成测量试验数据,裁剪图片正中间24x24大小区块,数据规范。

创立输入数据placeholderx,特征、label。设定placeholder数据尺寸,batch_size定义互连网布局要用,数据尺寸第贰个值样本条数须求事先设定,无法设None。数据尺寸的图片尺寸为24x24,裁剪后大小,颜色通道数3,彩色普拉多GB三通道。

率先个卷积层,variable_with_weight_loss 函数创设卷积核参数早先化。卷积核大小5x5,3个颜色通道,六18个卷积核,设置weight起首化函数规范差0.05。wl(weight loss)设0。tf.nn.conv2d函数对输入数据image_holder卷积操作,步长stride设1,padding情势SAME,bias起首化0,卷积结果加bias,用ReLU激活函数非线化。用尺寸3x3,步长2x2最大池化层管理数量,尺寸、步长分歧样,增扩展少丰裕性。tf.nn.lrn函数,L哈弗N,管理结果。

L雷克萨斯LCN起于亚历克斯用CNN出席ImageNet竞赛诗歌。LCRUISERN模仿生物神经系统侧禁止机制,对一些神经元活动创立竞争条件,响应十分的大值变得相对越来越大,禁绝别的报告相当小神经元,加强模型泛化手艺。用LCR-VN后CNN Top1错误率减少1.4%。L昂科威N对无上限边界激活函数ReLU有用,从隔壁八个卷积核响应(Response)挑选相当的大报告,不切合固定边界能幸免过大值激活函数Sigmoid。

其次个卷积层,卷积核尺寸第三维度输入通道数64,bias值全初步化0.1。先进行L劲客N层管理,再用最大池化层。

全连接层,把前边七个卷积层输出结果一切flatten,tf.reshape函数把每一个样本造成一维向量。get_shape函数获取数据扁平化长度。variable_with_weight_loss函数初阶化全连接层weight,隐含节点384,正态分布规范差0.04,bias开端化0.1。设非零weight loss值0.04,全数参数被L2正则约束,幸免过拟合。ReLU激活函数非线性化。

第四个全连接层,隐含节点192。

末尾一层,先创制weight,正态分布标准差设上一隐含层节点数尾数,不计入L2正则。Softmax操作放在总结loss部分,无需对inference输出softmax管理,就能够收获最终分类,直接相比较inference输出各样数值大小。

总体卷积神经互联网从输入到输出流程。设计CNN,布署卷积层、池化层、全连接层布满和一一,超参数设置、Trick使用。卷积神经互联网布局:
conv1:卷积层和ReLU激活函数
pool1:最大池化
norm1:LRN
conv2:卷积层和ReLU激活函数
norm2:LRN
pool2:最大池化
local3:全连接层和ReLU激活函数
local4:全连接层和ReLU激活函数
logits:模型Inference输出结果

算算CNN loss。softmax总结和cross entropy loss 计算合在共同,tf.nn.sparse_softmax_cross_entropy_with_logits。tf.reduce_mean计算cross entropy均值,tf.add_to_collection 添加cross entropy loss 到整体losses collection。tf.add_n全体losses collection 全体loss求和,得最终loss,包涵cross entropy loss,和后多个三番五次层weight L2 loss。Logits节点、label_placeholder传入loss儿童数,获得最终loss。

优化器采纳Adam Optimizer,学习速率1e-3。

tf.nn.in_top_k函数求输出结果top k正确率,暗中认可top 1,输出分类最高类精确率。

tf.InteractiveSession创设暗中同意session ,最初化全人体模型子参数。

启航空图片数据增进线程队列,15个线程加速。

磨练。每种step磨练进程,session run方法实行images_train、 labels_train总计,获得batch训练多少,传入train_op和loss总结。记录各种step时间,每间隔10个step总括显示当前loss、每分钟磨炼样本数量、磨炼batch数据时间,监察和控制所有演习进度。GTX 1080,每秒陶冶1800个样本,batch_size 128,各样batch 0.066s。损失loss,初始4.6,三千步磨炼下落到1.0。

评测模型测验集正确率。测量试验集一千0个样本,使用固定batch_size,各个batch输入测验数据。计算全部样书评测完batch数量。每种step用session run方法获得images_test、labels_test的batch,执行top_k_op总结模型 batch top 1预测正确样本数。汇总全体预测正确结果,求全数测量检验样本预测准确数量。

打字与印刷正确率评测结果计算。

73%正确率。持续加多max_steps,期待正确率逐步增加。max_steps非常大,用学习速率衰减(decay)的SGD练习,临近86%。L2正则,LEnclaveN层升高模型正确率,升高框泛化性。

多少增进(Data Augmentation),给单幅图扩张多少个别本,进步图片利用率,幸免图片结构学习过拟合。利用图片本人品质,图片冗余新闻量比较大,创立分裂噪声,依可识别。神经网络征服噪声正确识别,泛化性更加好。深度学习只要提供丰硕三种本,正确率能够持续晋级。 规模越大越复杂神经互连网模型,能够完成精确率水平越高,供给更相当多据磨练。亚历克斯cuda-convnet测量试验结果,CIFA大切诺基-10,不数据增加,错误最低下落到17%,数据增进,错误率下跌到11%。

    import cifar10,cifar10_input
    import tensorflow as tf
    import numpy as np
    import time
    max_steps = 3000
    batch_size = 128
    data_dir = '/tmp/cifar10_data/cifar-10-batches-bin'
    def variable_with_weight_loss(shape, stddev, wl):
        var = tf.Variable(tf.truncated_normal(shape, stddev=stddev))
        if wl is not None:
            weight_loss = tf.multiply(tf.nn.l2_loss(var), wl, name='weight_loss')
            tf.add_to_collection('losses', weight_loss)
        return var
    def loss(logits, labels):
        labels = tf.cast(labels, tf.int64)
        cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(
            logits=logits, labels=labels, name='cross_entropy_per_example')
        cross_entropy_mean = tf.reduce_mean(cross_entropy, name='cross_entropy')
        tf.add_to_collection('losses', cross_entropy_mean)
        return tf.add_n(tf.get_collection('losses'), name='total_loss')

    ###
    cifar10.maybe_download_and_extract()
    images_train, labels_train = cifar10_input.distorted_inputs(data_dir=data_dir,
                                                            batch_size=batch_size)
    images_test, labels_test = cifar10_input.inputs(eval_data=True,
                                                data_dir=data_dir,
                                                batch_size=batch_size)                                                  
    #images_train, labels_train = cifar10.distorted_inputs()
    #images_test, labels_test = cifar10.inputs(eval_data=True)
    image_holder = tf.placeholder(tf.float32, [batch_size, 24, 24, 3])
    label_holder = tf.placeholder(tf.int32, [batch_size])
    #logits = inference(image_holder)
    weight1 = variable_with_weight_loss(shape=[5, 5, 3, 64], stddev=5e-2, wl=0.0)
    kernel1 = tf.nn.conv2d(image_holder, weight1, [1, 1, 1, 1], padding='SAME')
    bias1 = tf.Variable(tf.constant(0.0, shape=[64]))
    conv1 = tf.nn.relu(tf.nn.bias_add(kernel1, bias1))
    pool1 = tf.nn.max_pool(conv1, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],
                       padding='SAME')
    norm1 = tf.nn.lrn(pool1, 4, bias=1.0, alpha=0.001 / 9.0, beta=0.75)
    weight2 = variable_with_weight_loss(shape=[5, 5, 64, 64], stddev=5e-2, wl=0.0)
    kernel2 = tf.nn.conv2d(norm1, weight2, [1, 1, 1, 1], padding='SAME')
    bias2 = tf.Variable(tf.constant(0.1, shape=[64]))
    conv2 = tf.nn.relu(tf.nn.bias_add(kernel2, bias2))
    norm2 = tf.nn.lrn(conv2, 4, bias=1.0, alpha=0.001 / 9.0, beta=0.75)
    pool2 = tf.nn.max_pool(norm2, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],
                       padding='SAME')
    reshape = tf.reshape(pool2, [batch_size, -1])
    dim = reshape.get_shape()[1].value
    weight3 = variable_with_weight_loss(shape=[dim, 384], stddev=0.04, wl=0.004)
    bias3 = tf.Variable(tf.constant(0.1, shape=[384]))
    local3 = tf.nn.relu(tf.matmul(reshape, weight3) + bias3)
    weight4 = variable_with_weight_loss(shape=[384, 192], stddev=0.04, wl=0.004)
    bias4 = tf.Variable(tf.constant(0.1, shape=[192]))                                      
    local4 = tf.nn.relu(tf.matmul(local3, weight4) + bias4)
    weight5 = variable_with_weight_loss(shape=[192, 10], stddev=1/192.0, wl=0.0)
    bias5 = tf.Variable(tf.constant(0.0, shape=[10]))
    logits = tf.add(tf.matmul(local4, weight5), bias5)
    loss = loss(logits, label_holder)
    train_op = tf.train.AdamOptimizer(1e-3).minimize(loss) #0.72
    top_k_op = tf.nn.in_top_k(logits, label_holder, 1)
    sess = tf.InteractiveSession()
    tf.global_variables_initializer().run()
    tf.train.start_queue_runners()
    ###
    for step in range(max_steps):
        start_time = time.time()
        image_batch,label_batch = sess.run([images_train,labels_train])
        _, loss_value = sess.run([train_op, loss],feed_dict={image_holder: image_batch, 
                                                         label_holder:label_batch})
        duration = time.time() - start_time
        if step % 10 == 0:
            examples_per_sec = batch_size / duration
            sec_per_batch = float(duration)

            format_str = ('step %d, loss = %.2f (%.1f examples/sec; %.3f sec/batch)')
            print(format_str % (step, loss_value, examples_per_sec, sec_per_batch))

    ###
    num_examples = 10000
    import math
    num_iter = int(math.ceil(num_examples / batch_size))
    true_count = 0  
    total_sample_count = num_iter * batch_size
    step = 0
    while step < num_iter:
        image_batch,label_batch = sess.run([images_test,labels_test])
        predictions = sess.run([top_k_op],feed_dict={image_holder: image_batch,
                                                 label_holder:label_batch})
        true_count += np.sum(predictions)
        step += 1
    precision = true_count / total_sample_count
    print('precision @ 1 = %.3f' % precision)

 

参谋资料:
《TensorFlow实战》

接待付费咨询(150元每小时),作者的微信:qingxingfengzi

本文由银河999游戏下载发布于城堡守卫战,转载请注明出处:城堡守卫战学习笔记TF029:实现进阶卷积网络

关键词:

最火资讯