抱歉,您的浏览器无法访问本站

本页面需要浏览器支持(启用)JavaScript


了解详情 >

实战Google深度学习框架 笔记-第6章 图片识别 与 CNN

介绍 CNN 在图片识别的应用 和 CNN 基本原理 以及 如何使用 TensorFlow 来实现 CNN .

1. 图像识别介绍与经典数据集

视觉是人类认识世界非常重要的一种知觉.

经典数据集

  1. MNIST
  2. CIFAR
  3. ImageNet

CIFAR 数据集是一个影响力很大的图像分类数据集, 是图像词典项目(Visual Dictionary) (7) 中800万张图片的一个子集, 都是 32×32的彩色图片, 由Alex Krizhevsky教授、Vinod Nair博士和Geoffrey Hinton教授整理的.

CIFAR-10 问题收集了来自 10个 不同种类的 60000张图片, Cifar-10中的图片大小都是固定的且每一张图片中仅包含一个种类的实体

ImageNet 是为了更加贴近真实环境下的图像识别问题,基于 WordNet, 由斯坦福大学(Stanford University)的李飞飞(Feifei Li)带头整理的ImageNet很大程度地解决了这两个问题。 ILSVRC2012 包含来自 1000 个类别 120万 张图片.

2. CNN 介绍与常用结构

这部分内容详见 Convolutional Neural Networks

如何搭建一个神经网络,包括最新的变体,如: ResNet

3. 经典 CNN 模型

  • LeNet-5
  • Inception
  • ResNet

3.1 LeNet-5 模型

该网络 1980s 提出,主要针对灰度图像训练的,用于识别手写数字。

3.2 Inception-v3 模型

4. CNN 迁移学习

4.1 迁移学习介绍

Reference

Comments