分类目录归档：paddle

小猪学AI—图像分类之猫狗识别

概述

前段时间尝试了手写数字的识别，因为模型是使用比较干净的黑底白字图片训练的，直接拿拍的手写照片识别效果不太好，无论是拍照时光线的明暗不均匀、笔的粗细、纸张的边缘等都对模型识别有很大影响，所以当时在模型识别前做了大量的图片预处理工作才使实际的应用准确率得到提升。难道图片的识别都要做如此复杂的预处理吗？阅读全文

如何用python解析cifar10数据集图片

发表评论

概述

通用图像分类公开的标准数据集常用的有CIFAR、ImageNet、COCO等，常用的细粒度图像分类数据集包括CUB-200-2011、Stanford Dog、Oxford-flowers等。其中ImageNet数据集规模相对较大，大量研究成果基于ImageNet。ImageNet数据从2010年来稍有变化，常用的是ImageNet-2012数据集，该数据集包含1000个类别：训练集包含1,281,167张图片，每个类别数据732至1300张不等，验证集包含50,000张图片，平均每个类别50张图片。阅读全文

如何从汽车照片中扣出车牌？

发表评论

为了做车牌识别训练，先单独研究下怎么从照片里扣出车牌区域。阅读全文

Convolution Network及其变种（反卷积、扩展卷积、因果卷积、图卷积）

发表评论

mark 阅读全文

如何用python解析mnist图片

发表评论

MNIST 数据集是一个手写数字识别训练数据集，来自美国国家标准与技术研究所National Institute of Standards and Technology (NIST)。训练集 (training set) 由来自 250 个不同人手写的数字构成，其中 50% 是高中学生，50% 来自人口普查局 (the Census Bureau) 的工作人员。测试集(test set) 也是同样比例的手写数字数据。阅读全文

小猪学AI—CNN图像识别之手写数字

发表评论

前段时间忙了好一阵，终于有时间继续学习了，今天开始通过paddlepaddle的手写数字识别看一下简单的cnn图像识别模型是怎么训练出来的。阅读全文

小猪学AI—word embedding层是做什么用的？

发表评论

word embedding的意思是：给出一个文档，文档就是一个单词序列比如 “A B A C B F G”, 希望对文档中每个不同的单词都得到一个对应的向量(往往是低维向量)表示。
比如，对于这样的“A B A C B F G”的一个序列，也许我们最后能得到：A对应的向量为[0.1 0.6 -0.5]，B对应的向量为[-0.2 0.9 0.7] （此处的数值只用于示意）阅读全文