分类目录归档:paddle

如何用python解析cifar10数据集图片

通用图像分类公开的标准数据集常用的有CIFAR、ImageNet、COCO等,由于ImageNet数据集较大,下载和训练较慢,为了方便快速学习图像分类,我们使用CIFAR10数据集。 本文讲解如何将数据集反向重建为rgb彩色图片。 阅读全文

如何用python解析mnist图片

MNIST 数据集是一个手写数字识别训练数据集,来自美国国家标准与技术研究所National Institute of Standards and Technology (NIST)。训练集 (training set) 由来自 250 个不同人手写的数字构成,其中 50% 是高中学生,50% 来自人口普查局 (the Census Bureau) 的工作人员。测试集(test set) 也是同样比例的手写数字数据。 阅读全文

小猪学AI—CNN图像识别之手写数字

前段时间忙了好一阵,终于有时间继续学习了,今天开始通过paddlepaddle的手写数字识别看一下简单的cnn图像识别模型是怎么训练出来的。 阅读全文

小猪学AI—word embedding层是做什么用的?

word embedding的意思是:给出一个文档,文档就是一个单词序列比如 “A B A C B F G”, 希望对文档中每个不同的单词都得到一个对应的向量(往往是低维向量)表示。
比如,对于这样的“A B A C B F G”的一个序列,也许我们最后能得到:A对应的向量为[0.1 0.6 -0.5],B对应的向量为[-0.2 0.9 0.7] (此处的数值只用于示意) 阅读全文