分类目录归档：人工智能ai

非极大值抑制（Non-Maximum Suppression，NMS）

概述

非极大值抑制（Non-Maximum Suppression，NMS），顾名思义就是抑制不是极大值的元素，可以理解为局部最大搜索。通俗点讲就是把图片detect检测出的候选框（即每个框可能都代表某种物体）中互相重叠的部分进行去重，只保留最优的框。
NMS在计算机视觉领域有着非常重要的应用，如视频目标跟踪、数据挖掘、3D重建、目标识别以及纹理分析等。阅读全文

AICon2018-《深度学习在图像理解中的应用》-熊鹏飞

发表评论

AICon2018-《深度学习在图像理解中的应用》-熊鹏飞阅读全文

小猪学arduino—获得arduino硬件唯一ID

发表评论

在多终端通信时，如果想在服务端确定是哪个设备的请求，就需要硬件有一个唯一的标识。但是arduino并没有内置这样的函数，google了一下，找到一个封装的比较好的包：ArduinoUniqueID 阅读全文

小猪学arduino—使用esp8266WIFI模块实现双向通信

发表评论

周末翻抽屉，发现一块n年前买的espduino板子，老实说其实当时是买错了，一直丢在那。今天刚好要在pc/pi上给arduino发指令，手上没有多余的esp8266模块，就拿这个板子来用吧，顺便把esp8266模块的使用方法整理一下。阅读全文

哨兵 kick off

发表评论

启动一个试验性质的玩具项目：AI哨兵，可自行巡逻，遇到陌生人报警或攻击；认识家人，支持基本的聊天互动和问答。阅读全文

DA需求识别解析—基于规则推导的query结构分析

发表评论

现在市面上有各种各样的智能音箱，那他们的对话功能是怎么实现的呢？
通常情况下文本类内容的需求都是采用类似搜索引擎的文本相似度检索方式；其他非文本类精准需求例如定个闹铃/听个歌曲等，需要对query进行更深度的识别和解析才能更好的满足。
本文针对后者，介绍一种基于规则推导的query结构分析方法，它基于Trie Tree，实现对用户提问query的需求识别和问题的结构化解析。我们称这类模块为DA，通常包含需求识别(trigger)、需求解析(parser)、需求发现(discovery)等。阅读全文

小猪学Darknet—基于C的深度学习框架

发表评论

最近在研究视频二维码定位清理，涉及到Object Detection对象检测技术，发现Darknet用起来效果不错，本文简单介绍下。先贴几个示例：阅读全文

小猪学AI—图像生成原理与应用

发表评论

概述

最近替换视频中的人脸比较火，涉及的技术主要是图像生成，主要采用生成式对抗网络（GAN, Generative Adversarial Networks ）深度学习模型。GAN是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中（至少）两个模块：生成模型（Generative Model）和判别模型（Discriminative Model）的互相博弈学习产生相当好的输出。
本文基于Deepfakes Faceswap实现了一个简单的图片换脸过程。阅读全文

视频与图片互转工具：ffmpeg使用说明

发表评论

一个非常方便的视频<->图片互转工具：视频截帧、帧图片合成视频、添加水印/字幕等。阅读全文

小猪学AI—迁移学习之人脸识别

发表评论

概述

想给家里的小八爪机器人加上人脸识别功能，比如瞄准的是我时就不能发射炮弹，这样儿子就没法拿这个怪物打我了。。。（也可以在工位上加个摄像头，领导来了提前报警。。。）阅读全文

强化学习之下棋高手

2条回复

一、概述

儿子的国际象棋水平渐长，我已经逐渐下不过他了，作为陪练水平这么不堪怎么能行？！可是自己研究棋谱的时间有点少，自认成为棋协大师的概率比较低，想来想去还是参考AlphaGo Zero做个AI吧，一方面有可能训练出一个大师级的AI做儿子的陪练对棋艺的提升有所帮助，另一方面刚好自己也能顺便学习强化学习。阅读全文

AlphaGo论文译文：用通用强化学习自我对弈，掌握国际象棋和将棋 Mastering-Chess-and-Shogi-by-Self-Play-with-a-General-Reinforcement-Learning-Algorithm

发表评论

AlphaGo论文的译文：用通用强化学习自我对弈，掌握国际象棋和将棋 Mastering-Chess-and-Shogi-by-Self-Play-with-a-General-Reinforcement-Learning-Algorithm 阅读全文

AlphaGo论文译文：用深度神经网络和树搜索征服围棋 Mastering the game of Go with deep neural networks and tree search

发表评论

AlphaGo论文的译文：用深度神经网络和树搜索征服围棋 Mastering the game of Go with deep neural networks and tree search 阅读全文

Keras: 基于 Python 的深度学习库

发表评论

Keras 是一个用 Python 编写的高级神经网络 API，它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。能够以最小的时延把你的想法转换为实验结果，是做好研究的关键。阅读全文

小猪学AI—图像分类之猫狗识别

发表评论

概述

前段时间尝试了手写数字的识别，因为模型是使用比较干净的黑底白字图片训练的，直接拿拍的手写照片识别效果不太好，无论是拍照时光线的明暗不均匀、笔的粗细、纸张的边缘等都对模型识别有很大影响，所以当时在模型识别前做了大量的图片预处理工作才使实际的应用准确率得到提升。难道图片的识别都要做如此复杂的预处理吗？阅读全文

如何用python解析cifar10数据集图片

发表评论

概述

通用图像分类公开的标准数据集常用的有CIFAR、ImageNet、COCO等，常用的细粒度图像分类数据集包括CUB-200-2011、Stanford Dog、Oxford-flowers等。其中ImageNet数据集规模相对较大，大量研究成果基于ImageNet。ImageNet数据从2010年来稍有变化，常用的是ImageNet-2012数据集，该数据集包含1000个类别：训练集包含1,281,167张图片，每个类别数据732至1300张不等，验证集包含50,000张图片，平均每个类别50张图片。阅读全文

Kaggle

发表评论

mark 阅读全文

如何从汽车照片中扣出车牌？

发表评论

为了做车牌识别训练，先单独研究下怎么从照片里扣出车牌区域。阅读全文

Convolution Network及其变种（反卷积、扩展卷积、因果卷积、图卷积）

发表评论

mark 阅读全文

如何用python解析mnist图片

发表评论

MNIST 数据集是一个手写数字识别训练数据集，来自美国国家标准与技术研究所National Institute of Standards and Technology (NIST)。训练集 (training set) 由来自 250 个不同人手写的数字构成，其中 50% 是高中学生，50% 来自人口普查局 (the Census Bureau) 的工作人员。测试集(test set) 也是同样比例的手写数字数据。阅读全文

闫金钢的Blog

自律自省，不喜不悲，保持爱心和希望

分类目录归档：人工智能ai

非极大值抑制（Non-Maximum Suppression，NMS）

概述

AICon2018-《深度学习在图像理解中的应用》-熊鹏飞

小猪学arduino—获得arduino硬件唯一ID

小猪学arduino—使用esp8266WIFI模块实现双向通信

哨兵 kick off

DA需求识别解析—基于规则推导的query结构分析

小猪学Darknet—基于C的深度学习框架

小猪学AI—图像生成原理与应用

概述

视频与图片互转工具：ffmpeg使用说明

小猪学AI—迁移学习之人脸识别

概述

强化学习之下棋高手

一、概述

AlphaGo论文译文：用通用强化学习自我对弈，掌握国际象棋和将棋 Mastering-Chess-and-Shogi-by-Self-Play-with-a-General-Reinforcement-Learning-Algorithm

AlphaGo论文译文：用深度神经网络和树搜索征服围棋 Mastering the game of Go with deep neural networks and tree search

Keras: 基于 Python 的深度学习库

小猪学AI—图像分类之猫狗识别

概述

如何用python解析cifar10数据集图片

概述

Kaggle

如何从汽车照片中扣出车牌？

Convolution Network及其变种（反卷积、扩展卷积、因果卷积、图卷积）

如何用python解析mnist图片