浅谈大数据-机器学习-人工智能简单联系框架

来源:禧泰公司 2018-05-28

1. 基本概念

大数据是针对5V数据(Volume, Variety, Velocity, Variability, Veracity)的采集、数据存储、数据挖掘和数据可视化等技术的集合。1980年未来学家托夫勒在其著作《第三次浪潮》中首次提到大数据这一概念。20089月《自然》杂志推出大数据封面专栏,在科学界备受瞩目,2009年当即成为互联网技术行业中的热门词汇。2011年全球著名公司麦肯锡(McKinsey)发表的报告Big data: The next frontier for innovation, competition, and productivity[1]将大数据提升到技术革命的新高度。

机器学习是通过学习知识改进算法性能的一种方法。1949年,机器学习初代目——Hebb学习规则,拉开了机器学习的序幕。1959年,“机器学习”一词诞生,创造者阿瑟·萨缪尔(Arthur Samuel)被尊为“机器学习之父”。其后,各类机器学习方法相继问世,符号学习与统计学习先后登上主流舞台,符号学派、贝叶斯学派、联结学派、进化学派、类推学派百家争鸣。

人工智能是一个关于如何让机器像人类一样思考的研究领域。1950年,阿兰·图灵(Alan Turing)发表《Computing Machinery and Intelligence》,其中的模仿游戏后来被称作图灵测试,用于判断机器是否具有智能的依据。201468日,尤金·古斯特曼(一个聊天机器人)成功让人类相信它是一个13岁的男孩,成为有史以来首台通过图灵测试的计算机[2]2016-2017年,围棋人工智能程序——阿尔法狗(AlphaGo),一路披荆斩棘,先后完败围棋界各路大师。各种人工智能产品,如智能翻译、智能语音、智能推荐、智能助手、智能驾驶等,早已开始以一种技术革新的姿态惠及人类。

2. 联系框架

三者之间的联系如图1所示,可概括为以下四点。

l  机器学习大数据人工智能核心

l  人工智能的语音、视觉模型是通过对大量数据进行训练后获得的,从这种意义上来说,大数据人工智能基石。虽然有些模型可以通过无监督学习获得,但最基本的识别模型离不开监督训练。

l  随着计算机软硬件水平的不断提升,机器学习中的深度学习方法越发成为人工智能研究领域的最大依赖

l  人工智能是各类语音模型和视觉模型以及中心调度模块的组装。语音、视觉模型利用机器学习方法获得,包括分类模型、预测模型和生成模型等三类。中心调度模块类似于电脑的CPU,比如它会首先调用视觉模型来辨别面前的主人,然后询问有何吩咐?当主人发出想要吃面包的指令后,便调用语音模型分析主人话的涵义,在知识库中查询面包的制作方式和面包机的使用方式。当然,没有这么简单,至少还需要完成寻找面包机位置、规划抵达路径等等任务。

image001.jpg

1:大数据-机器学习-人工智能联系框架

3. 大数据基本技术解析

Ø  数据采集。包括人工采集、器械采集和网络日志与爬虫等方式。器械采集的数据如气象监测数据、地震监测数据、矿产勘查数据等。网络日志与爬虫是主要的线上数据采集方式。

Ø  数据存储。大数据的5V性质对存储技术提出了非常高的要求,大数据应用需求反过来又促进了非关系数据库(Nosql)、分布式数据库系统和分布式文件系统的巨大升级迭代。

Ø  数据挖掘。从大数据中获取有价值的(商业、服务)信息,是大数据技术的初衷,这种挖掘有用信息的过程就叫数据挖掘。数据挖掘包括传统计算方法和机器学习方法,而5V性质决定了机器学习方法是大数据技术的核心驱动。传统计算方法即函数式计算方法,output = function(input)。机器学习方法是通过从样本中学习知识改进算法,以对目标进行分类、预测和生成新目标的一种方法,output = model(input),它是大数据技术和人工智能领域的核心。机器学习方法主要包含以下五大学派:

 符号学派。基于逻辑推理,如决策树和随机森林。

贝叶斯学派。基于概率统计,如朴素贝叶斯和马尔科夫。

联结学派。受动物神经网络行为特征启发,主指神经网络算法。

进化学派。模拟达尔文生物进化论自然选择机制的生物进化过程,主指遗传算法。

类推学派。根据约束条件来优化函数[3]如支持向量机。

Ø  数据可视化。一门直接刺激受众视觉神经的展示技术,展示方式包括静态图表、动画和交互式图表。一份好的可视化成果具有信息表达清晰、样式美观、内容引人注目、交互控件简单易用等特征。在网络中通过网络前端(主要是html)与外界交互,同时还需要后端的数据库和服务器语言支持,总体涉及网站开发整条技术路线。在大数据时代,可视化所面临的最大挑战是如何满足高速需求,如在硬件上考虑如何增加内存、提高并行处理能力,在软件上考虑如何对现有展示系统进行优化升级。另外,数据挖掘过程离不开可视化分析。

4. 深度学习介绍

深度学习属于机器学习方法五大学派中的联结主义学派,实际上是依靠多层神经网络模型,提取多种特征的训练过程,包括智能语音和智能图像两个分支领域,分别对应着人类的感觉器官——耳朵和眼睛。与传统的函数式计算方法对应,神经网络的表达式为:input × weight = output。在神经网络方法的应用中,首先要明确输入、输出和损失函数(策略)。下面我们介绍几个流行的神经网络。

一般神经网络结构。网络各层之间均为全连接方式,也可称之为全连接网络。

image003.jpg

23-layer NN

CNN(Convolutinal Neural Networks),卷积神经网络。网络中加入卷积层(相当于滤波)和池化层(相当于抽样),通过局部连接和权值共享大大减少了训练参数。下图Lenet-5[4]CNN开山之作《Gradient-Based Learning Applied to Document Recognition》,后来,为解决实际应用中遇到的多尺度输入、候选框选择等问题,开发出了AlexNetVGGNetInceptionResNet等经典模型,以及R-CNNFast R-CNNFaster R-CNN等一系列变种。

image005.png

3CNN

 FCN(Fully Convolutional Networks) [5],全卷积网络。网络中加入反卷积层和上采样层,特点是试图对所有像素所属的类别作出判断,用于图像分割。

image007.png

4FCN

 RNN(Recurrent neural Networks),循环神经网络。该网络重点针对时间序列的长时记忆问题,网络结构如下[6]

image009.png

5RNN

RL(Reinforcement Learning),强化学习方法。网络中加入动作响应和奖励反馈机制,从而进行自我学习。如DQN(Deep Q-learning Networks) [7]其动作响应函数为:

state + action = reward + next state

动作价值用Q_action表示,通过神经网络得到。

以评价动作价值的标准Q_action = reward + gamma cdot Q(next state, all actions),作为策略依据。DQN整体网络结构如下:

image011.jpg

6DQN

开发游戏外挂可参考此方法,全球皆知的AlphaGo也用到了RL,其中还用到了蒙特卡洛搜索树(MCTS),以及前期已训练好的DNN模型,因此也可以说是融入了迁移学习思想,迁移学习重点在于通过对已有模型的重用来提高计算效率。

GAN(Generative Adversarial Networks),对抗学习方法。该网络主要被用于生成新的目标。特点是需要训练两个网络G(Generator Network)D(Discriminator Network),如下[8]

image013.jpg

7GAN

在以上网络中:

 z为噪声输入,G(z)对应的标签为0x为图片输入,对应的标签为1

Real Images(x)Fake Images(G(z))的维度是相同的。

 loss function(基于tensorflow):

D_gene = discriminator(G(z))

D_real = discriminator(x)

loss_D = tf.reduce_mean(tf.log(D_real)+tf.log(1-D_gene))

loss_G = tf.reduce_mean(tf.log(D_gene))

5. 结语

领略到AlphaGo在围棋界的天下无敌,再回想一下sofia机器人那句“I will destroy humans!”,不禁让人后背发凉。面对霍金、比尔·盖茨、马斯克等大神领衔的人工智能威胁论,让我们祝愿未来那些比人类更聪明的机器阴暗的一面,同核武、化武一道永远休眠。


参考资料:

1. Big data: The next frontier for innovation, competition, and productivity(May 2011) by James

Manyika, Michael Chui, Brad Brown, et al.

2. 机器学习的前世今生:一段波澜壮阔的历史,DataCastle 数据城堡,2016.

3. http://www.cyzone.cn/a/20170422/310196.html.

4. LecunY,BottouL,BengioY,HaffnerP.Gradient-basedlearningappliedtodocumentrecognition[J].

Proceedings of the IEEE, 1998, 86(11): 2278-2324.

5.  Long J, Shelhamer E, Darrell T. Fully convolutional networks for  semantic segmentation[J]. Pro-ceedings of the IEEE, 2015:3431-3440.

6. https://www.jianshu.com/p/9dc9f41f0b29.

7. Mnih V, Kavukcuoglu K, Silver D, et al. Playing Atari with Deep Reinforcement Learning[J]. Com-puter Science, 2013: 1-9.

8. https://blog.csdn.net/u012223913/article/details/75051516?locationNum=1&fps=1. 图有所改动.


声明:本网站所载信息和数据等仅供参考,若用于商业用途需授权,请联系我们。转载或引用本网版权所有之内容须注明转自(或引自)城市房产字样,并标明城市房产网址:www.cityhouse.cn

相关文章