一篇文章讲清人工智能,机器学习和深度学习的区别

AI火爆,但你知道人工智能、机器学习和深度学习有何不同?
【AI世代导读】人工智能代表了未来。人工智能只属于科幻小说。人工智能已成为我们日常生活的一部分。所有这些说法都是正确的,只是取决于你所说的是什么样的人工智能。今年早些时候()Deepmind的AlphaGo击败了韩国围棋大师李世石。媒体在报道AlphaGo的胜利时,混杂使用了人工智能、机器学习和深度学习等多种术语。实际上,这三方面技术都为AlphaGo的胜利做出了贡献。然而,这三项技术各有不同。官方网站近期刊文,介绍了人工智能、机器学习和深度学习概念的区别。英伟达的GPU(图形处理芯片)目前被广泛用于人工智能研究。“AI世代”(微信号:tencentAI)进行了翻译整理。下面这个图表可以直观地看到这些术语之间的关联。其中,人工智能的范畴最大,机器学习次之,而深度学习最小。但实际上,深度学习推动了今天人工智能的大爆发。从不被看好到快速发展人工智能最初可以追溯至1956年,当时多名计算机家在达特茅斯会议上共同提出了人工智能的概念。在随后几十年中,人工智能一方面被认为是人类文明未来的发展方向,另一方面也被认为是难以企及的梦想。实际上,直到2012年之前,情况一直如此。过去几年,人工智能实现了爆炸式发展,尤其是自2015年以来。这在很大程度上是由于,GPU的发展使并行计算变得速度更快、成本更低、性能更强大。与此同时,存储设备的容量变得越来越大,而我们正获得海量数据(即大数据的发展),无论是图片、文字、交易信息,还是地图数据。让我们来看看,计算机科学家是如何推动人工智能从一项不被看好的技术发展成为被数亿用户使用的多款应用。人工智能:来自机器的人类智能回到1956年夏天的那次会议。当时,人工智能行业的先驱提出开发复杂的机器,使其具备人类智能的特征。这一概念被我们称作“通用人工智能”。这样的机器具备人类全部的感知能力(甚至更多)、逻辑推理能力,能像人类一样去思考。在许多电影里,你都可以看到这样的机器成为人类的朋友,例如《星球大战》中的C-3PO,以及终结者。通用人工智能机器仍在电影和科幻小说中不断出现,但至少目前,我们还无法实现这样的人工智能。目前我们所能实现的是“狭义人工智能”。对于特定任务,这样的技术能做得像人类一样好,甚至更好。这种人工智能的范例包括Pinterest的图像分类服务,以及的人脸识别功能。狭义人工智能具备人类智能的某些方面。那么,这些智能来自何处?这就要说到我们的下一篇章:机器学习。机器学习:带来人工智能的方法简单来说,机器学习利用算法去分析数据、学习数据,随后对现实世界情况作出判断和预测。因此,与预先编写好、只能按照特定逻辑去执行指令的软件不同,机器实际上是在用大量数据和算法去“自我训练”,从而学会如何完成一项任务。机器学习的概念来自于人工智能发展的早期。随后多年中,基于算法的方法包括决策树学习、归纳逻辑编程、聚类算法、强化学习,以及贝叶斯网络等等。正如我们所知,这些技术最终都未能形成通用人工智能,而早期的机器学习方法甚至也没有带来狭义人工智能。多年的研究结果表明,机器学习的最佳应用领域之一是计算机视觉。不过,计算机视觉技术仍需要大量人工编程才能实现。需要人工编码的技术包括,用于识别照片中对象边缘的边缘探测滤镜,用于判断形状的形状识别算法,以及用于识别字符,例如“STOP”的分类器。利用这些人工编码的分类器,算法可以理解图像,判断这是否是停止标志。这种技术很强大,但还不算完美。例如在雾天,路边标志很可能看不清楚,而行道树可能也会遮挡标志的一部分。直到最近,计算机视觉在识别图像时一直无法达到人类的水平,这样的识别技术太脆弱,出错率太高。不过,正确的学习算法将可以带来不同。深度学习:实现机器学习的技术机器学习专家们早期提出的另一种基于算法的方法,即人工神经网络,随后得到了发展。神经网络的概念来自于人类大脑理解事物的方式:神经元之间的互联。然而,与神经元紧密联系在一起的人类大脑不同,人工神经网络由离散的分层、连接,以及数据传播方向构成。例如,你可以拍摄一张照片,将其分成多个小块,并输入神经网络的第一层之中。随后,第一层神经元将会把处理过的数据传递给第二层神经元。第二层神经元去完成自己的处理任务。这样的处理一直持续至最后一层,以输出最终结果。每个神经元都会为输入信息赋予权重,即对于正在执行的任务,正确或错误的可能状态。最终输出结果基于对所有这些权重信息的相加。以停止标志为例。标志图片将会被分割,并由神经元去“分析”,包括整体形状、颜色、字母、尺寸,以及移动情况。神经网络的任务是判断这是否就是停止标志。为此,神经网络将基于权重信息得出“可能性向量”。在我们的示例中,神经网络认为,这有86%的可能性是停止标志,有7%的可能性是限速标志,5%的可能性是卡在树上的风筝。随后,网络架构师会告诉神经网络,做出的判断是否正确。人工神经网络在人工智能的诞生早期就已出现,但在“智能性”方面一直未能取得太大突破。问题在于,最基本的神经网络也需要大量的计算资源,因此很难实现。不过,由多伦多大学的吉奥夫里•辛顿(Geoffrey Hinton)带领的一个小型研究团队持续地进行这方面的尝试,最终找到了一种可以由超级计算机运行的算法,证明了这一概念。然而,直到GPU开始大规模部署之后,这种技术才得以普及。回到停止标志的例子,人工神经网络仍然很有可能得出错误的答案。这种神经网络所需的是训练。只有通过数以十万计,甚至百万计的照片进行训练,神经元对输入信息的加权才能足够精确,从而持续得出正确的结果,无论是否有雾,是否下雨。只有在达到这种程度之后,神经网络才能自行判断停止标志应该是什么样。实际上,2012年,人工智能专家吴恩达在供职于谷歌期间开发了神经网络系统,成功识别出小猫。吴恩达取得突破的方法是扩大神经网络的规模,增加更多的分层和神经元,并利用海量数据对系统进行训练。吴恩达的研究利用了1000万个YouTube视频。由于神经网络分为很多层,因此吴恩达强调了深度学习的“深度”。目前,基于深度学习的图像识别技术在某些情况下甚至比人工做得更好,而识别的对象也不仅是小猫,还包括血液中癌症的指标,以及核磁共振中的肿瘤迹象。谷歌AlphaGo学会了围棋游戏,并利用神经网络自我对弈,逐渐变得非常强大。深度学习引领人工智能的未来深度学习带来了机器学习的许多实用应用,拓展了人工智能的适用领域。深度学习系统将任务分解,让机器可以去完成这些任务。利用深度学习,无人驾驶汽车、更强大的预防医疗,甚至更好的电影推荐都将成为可能。人工智能代表了现在和未来。借助深度学习,人工智能将走过科幻小说阶段,C-3PO机器人和终结者将会成为现实。(编译/AI世代 李玮)推荐:关注“AI世代”微信号(tencentai),穿越时空30年,进入机器人的时代。
[责任编辑:jimmonzang]
您认为这篇文章与"新一网(08008.HK)"相关度高吗?
Copyright & 1998 - 2017 Tencent. All Rights Reserved
还能输入140字热门搜索:
当前位置:
读懂机器学习、数据科学、人工智能、深度学习和统计学之间的区别
在这篇文章中,数据科学家与分析师 Vincent Granville 明晰了数据科学家所具有的不同角色,以及数据科学与机器学习、深度学习、人工智能、统计学、物联网、运筹学和应用数学等相关领域的比较和重叠。
在这篇文章中,数据科学家与分析师 Vincent Granville 明晰了数据科学家所具有的不同角色,以及数据科学与机器学习、深度学习、人工智能、统计学、物联网、运筹学和应用数学等相关领域的比较和重叠。Granville 介绍说,由于数据科学是一个范围很广的学科,所以他首先介绍了在业务环境中可能会遇到的数据科学家的类型:你甚至可能会发现你自己原来也是某种数据科学家。和其它任何科学学科一样,数据科学也可能会从其它相关学科借用技术;当然,我们也已经开发出了自己的技术库,尤其是让我们可以以的方式(甚至完全无需人类干预)处理非常大规模的非结构化数据集的技术和算法,进而实时执行交易或进行预测。1. 数据科学家具有哪些不同类型?在最近,数据科学家 Ajit Jaokar 则又讨论了 A 型数据科学家(分析师)和 B 型数据科学家(建造者)之间的区别:A 型数据科学家能够很好地编写操作数据的代码,但并不一定是一个专家。A 型数据科学家可能是一个实验设计、预测、建模、统计推理或统计学方面的事情的专家。然而总体而言,一个数据科学家的工作产品并不是「P 值和置信区间」——就像学术界的统计学有时候建议的那样(而且这常常是为传统的制药等等行业工作的)。在谷歌,A 型数据科学家被称为统计学家、定量分析师、决策支持工程开发分析师,也有一些被称为数据科学家。B 型数据科学家:这里的 B 是指 Building。B 型数据科学家和 A 型数据科学家具有相同的背景,但他们还是很强的程序员、甚至经验丰富的软件工程师。B 型数据科学家主要关注在生产环境中使用数据。他们构建能与用户进行交互的模型,通常是提供推荐(产品、可能认识的人、广告、电影、搜索结果等)。而对于业务处理优化,我也有自己的看法,我将其分成了 ABCD 四个方向,其中 A 表示分析科学(analytics science),B 表示业务科学(business science),C 表示计算机科学(computer science),D 则表示数据科学(data science)。数据科学可能会涉及到编程或数学实践,但也可能不会涉及到。你可以参考 http://suo.im/11bR7o 这篇文章了解高端和低端的数据科学的差异。在一家创业公司,数据科学家通常要做很多类型的工作,其扮演的工作角色可能包括:执行、数据挖掘师、数据工程师或架构师、研究员、统计学家、建模师(做预测建模等等)和开发人员。虽然数据科学家常常被看作是经验丰富的 R、Python、SQL、Hadoop 程序员,而且精通统计学,但这不只不过是冰山一角而已——人们对于数据科学家的这些看法不过是来自于重在教授数据科学的部分元素的数据培训项目而已。但正如一位实验室技术人员也可以称自己为物理学家一样,真正的物理学家远不止于此,而且他们的专业领域也是非常多样化的:天文学、数学物理、核物理、力学、电气工程、信号处理(这也是数据科学的一个领域)等等许多。数据科学也是一样,包含的领域有:生物信息学、信息技术、模拟和量化控制、计算金融、流行病学、工业工程、甚至数论。对我而言,在过去的十年里,我专注于机器到机器和设备到设备的通信、开发能自动处理大型数据集的系统、执行自动化交易(比如购买网络流量或自动生成内容)。这意味着需要开发能够处理非结构化数据的算法,这也是人工智能、物联网和数据科学的交叉领域,也可被称为深度数据科学(deep data science)。其对数学的需求相对较少,也只涉及到较少的编程(大部分是调用 API),但其却是相当数据密集型的(包括构建数据系统),并且基于专门为此背景而设计的全新统计技术。
本文由入驻OFweek公众平台的作者撰写,除OFweek官方账号外,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
邮箱/用户名:
忘记密码?
用其他账号登录: QQ
请输入评论
机械自动化单片机
四川省/成都市
广东省/深圳市
广东省/深圳市
广东省/深圳市
北京市/海淀区
广东省/深圳市
广东省/深圳市
广东省/惠州市
广东省/广州市
江苏省/无锡市
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:深度学习、机器学习傻傻分不清?这篇文章让你搞懂-基础器件-与非网
如果你经常想让自己弄清楚和的区别,阅读该文章,我将用通俗易懂的语言为你介绍他们之间的差别。机器学习和深度学习变得越来越火。突然之间,不管是了解的还是不了解的,所有人都在谈论机器学习和深度学习。无论你是否主动关注过数据科学,你应该已经听说过这两个名词了。
为了展示他们的火热程度,我在 Google trend 上搜索了这些关键字:
如果你想让自己弄清楚机器学习和深度学习的区别,请阅读本篇文章,我将用通俗易懂的语言为你介绍他们之间的差别。下文详细解释了机器学习和深度学习中的术语。并且,我比较了他们两者的不同,别说明了他们各自的使用场景。
什么是机器学习和深度学习?
让我们从基础知识开始:什么是机器学习?和什么是深度学习?如果你对此已有所了解,随时可以跳过本部分。
什么是机器学习?
一言以蔽之,由 Tom Mitchell 给出的被广泛引用的机器学习的定义给出了最佳解释。下面是其中的内容:
&计算机程序可以在给定某种类别的任务 T 和性能度量 P 下学习经验 E ,如果其在任务 T 中的性能恰好可以用 P 度量,则随着经验 E 而提高。&
是不是读起来很绕口呢?让我们用简单的例子来分解下这个描述。
示例 1:机器学习和根据人的身高估算体重
假设你想创建一个能够根据人的身高估算体重的系统(也许你出自某些理由对这件事情感兴趣)。那么你可以使用机器学习去找出任何可能的错误和数据捕获中的错误,首先你需要收集一些数据,让我们来看看你的数据是什么样子的:
图中的每一个点对应一个数据,我们可以画出一条简单的斜线来预测基于身高的体重
例如这条斜线:
Weight (in kg) = Height (in cm) & 100
&这些斜线能帮助我们作出预测,尽管这些斜线表现得很棒,但是我们需要理解它是怎么表现的,我们希望去减少预测和实际之间的误差,这也是衡量其性能的方法。
深远一点地说,我们收集更多的数据 (experience),模型就会变得更好。我们也可以通过添加更多变量(例如性别)和添加不同的预测斜线来完善我们的模型。
示例2:飓风预测系统
我们找一个复杂一点的例子。假如你要构建一个飓风预测系统。假设你手里有所有以前发生过的飓风的数据和这次飓风产生前三个月的天气信息。
如果要手动构建一个飓风预测系统,我们应该怎么做?
首先我们的任务是清洗所有的数据找到数据里面的模式进而查找产生飓风的条件。
我们既可以将模型条件数据(例如气温高于40度,湿度在80-100等)输入到我们的系统里面生成输出;也可以让我们的系统自己通过这些条件数据产生合适的输出。
我们可以把所有以前的数据输入到系统里面来预测未来是否会有飓风。基于我们系统条件的取值,评估系统的性能(系统正确预测飓风的次数)。我们可以将系统预测结果作为反馈继续多次迭代以上步骤。
让我们根据前边的解释来定义我们的预测系统:我们的任务是确定可能产生飓风的气象条件。性能P是在系统所有给定的条件下有多少次正确预测飓风。经验E是我们的系统的迭代次数。
什么是深度学习?
深度学习的概念并不新颖。它已经存在好几年了。但伴随着现有的所有的炒作,深度的学习越来越受到重视。正如我们在机器学习中所做的那样,先来看看深度学习的官方定义,然后用一个例子来解释。
&深度学习是一种特殊的机器学习,通过学习将世界使用嵌套的概念层次来表示并实现巨大的功能和灵活性,其中每个概念都定义为与简单概念相关联,而更为抽象的表示则以较不抽象的方式来计算。&
这也有点让人混乱。下面使用一个简单示例来分解下此概念。
示例1: 形状检测
先从一个简单的例子开始,从概念层面上解释究竟发生了什么的事情。我们来试试看如何从其他形状中识别的正方形。
我们眼中的第一件事是检查图中是否有四条的线(简单的概念)。如果我们找到这样的四条线,我们进一步检查它们是相连的、闭合的和相互垂直的,并且它们是否是相等的(嵌套的概念层次结构)。
所以,我们完成了一个复杂的任务(识别一个正方形),并以简单、不太抽象的任务来完成它。深度学习本质上在大规模执行类似逻辑。
示例2: 猫 vs. 狗
我们举一个动物辨识的例子,其中我们的系统必须识别给定的图像中的动物是猫还是狗。阅读下此文,以了解深度学习在解决此类问题上如何比机器学习领先一步。
机器学习和深度学习的对比
现在的你应该已经对机器学习和深度学习有所了解,接下来我们将会学习其中一些重点,并比较两种技术。
数据依赖性
深度学习与传统的机器学习最主要的区别在于随着数据规模的增加其性能也不断增长。当数据很少时,深度学习算法的性能并不好。这是因为深度学习算法需要大量的数据来完美地理解它。另一方面,在这种情况下,传统的机器学习算法使用制定的规则,性能会比较好。下图总结了这一事实。
深度学习算法需要进行大量的矩阵运算,GPU 主要用来高效优化矩阵运算,所以 GPU 是深度学习正常工作的必须硬件。与传统机器学习算法相比,深度学习更依赖安装 GPU 的高端机器。
特征处理是将领域知识放入特征提取器里面来减少数据的复杂度并生成使学习算法工作的更好的模式的过程。特征处理过程很耗时而且需要专业知识。
在机器学习中,大多数应用的特征都需要专家确定然后编码为一种数据类型。
特征可以使像素值、形状、纹理、位置和方向。大多数机器学习算法的性能依赖于所提取的特征的准确度。
深度学习尝试从数据中直接获取高等级的特征,这是深度学习与传统机器学习算法的主要的不同。基于此,深度学习削减了对每一个问题设计特征提取器的工作。例如,卷积神经网络尝试在前边的层学习低等级的特征(边界,线条),然后学习部分人脸,然后是高级的人脸的描述。更多信息可以阅读神经网络机器在深度学习里面的有趣应用。
问题解决方式
当应用传统机器学习算法解决问题的时候,传统机器学习通常会将问题分解为多个子问题并逐个子问题解决最后结合所有子问题的结果获得最终结果。相反,深度学习提倡直接的端到端的解决问题。
举例说明:
假设有一个多物体检测的任务需要图像中的物体的类型和各物体在图像中的位置。
传统机器学会将问题分解为两步:物体检测和物体识别。首先,使用一个边界框检测算法扫描整张图片找到可能的是物体的区域;然后使用物体识别算法(例如 SVM 结合 HOG )对上一步检测出来的物体进行识别。
相反,深度学习会直接将输入数据进行运算得到输出结果。例如可以直接将图片传给 YOLO 网络(一种深度学习算法),YOLO 网络会给出图片中的物体和名称。
通常情况下,训练一个深度学习算法需要很长的时间。这是因为深度学习算法中参数很多,因此训练算法需要消耗更长的时间。最先进的深度学习算法 ResNet完整地训练一次需要消耗两周的时间,而机器学习的训练会消耗的时间相对较少,只需要几秒钟到几小时的时间。
但两者测试的时间上是完全相反。深度学习算法在测试时只需要很少的时间去运行。如果跟 k-nearest neighbors(一种机器学习算法)相比较,测试时间会随着数据量的提升而增加。不过这不适用于所有的机器学习算法,因为有些机器学习算法的测试时间也很短。
至关重要的一点,我们把可解释性作为比较机器学习和深度学习的一个因素。
我们看个例子。假设我们适用深度学习去自动为文章评分。深度学习可以达到接近人的标准,这是相当惊人的性能表现。但是这仍然有个问题。深度学习算法不会告诉你为什么它会给出这个分数。当然,在数学的角度上,你可以找出来哪一个深度神经网络节点被激活了。但是我们不知道神经元应该是什么模型,我们也不知道这些神经单元层要共同做什么。所以无法解释结果是如何产生的。
另一方面,为了解释为什么算法这样选择,像决策树(decision trees)这样机器学习算法给出了明确的规则,所以解释决策背后的推理是很容易的。因此,决策树和线性/逻辑回归这样的算法主要用于工业上的可解释性。
与非网专栏作者招募
你也许是工程师甲,每天默默画电路板、写代码;
你也许是高校老师乙,每天站在三尺讲台,传授知识;
你也许是项目经理丙,每天为得到客户认可而赶工、奔忙;
不管你身处何地是何种身份,只要你是电子领域的从业者,就一定有对这一行业的一些感受和看法。
可能你已修炼成资深行业观察家,如老师那样真知灼见;
可能你善于分析行业趋势,如侃侃而谈;
可能你精通某一项技术,如那样精讲技术而不失幽默;
可能你善于发现身边的工程师故事,如般娓娓道来。
也可能你和他们都不同,有自己想发表的观点,这样的你都是我们在等的人,只要你准备好了,&与非网专栏作者&就会成为你的一个标签。你不再是普通的路人&甲、乙、丙&,而是工程师和电子产业的发言人。
我们给专栏作者的展示机会:
1. 与非网主站【与非原创】栏目的集中展示:
2. 与非网主页:首页焦点、行业发现的重点推荐
3. 与非网微信:原创推送,直达核心行业读者
4. 如果专栏内容热度很高,我们还可以帮助联系相关出版社洽谈集结出版。
成功取决于行动力,赶紧将你的职场态度和行业观点进行整理、提炼成专栏大纲吧,以&专栏作者+大纲名称&为主题,发送到:(请将#替换为@)即可,或者你还有些疑惑想更多了解专栏作者的情况,也可以加小编的微信+qq:详谈。
与非网专栏作者,我们等你!
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
最近,随着机器学习(ML)的日益普及,以及电子工业向物联网和汽车行业的渗透转移,人工智能在硬件和软件方面的应用一片喧嚣。业界大量讨论了嵌入式智能在产品实现上的进展和成绩,现在,我们需要把目光的焦点更多地放在如何向EDA世界注入更多的智能上面。
发表于: 08:36:11
关于中国赶超美国人工智能的说法甚嚣尘上,背后更多是国外对于国内AI热潮的一种过激反应,国内AI投融资火爆但AI商业化落地还没见到多大实效。
发表于: 13:30:56
虽然如今深度学习科技已经进一步点燃了 AI 之火,但这项技术却常因需要大量的数据而备受诟病。人们也一直在争论,究竟深度学习需要多少数据才足够呢?
发表于: 10:38:05
深度学习是人工智能(AI)领域的一个细分市场,其中,多台计算机通过人工神经网络进行交互。这些人工神经网络使得计算机在不需要预先编程的情况下就可以理解随机信息。赛灵思的现场可编程门阵列(FPGA)就非常适合自动驾驶汽车等深度学习应用。FPGA是一种集成电路,在生产之后进行编程。
发表于: 08:31:10
据外媒报道,创业公司Glint的目标是帮助企业降低员工离职率。该公司今天宣布,已完成D轮2000万美元的融资。
发表于: 09:24:47
近些年来,国内许多LED显示屏上市企业纷纷切入小间距领域,并且投入大量的资金和技术成本研发制造小间距产品。如今,小间距产品已经褪去了以往的青涩,已然成为行业内最受欢迎的产品之一,国内市场被逐渐打开,在国际市场上也形成了深远的影响。
发表于: 10:56:05
近日,半导体行业再次迎来一记重弹,博通有限(Broadcom)发出以每股收益70美元的现金和股票收购高通(Qualcomm)的提议。同时,博通表示此提议对于高通以110美元每股收购恩智浦半导体过程毫无影响。
发表于: 10:38:00
近日,全球首次量子点微球LED产品发布及应用研讨会在美丽的环渤海城市——天津举行。会上,围绕量子点微球材料发布了不同型号的量子点封装器件和量子点照明产品。
发表于: 10:20:41
11月8日,河北雄安新区管委会与阿里巴巴集团签署战略合作协议,双方决定携手打造以“云计算”为基础设施、“物联网”为城市神经网络、“城市大脑”为人工智能中枢的未来智能城市。
发表于: 10:04:56
美国专利商标局今天正式公布了授予苹果公司的36项新专利。在该报告中,我们重点关注了苹果在3D手跟踪系统方面的专利,该跟踪系统将用到像iPhone X的TrueDepth这样的深感摄像头。
发表于: 09:46:22
又到一年招聘季,考研or工作让你实现了怎样的逆袭?……
与非门科技(北京)有限公司 All Rights Reserved.
京ICP证:070212号
北京市公安局备案编号: 京ICP备:号一篇文章讲清楚人工智能、机器学习和深度学习的区别和联系
一篇文章讲清楚人工智能、机器学习和深度学习的区别和联系
全球人工智能GAI
——免费加入AI技术专家社群&&免费加入AI高管投资者群&&一、人工智能:从概念提出到走向繁荣1956年,几个计算机科学家相聚在达特茅斯会议,提出了“人工智能”的概念,梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。其后,人工智能就一直萦绕于人们的脑海之中,并在科研实验室中慢慢孵化。之后的几十年,人工智能一直在两极反转,或被称作人类文明耀眼未来的预言,或被当成技术疯子的狂想扔到垃圾堆里。直到2012年之前,这两种声音还在同时存在。2012年以后,得益于数据量的上涨、运算力的提升和机器学习新算法(深度学习)的出现,人工智能开始大爆发。据领英近日发布的《全球AI领域人才报告》显示,截至2017年一季度,基于领英平台的全球AI(人工智能)领域技术人才数量超过190万,仅国内人工智能人才缺口达到500多万。人工智能的研究领域也在不断扩大,图一展示了人工智能研究的各个分支,包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。图一 人工智能研究分支但目前的科研工作都集中在弱人工智能这部分,并很有希望在近期取得重大突破,电影里的人工智能多半都是在描绘强人工智能,而这部分在目前的现实世界里难以真正实现(通常将人工智能分为弱人工智能和强人工智能,前者让机器具备观察和感知的能力,可以做到一定程度的理解和推理,而强人工智能让机器获得自适应能力,解决一些之前没有遇到过的问题)。弱人工智能有希望取得突破,是如何实现的,“智能”又从何而来呢?这主要归功于一种实现人工智能的方法——机器学习。二、机器学习:一种实现人工智能的方法机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。举个简单的例子,当我们浏览网上商城时,经常会出现商品推荐的信息。这是商城根据你往期的购物记录和冗长的收藏清单,识别出这其中哪些是你真正感兴趣,并且愿意购买的产品。这样的决策模型,可以帮助商城为客户提供建议并鼓励产品消费。机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。从学习方法上来分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习。传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。深度学习:一种实现机器学习的技术深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。但由于近几年该领域发展迅猛,一些特有的学习手段相继被提出(如残差网络),因此越来越多的人将其单独看作一种学习的方法。最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。其实有不少想法早年间也曾有过,但由于当时训练数据量不足、计算能力落后,因此最终的效果不尽如人意。深度学习摧枯拉朽般地实现了各种任务,使得似乎所有的机器辅助功能都变为可能。无人驾驶汽车,预防性医疗保健,甚至是更好的电影推荐,都近在眼前,或者即将实现。三、三者的区别和联系机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。我们就用最简单的方法——同心圆,可视化地展现出它们三者的关系。图二 三者关系示意图目前,业界有一种错误的较为普遍的意识,即“深度学习最终可能会淘汰掉其他所有机器学习算法”。这种意识的产生主要是因为,当下深度学习在计算机视觉、自然语言处理领域的应用远超过传统的机器学习方法,并且媒体对深度学习进行了大肆夸大的报道。深度学习,作为目前最热的机器学习方法,但并不意味着是机器学习的终点。起码目前存在以下问题:1. 深度学习模型需要大量的训练数据,才能展现出神奇的效果,但现实生活中往往会遇到小样本问题,此时深度学习方法无法入手,传统的机器学习方法就可以处理;2. 有些领域,采用传统的简单的机器学习方法,可以很好地解决了,没必要非得用复杂的深度学习方法;3. 深度学习的思想,来源于人脑的启发,但绝不是人脑的模拟,举个例子,给一个三四岁的小孩看一辆自行车之后,再见到哪怕外观完全不同的自行车,小孩也十有八九能做出那是一辆自行车的判断,也就是说,人类的学习过程往往不需要大规模的训练数据,而现在的深度学习方法显然不是对人脑的模拟。深度学习大佬 Yoshua Bengio 在 Quora 上回答一个类似的问题时,有一段话讲得特别好,这里引用一下,以回答上述问题:Science is NOT a battle, it is a collaboration. We all build on each other's ideas. Science is an act of love, not war. Love for the beauty in the world that surrounds us and love to share and build something together. That makes science a highly satisfying activity, emotionally speaking!这段话的大致意思是,科学不是战争而是合作,任何学科的发展从来都不是一条路走到黑,而是同行之间互相学习、互相借鉴、博采众长、相得益彰,站在巨人的肩膀上不断前行。机器学习的研究也是一样,你死我活那是邪教,开放包容才是正道。结合机器学习2000年以来的发展,再来看Bengio的这段话,深有感触。进入21世纪,纵观机器学习发展历程,研究热点可以简单总结为年的流形学习、2006年-2011年的稀疏学习、2012年至今的深度学习。未来哪种机器学习算法会成为热点呢?深度学习三大巨头之一吴恩达曾表示,“在继深度学习之后,迁移学习将引领下一波机器学习技术”。但最终机器学习的下一个热点是什么,谁用能说得准呢。热门文章推荐黑科技|Adobe出图象技术神器!视频也可以PS了!!史上第一个被授予公民身份的机器人索菲亚和人对答如流!浙大90后女黑客在GeekPwn2017上秒破人脸识别系统!周志华点评AlphaGo Zero:这6大特点非常值得注意!汤晓鸥教授:人工智能让天下没有难吹的牛!英伟达发布全球首款人工智能全自动驾驶平台未来 3~5 年内,哪个方向的机器学习人才最紧缺?中科院步态识别技术:不看脸 50米内在人群中认出你!厉害|黄仁勋狂怼CPU:摩尔定律已死 未来属于GPU!干货|7步让你从零开始掌握Python机器学习!
本文仅代表作者观点,不代表百度立场。系作者授权百家号发表,未经许可不得转载。
全球人工智能GAI
百家号 最近更新:
简介: 全球最新的AI技术动态|实战|资源|及应用!
作者最新文章

我要回帖

 

随机推荐