万花镜
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    购物世界电影科幻片

    如何区分人工智能、机器学习和深度学习?

    2017年3月17日 作者:硅谷密探

    本文内容来自于硅谷投资人Lake Dai,LDV Partners合伙人。严肃编辑整理。

    人工智能(Artificial Intelligence)是一个最广泛的概念,人工智能的目的就是让计算机这台机器能够象人一样思考,而机器学习(Machine Learning)是人工智能的分支,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,使之不断改善自身的性能。

    深度学习(Deep Learning)是一种机器学习的方法,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层(神经网络)对数据进行高层抽象的算法。

    神经网络是一组大致模仿人类大脑构造设计的算法,用于识别模式。神经网络通过机器感知系统解释传感器数据,能够对原始输入进行标记或聚类等操作。神经网络所能识别的模式是数值形式,因此图像、声音、文本、时间序列等一切现实世界的数据必须转换为数值。

    在深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂,因为每一层会整合并重组前一层的特征。

    (http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)

    上图显示了一个神经网络用于判定一个图片是不是一条狗的过程,输入是图片,通过深层神经网络对狗的低层特征进行抽象,最后输出是图片是狗的概率。

    深度学习的过程同样是分为训练和推理(既“评估”)两个过程,通过训练过程来获得数据模型,然后用于评估新的数据。

    数据模型分为两种,一种是所谓判别模型(Discriminative Model),也就是说模型可以直接用来判别事物的。这里所说的判别事物,最典型的就是做分类。既然直接可以用来分类,也就是说我们可以在已知属性的条件下,对该记录进行判断。所以,判别模型是对条件概率进行的建模,也就是p(Y|X)。这里X就是属性集合,实际上就是一个向量;而Y则可能是一个值(此时对应分类问题), 可能是一个向量(此时对应序列标注问题)。判别模型常用于处理分类问题(比如鉴定垃圾邮件)、图像识别等等。

    再说一说生成模型(Generative Model)。生成模型可以描述数据的生成过程。换句话说,已知了这个模型,我们就可以产生该模型描述的数据。而数据由两部分组成,也就是(X,Y),前者是特征,后者则是类别(Y是标量)或者序列类别(Y是向量)。要描述整个数据,也就是要对p(X,Y)进行建模,所以是对联合概率进行建模。生成模型本身不是做分类或者序列标注的,但是可以用来解决这些问题,也可以用于生成式问题,比如聊天机器人、比如AI谱曲等问题。

    而机器学习可以分成下面几种类别:

    监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练数据中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。

    无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类。

    半监督学习介于监督学习与无监督学习之间。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。。

    增强学习通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。

    在传统的机器学习领域,监督学习最大的问题是训练数据标注成本比较高,而无监督学习应用范围有限。利用少量的训练样本和大量无标注数据的半监督学习一直是机器学习的研究重点。

    当前非常流行的深度学习GAN模型和半监督学习的思路有相通之处,GAN是“生成对抗网络”(Generative Adversarial Networks)的简称,包括了一个生成模型G和一个判别模型D,GAN的目标函数是关于D与G的一个零和游戏,也是一个最小-最大化问题。

    GAN实际上就是生成模型和判别模型之间的一个模仿游戏。生成模型的目的,就是要尽量去模仿、建模和学习真实数据的分布规律;而判别模型则是要判别自己所得到的一个输入数据,究竟是来自于真实的数据分布还是来自于一个生成模型。通过这两个内部模型之间不断的竞争,从而提高两个模型的生成能力和判别能力。

    (图片来自Nvidia Deep Learning Training Workshop)

    目前主流的深度学习框架:

    Caffe 由Berkeley提出

    TensorFlow 由Google提出 (Apache 2.0)

    Torch (BSD License), facebook是主要使用者

    MXNet 一个相对中立的机器学习框架(Apache 2.0), 被Amazon AWS使用

    CNTK2 由Microsoft提出 (MIT License)

    人工智能在各个行业的公司分布

    目前人工智能在各个领域的初创公司数量(2016年的数据):

    Deep learning/机器学习 (通用)(123家公司)

    Deep learning/机器学习 (应用) (260家公司)

    NLP (通用) (154家公司)

    NLP (语音识别) (78家公司)

    计算机视觉/图像识别 (通用) (106家公司)

    计算机视觉/图像识别 (应用) (83 家公司)

    手势控制 (33 家公司)

    虚拟个人助理 (92 家公司)

    智能机器人 (65 家公司)

    推荐系统 (60 家公司)

    Context aware computing (28 家公司)

    语音即时翻译 (15 家公司)

    视频识别 (14 家公司)

    下图是目前人工智能在各个行业的热度

    上图是2011到2016年最积极的人工智能企业投资者

    下图是福布斯关注的50家人工智能公司。

    (图片来自http://fortune.com/2017/02/23/artificial-intelligence-companies/)

    融资最多的人工智能初创公司(2011-2016)

    Sentient Technologies:使用先进的人工智能技术,大规模分布式计算和科学的方法来验证新发现的策略,Sentient Technologies为各种领域中的复杂问题提供了新的解决方案。

    Ayasdi:机器学习平台,数据可视化,分析,金融技术,医疗保健代理系统:

    Vicarious: 这是一家神秘的人工智能公司,Vicarious的目标定位于“建立下一代的人工智能算法”。并且声称要构建“像人类一样思考的软件”,实现“人脑级别的视觉、语言和自动控制系统”,致力于研究通用人工智能,目前他们的研究重点是实现人工视觉识别系统。

    Context Relevant:Context Relevant通过使用机器学习驱动的自动化数据科学平台,来解决一些世界上最棘手的大数据,预测和行为挑战 - 比任何其他解决方案更快更有效。

    Cortia:Cortica的技术模拟人类皮层,以便以最高的精度理解和识别图像。

    Workfusion:WorkFusion是全球运营的完整自动化解决方案,将您需要的复杂业务流程数字化所需的核心功能整合到一个平台中:业务流程管理(BPM),机器人过程自动化(RPA),劳动力编排和机器学习提供的认知自动化。

    RapidMiner:开源预测分析平台,使企业能够在业务流程中包括预测分析

    Digital Reasoning Systems:确保合规性,保持安全性,并快速准确地分析信息。

    H2O.ai:H2O是世界领先的开源深度学习平台。 H2O被超过80,000个数据科学家和超过9,000个组织使用。

    Viv Labs:Viv在开发语音智能助理,已被三星收购。

    参考文献:

    https://www.amazon.com/b?ie=UTF8&node=16008589011#

    Nvidia Deep Learning Training Workshop

    Crunchbase

    CB Insights

    关注硅谷密探

    紧盯全球创新趋势

    (即可关注,神马,这居然是二维码!)

    位置:首页 > 科技
    加载更多评论...
    本类推荐
    浅谈嵌入式人工智能:市场已现雏形,还能吃手机红利多久?
    浅谈嵌入式人工智能:市场已现雏形,还能吃手机红利多久?

    作者:IT 桔子数据分析师「嵌入式人工智能」已成为一个新的热点论词。在 4 月 28 日「GMIC AI+国际峰会」上,零零无限 CEO 王孟秋、中科创达技术总监王璠以及云迹科技 CEO 支涛在分享过程中或交流中都提及了「嵌入式人工智」能这一概念。

    新趋势:人工智能带来的医疗新变革
    新趋势:人工智能带来的医疗新变革

    在刚刚落幕的第77届春季CMEF医博会上人工智能成了火爆的关注点。近两年,虽说人工智能还未颠覆医疗,但人工智能也说的上是新时代的听诊器,医生的好工具!图片来源于网络从很大程度上讲,人工智能的出现为医生提高工作效率提供了更多可能。

    为何手机厂商对语音助手如此着迷?导火索在这儿
    为何手机厂商对语音助手如此着迷?导火索在这儿

    乔布斯生前强烈预感到语音为先的新世界,重病缠身的他仍完成对Siri的收购。2011年,Siri搭载着iPhone4s惊艳亮相。随后,各大科技巨头纷纷开始加大语音助手方面的研发,但语音助手行业一直处于不温不火的状态...

    李开复哥伦比亚大学毕业典礼演讲:爱,让人类有别于人工智能
    李开复哥伦比亚大学毕业典礼演讲:爱,让人类有别于人工智能

    5月15日,创新工场创始人兼CEO、人工智能工程院院长李开复博士作为特邀嘉宾,在纽约哥伦比亚大学工程学院向2017届毕业生们发表了题为《一个工程师的人工智能银河系漫游指南》毕业演讲。 作为哥大83届毕业生...

    RBAC权限管理模型:基本模型及角色模型解析及举例
    RBAC权限管理模型:基本模型及角色模型解析及举例

    我们在做任何一款产品的时候,或多或少都会涉及到用户和权限的问题。譬如,做企业类软件,不同部门、不同职位的人的权限是不同的;做论坛类产品的时候,版主和访客权限也是不一样的;再例如一款产品的收费用户和免费用户权限也是迥然不同的。

    详述车道检测的艰难探索:从透视变换到深度图像分割(附代码)
    详述车道检测的艰难探索:从透视变换到深度图像分割(附代码)

    王小新 编译自 Medium量子位 出品 | 公众号 QbitAI找到马路上的车道线,对于人类来说非常容易,但对计算机来说,一点阴影、反光、道路颜色的微小变化、或者车道线被部分遮挡,都会带来很大的困难。

    进击者“第四范式”:AI终将ForEveryone
    进击者“第四范式”:AI终将ForEveryone

    很多时候,落后与先知的差距,不是购买一些机器或者引进一些技术就能弥补的,落后的最可怕之处在于思维方式的落后。AI(Artificial Intelligence,人工智能),从某种意义上来说,代表着一种因数据驱动的新思维方式——用不确定性看待世界...

    可能是建模过程中最好用的数值模拟软件,COMSOL迎来重大更新
    可能是建模过程中最好用的数值模拟软件,COMSOL迎来重大更新

    仿真模拟问题这下容易解决了最近老有模友吐槽超模君好久没讲过关于数学建模的内容。超模君一脸心塞(我容易吗我):各位模友,别急,那今晚的主角还是留给数学建模。说起数学建模,大部分模友应该顺势也就会想MATLAB、SPSS、R语言等软件,确实,这可是数学建模的命脉。

    译趣闻|从围棋到编程,AI人工智能点亮了哪些生活技能?
    译趣闻|从围棋到编程,AI人工智能点亮了哪些生活技能?

    每过段日子,就会传出人工智能会代替人类的假消息,人工智能的确学习了很多技能,但远没有达到能代替人类的地步。那么下面就来讲讲人工智能点亮了哪些技能。人工智能是什么?在了解人工智能学习的技能之前,首先要了解人工智能是什么。

    下雨时怎样找到晴雨分界线?|No.56
    下雨时怎样找到晴雨分界线?|No.56

    你是否也有这样的童年?雨天的时候界限分明的下雨和不下雨的分界线如果找到它就可以一脚踩在下雨区一脚踩在晴朗区一只眼看烟雨迷蒙一只眼看晴空万里然而本小编十分不幸至今从未见过这条魔幻的分界线机智幸运如你可曾见过它的样子吗?

    论文推荐|王宁波:不同NeQuick电离层模型参数的应用精度分析
    论文推荐|王宁波:不同NeQuick电离层模型参数的应用精度分析

    《测绘学报》构建与学术的桥梁 拉近与权威的距离测绘地理信息与导航高端论坛 ——《测绘学报》创刊60周年学术研讨会通知(第一号)王宁波1,221221. 中国科学院光电研究院, 北京 100094;2. 中国科学院测量与地球物理研究所大地测量与地球动力学国家重点实验室...

    千万奖金人机大战到来《星际争霸》高手也宣战AI
    千万奖金人机大战到来《星际争霸》高手也宣战AI

    阿尔法狗马上就要大战柯洁了,各位期待吗?坊间传言柯洁能赢一把的概率只有10%,到底怎么样,明天我们就知道了。人机大战将于5月23号、25号和27号举行,柯洁和阿尔法狗一共打三盘,当然别的项目也不容错过。

    延伸热词
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    万花镜 版权所有 京ICP备14059027号
    值班QQ:3012642954
    邮箱:wanhuajingnews@qq.com