万花镜
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    购物世界电影科幻片

    如何区分人工智能、机器学习和深度学习?

    2017年3月17日 作者:硅谷密探

    本文内容来自于硅谷投资人Lake Dai,LDV Partners合伙人。严肃编辑整理。

    人工智能(Artificial Intelligence)是一个最广泛的概念,人工智能的目的就是让计算机这台机器能够象人一样思考,而机器学习(Machine Learning)是人工智能的分支,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,使之不断改善自身的性能。

    深度学习(Deep Learning)是一种机器学习的方法,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层(神经网络)对数据进行高层抽象的算法。

    神经网络是一组大致模仿人类大脑构造设计的算法,用于识别模式。神经网络通过机器感知系统解释传感器数据,能够对原始输入进行标记或聚类等操作。神经网络所能识别的模式是数值形式,因此图像、声音、文本、时间序列等一切现实世界的数据必须转换为数值。

    在深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂,因为每一层会整合并重组前一层的特征。

    (http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)

    上图显示了一个神经网络用于判定一个图片是不是一条狗的过程,输入是图片,通过深层神经网络对狗的低层特征进行抽象,最后输出是图片是狗的概率。

    深度学习的过程同样是分为训练和推理(既“评估”)两个过程,通过训练过程来获得数据模型,然后用于评估新的数据。

    数据模型分为两种,一种是所谓判别模型(Discriminative Model),也就是说模型可以直接用来判别事物的。这里所说的判别事物,最典型的就是做分类。既然直接可以用来分类,也就是说我们可以在已知属性的条件下,对该记录进行判断。所以,判别模型是对条件概率进行的建模,也就是p(Y|X)。这里X就是属性集合,实际上就是一个向量;而Y则可能是一个值(此时对应分类问题), 可能是一个向量(此时对应序列标注问题)。判别模型常用于处理分类问题(比如鉴定垃圾邮件)、图像识别等等。

    再说一说生成模型(Generative Model)。生成模型可以描述数据的生成过程。换句话说,已知了这个模型,我们就可以产生该模型描述的数据。而数据由两部分组成,也就是(X,Y),前者是特征,后者则是类别(Y是标量)或者序列类别(Y是向量)。要描述整个数据,也就是要对p(X,Y)进行建模,所以是对联合概率进行建模。生成模型本身不是做分类或者序列标注的,但是可以用来解决这些问题,也可以用于生成式问题,比如聊天机器人、比如AI谱曲等问题。

    而机器学习可以分成下面几种类别:

    监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练数据中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。

    无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类。

    半监督学习介于监督学习与无监督学习之间。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。。

    增强学习通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。

    在传统的机器学习领域,监督学习最大的问题是训练数据标注成本比较高,而无监督学习应用范围有限。利用少量的训练样本和大量无标注数据的半监督学习一直是机器学习的研究重点。

    当前非常流行的深度学习GAN模型和半监督学习的思路有相通之处,GAN是“生成对抗网络”(Generative Adversarial Networks)的简称,包括了一个生成模型G和一个判别模型D,GAN的目标函数是关于D与G的一个零和游戏,也是一个最小-最大化问题。

    GAN实际上就是生成模型和判别模型之间的一个模仿游戏。生成模型的目的,就是要尽量去模仿、建模和学习真实数据的分布规律;而判别模型则是要判别自己所得到的一个输入数据,究竟是来自于真实的数据分布还是来自于一个生成模型。通过这两个内部模型之间不断的竞争,从而提高两个模型的生成能力和判别能力。

    (图片来自Nvidia Deep Learning Training Workshop)

    目前主流的深度学习框架:

    Caffe 由Berkeley提出

    TensorFlow 由Google提出 (Apache 2.0)

    Torch (BSD License), facebook是主要使用者

    MXNet 一个相对中立的机器学习框架(Apache 2.0), 被Amazon AWS使用

    CNTK2 由Microsoft提出 (MIT License)

    人工智能在各个行业的公司分布

    目前人工智能在各个领域的初创公司数量(2016年的数据):

    Deep learning/机器学习 (通用)(123家公司)

    Deep learning/机器学习 (应用) (260家公司)

    NLP (通用) (154家公司)

    NLP (语音识别) (78家公司)

    计算机视觉/图像识别 (通用) (106家公司)

    计算机视觉/图像识别 (应用) (83 家公司)

    手势控制 (33 家公司)

    虚拟个人助理 (92 家公司)

    智能机器人 (65 家公司)

    推荐系统 (60 家公司)

    Context aware computing (28 家公司)

    语音即时翻译 (15 家公司)

    视频识别 (14 家公司)

    下图是目前人工智能在各个行业的热度

    上图是2011到2016年最积极的人工智能企业投资者

    下图是福布斯关注的50家人工智能公司。

    (图片来自http://fortune.com/2017/02/23/artificial-intelligence-companies/)

    融资最多的人工智能初创公司(2011-2016)

    Sentient Technologies:使用先进的人工智能技术,大规模分布式计算和科学的方法来验证新发现的策略,Sentient Technologies为各种领域中的复杂问题提供了新的解决方案。

    Ayasdi:机器学习平台,数据可视化,分析,金融技术,医疗保健代理系统:

    Vicarious: 这是一家神秘的人工智能公司,Vicarious的目标定位于“建立下一代的人工智能算法”。并且声称要构建“像人类一样思考的软件”,实现“人脑级别的视觉、语言和自动控制系统”,致力于研究通用人工智能,目前他们的研究重点是实现人工视觉识别系统。

    Context Relevant:Context Relevant通过使用机器学习驱动的自动化数据科学平台,来解决一些世界上最棘手的大数据,预测和行为挑战 - 比任何其他解决方案更快更有效。

    Cortia:Cortica的技术模拟人类皮层,以便以最高的精度理解和识别图像。

    Workfusion:WorkFusion是全球运营的完整自动化解决方案,将您需要的复杂业务流程数字化所需的核心功能整合到一个平台中:业务流程管理(BPM),机器人过程自动化(RPA),劳动力编排和机器学习提供的认知自动化。

    RapidMiner:开源预测分析平台,使企业能够在业务流程中包括预测分析

    Digital Reasoning Systems:确保合规性,保持安全性,并快速准确地分析信息。

    H2O.ai:H2O是世界领先的开源深度学习平台。 H2O被超过80,000个数据科学家和超过9,000个组织使用。

    Viv Labs:Viv在开发语音智能助理,已被三星收购。

    参考文献:

    https://www.amazon.com/b?ie=UTF8&node=16008589011#

    Nvidia Deep Learning Training Workshop

    Crunchbase

    CB Insights

    关注硅谷密探

    紧盯全球创新趋势

    (即可关注,神马,这居然是二维码!)

    位置:首页 > 科技
    加载更多评论...
    本类推荐
    华院首席科学家:中文或是人类面对人工智能的最后壁垒
    华院首席科学家:中文或是人类面对人工智能的最后壁垒

    “语言可能是人类面对人工智能最后的壁垒,尤其是中文。”在3月18日集智俱乐部在中央财经大学学术会堂举办的公开讲座上,华院数据首席数据科学家尹相志结合NLU(Natural Language Understanding,自然语言理解)在金融领域的应用之处侃侃而谈。

    李开复:人工智能引领金融变革
    李开复:人工智能引领金融变革

    文章摘要在AlphaGo击败世界围棋冠军、职业九段选手李世石后,人工智能的发展与应用再一次成为人们的视线焦点,同时也引发了人们对人工智能的无限想象。最早提出这一概念的约翰·麦卡锡认为,人工智能就是要让机器的行为看起来像人所表现出的智能行为一样。

    《科学》封面重磅论文:人工智能终于能像人类一样学习(附论文)
    《科学》封面重磅论文:人工智能终于能像人类一样学习(附论文)

    机器之心原创 作者:汪汪今天,《科学》杂志封面刊登了一篇重磅研究:人工智能终于能像人类一样学习,并通过了图灵测试。(论文见文末,回复「12」可下载论文PDF格式。)这个人工智能像你一样学习写字假设你从来没有见过菠萝。

    总理记者会虽然没提人工智能,但新政策马上就要来了
    总理记者会虽然没提人工智能,但新政策马上就要来了

    △图为李克强总理。新华社记者邢广利摄今天上午十二届全国人大五次会议闭幕后,国务院总理李克强在人民大会堂三楼金色大厅会见中外记者,并回答记者提出的18个问题。去年,李克强总理曾经在记者会上主动提到“围棋人机大战”。

    前沿|YannLeCun谈对抗性网络:如何让机器掌握常识?
    前沿|YannLeCun谈对抗性网络:如何让机器掌握常识?

    选自 Facebook Code作者: Soumith Chintala,Yann LeCun 机器之心编译参与:Gabrielle,微胖引言:众所周知, Facebook 开始采用人工智能技术的时间较早,使用频率也越来越高。

    论文推荐|董杨:主成分分析的匹配点对提纯方法
    论文推荐|董杨:主成分分析的匹配点对提纯方法

    《测绘学报》构建与学术的桥梁 拉近与权威的距离测绘地理信息与导航高端论坛 ——《测绘学报》创刊60周年学术研讨会通知(第一号)董杨, 范大昭, 纪松, 雷蓉 信息工程大学, 河南 郑州 450000收稿日期:2016-05-24;

    深度|提升深度学习模型的表现,你需要这20个技巧(附论文)
    深度|提升深度学习模型的表现,你需要这20个技巧(附论文)

    选自machielearningmastery参与:杜夏德、陈晨、吴攀、Terrence、李亚洲你可以怎样让你的深度学习模型实现更好的表现?这是一个我常被问到的问题:「我该怎么提升准确度?」或者「如果我的神经网络表现很糟糕我该怎么办?

    量子物理推动机器学习
    量子物理推动机器学习

    2016 年3 月,AlphaGo 在五番棋中赢了四盘,打败了世界上最好的棋手之一李世乭。AlphaGo 的成功被认为是人工智能研究的一个里程碑。在围棋中,通过蛮力搜索所有可能的策略从而找出最好的走法是行不通的;

    Google重磅突破相比LSTM,NLP关键任务提升20%
    Google重磅突破相比LSTM,NLP关键任务提升20%

    新智元编译 自然语言理解(NLP)是人工智能领域使用程度最高的技术之一。受益于最近 自然语言理解技术的发展,现在已经可以应用在很多领域,例如航班预定、客服服务、任务管理、聊天助手等。“自然语言处理已经成为了数据经济掌控之战的制高点...

    进击者“第四范式”:AI终将ForEveryone
    进击者“第四范式”:AI终将ForEveryone

    很多时候,落后与先知的差距,不是购买一些机器或者引进一些技术就能弥补的,落后的最可怕之处在于思维方式的落后。AI(Artificial Intelligence,人工智能),从某种意义上来说,代表着一种因数据驱动的新思维方式——用不确定性看待世界...

    教学使用的人骨模型居然是真人骨!?
    教学使用的人骨模型居然是真人骨!?

    学校里使用的人骨模型一般是用PVC(聚氯乙烯)材料制造的。没什么可怕,对不对!!然而,要是真的人骨呢?英国Merseyside 一高中(Haydock High School)有一具使用了40年的“人骨模型”,因传说这是真人骨。

    简洁又美丽的标准模型方程
    简洁又美丽的标准模型方程

    我记得最清楚的是,当我提出一个自认为能使人信服而又合理的建议时,爱因斯坦一点也不表示反对,而只是说,“啊,多么丑!”当他遇到一个他认为丑的方程时,他只是对它不感兴趣,并且不能理解为什么有些人愿意花费那么多时间在它上面。

    延伸热词
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    万花镜 版权所有 京ICP备14059027号
    值班QQ:3012642954
    邮箱:wanhuajingnews@qq.com