万花镜
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    购物世界电影科幻片

    如何区分人工智能、机器学习和深度学习?

    2017年3月17日 来源: 硅谷密探

    本文内容来自于硅谷投资人Lake Dai,LDV Partners合伙人。严肃编辑整理。

    人工智能(Artificial Intelligence)是一个最广泛的概念,人工智能的目的就是让计算机这台机器能够象人一样思考,而机器学习(Machine Learning)是人工智能的分支,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,使之不断改善自身的性能。

    深度学习(Deep Learning)是一种机器学习的方法,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层(神经网络)对数据进行高层抽象的算法。

    神经网络是一组大致模仿人类大脑构造设计的算法,用于识别模式。神经网络通过机器感知系统解释传感器数据,能够对原始输入进行标记或聚类等操作。神经网络所能识别的模式是数值形式,因此图像、声音、文本、时间序列等一切现实世界的数据必须转换为数值。

    在深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂,因为每一层会整合并重组前一层的特征。

    (http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)

    上图显示了一个神经网络用于判定一个图片是不是一条狗的过程,输入是图片,通过深层神经网络对狗的低层特征进行抽象,最后输出是图片是狗的概率。

    深度学习的过程同样是分为训练和推理(既“评估”)两个过程,通过训练过程来获得数据模型,然后用于评估新的数据。

    数据模型分为两种,一种是所谓判别模型(Discriminative Model),也就是说模型可以直接用来判别事物的。这里所说的判别事物,最典型的就是做分类。既然直接可以用来分类,也就是说我们可以在已知属性的条件下,对该记录进行判断。所以,判别模型是对条件概率进行的建模,也就是p(Y|X)。这里X就是属性集合,实际上就是一个向量;而Y则可能是一个值(此时对应分类问题), 可能是一个向量(此时对应序列标注问题)。判别模型常用于处理分类问题(比如鉴定垃圾邮件)、图像识别等等。

    再说一说生成模型(Generative Model)。生成模型可以描述数据的生成过程。换句话说,已知了这个模型,我们就可以产生该模型描述的数据。而数据由两部分组成,也就是(X,Y),前者是特征,后者则是类别(Y是标量)或者序列类别(Y是向量)。要描述整个数据,也就是要对p(X,Y)进行建模,所以是对联合概率进行建模。生成模型本身不是做分类或者序列标注的,但是可以用来解决这些问题,也可以用于生成式问题,比如聊天机器人、比如AI谱曲等问题。

    而机器学习可以分成下面几种类别:

    监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练数据中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。

    无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类。

    半监督学习介于监督学习与无监督学习之间。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。。

    增强学习通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。

    在传统的机器学习领域,监督学习最大的问题是训练数据标注成本比较高,而无监督学习应用范围有限。利用少量的训练样本和大量无标注数据的半监督学习一直是机器学习的研究重点。

    当前非常流行的深度学习GAN模型和半监督学习的思路有相通之处,GAN是“生成对抗网络”(Generative Adversarial Networks)的简称,包括了一个生成模型G和一个判别模型D,GAN的目标函数是关于D与G的一个零和游戏,也是一个最小-最大化问题。

    GAN实际上就是生成模型和判别模型之间的一个模仿游戏。生成模型的目的,就是要尽量去模仿、建模和学习真实数据的分布规律;而判别模型则是要判别自己所得到的一个输入数据,究竟是来自于真实的数据分布还是来自于一个生成模型。通过这两个内部模型之间不断的竞争,从而提高两个模型的生成能力和判别能力。

    (图片来自Nvidia Deep Learning Training Workshop)

    目前主流的深度学习框架:

    Caffe 由Berkeley提出

    TensorFlow 由Google提出 (Apache 2.0)

    Torch (BSD License), facebook是主要使用者

    MXNet 一个相对中立的机器学习框架(Apache 2.0), 被Amazon AWS使用

    CNTK2 由Microsoft提出 (MIT License)

    人工智能在各个行业的公司分布

    目前人工智能在各个领域的初创公司数量(2016年的数据):

    Deep learning/机器学习 (通用)(123家公司)

    Deep learning/机器学习 (应用) (260家公司)

    NLP (通用) (154家公司)

    NLP (语音识别) (78家公司)

    计算机视觉/图像识别 (通用) (106家公司)

    计算机视觉/图像识别 (应用) (83 家公司)

    手势控制 (33 家公司)

    虚拟个人助理 (92 家公司)

    智能机器人 (65 家公司)

    推荐系统 (60 家公司)

    Context aware computing (28 家公司)

    语音即时翻译 (15 家公司)

    视频识别 (14 家公司)

    下图是目前人工智能在各个行业的热度

    上图是2011到2016年最积极的人工智能企业投资者

    下图是福布斯关注的50家人工智能公司。

    (图片来自http://fortune.com/2017/02/23/artificial-intelligence-companies/)

    融资最多的人工智能初创公司(2011-2016)

    Sentient Technologies:使用先进的人工智能技术,大规模分布式计算和科学的方法来验证新发现的策略,Sentient Technologies为各种领域中的复杂问题提供了新的解决方案。

    Ayasdi:机器学习平台,数据可视化,分析,金融技术,医疗保健代理系统:

    Vicarious: 这是一家神秘的人工智能公司,Vicarious的目标定位于“建立下一代的人工智能算法”。并且声称要构建“像人类一样思考的软件”,实现“人脑级别的视觉、语言和自动控制系统”,致力于研究通用人工智能,目前他们的研究重点是实现人工视觉识别系统。

    Context Relevant:Context Relevant通过使用机器学习驱动的自动化数据科学平台,来解决一些世界上最棘手的大数据,预测和行为挑战 - 比任何其他解决方案更快更有效。

    Cortia:Cortica的技术模拟人类皮层,以便以最高的精度理解和识别图像。

    Workfusion:WorkFusion是全球运营的完整自动化解决方案,将您需要的复杂业务流程数字化所需的核心功能整合到一个平台中:业务流程管理(BPM),机器人过程自动化(RPA),劳动力编排和机器学习提供的认知自动化。

    RapidMiner:开源预测分析平台,使企业能够在业务流程中包括预测分析

    Digital Reasoning Systems:确保合规性,保持安全性,并快速准确地分析信息。

    H2O.ai:H2O是世界领先的开源深度学习平台。 H2O被超过80,000个数据科学家和超过9,000个组织使用。

    Viv Labs:Viv在开发语音智能助理,已被三星收购。

    参考文献:

    https://www.amazon.com/b?ie=UTF8&node=16008589011#

    Nvidia Deep Learning Training Workshop

    Crunchbase

    CB Insights

    关注硅谷密探

    紧盯全球创新趋势

    (即可关注,神马,这居然是二维码!)

    位置:首页 > 科技
    加载更多评论...
    本类推荐
    数据挖掘领域十大经典算法
    数据挖掘领域十大经典算法

    国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 早前评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM...

    所有宣传使用了人工智能技术的科技产品都是大忽悠
    所有宣传使用了人工智能技术的科技产品都是大忽悠

    先问大家一个问题:人工智能和鸡蛋的价格有什么共同点?假设现在你正在商店里挑选鸡蛋,有10种不同的鸡蛋供你挑选。当你看见鸡蛋标签上写着“纯天然”时,你的眼睛一定是亮晶晶的。是的,“纯天然”的鸡蛋听起来很健康的样子,但它们比一般鸡蛋要贵。

    罗振宇谈AI被打脸:看似说得漂亮其实啥也没说
    罗振宇谈AI被打脸:看似说得漂亮其实啥也没说

    2016年的最后一天,赛格威机器人的朋友圈被罗振宇跨年演讲会刷屏了,据说罗振宇跨年演讲会收视率在各大卫视跨年节目中排第一。在长达四小时的演讲中,他以五只鹅为主线,对过去一年的趋势和变化进行了复盘,听起来不明觉厉,让人忍不住转发。

    马斯克,炒作人工智能威胁论除了恐吓人类还有更重要目的
    马斯克,炒作人工智能威胁论除了恐吓人类还有更重要目的

    作者:《人工智能学家》主编 互联网进化论作者 刘锋博士埃隆·马斯克(Elon Musk)1971年6月28日出生于南非,18岁时移民加拿大。工程师、慈善家、paypal贝宝(最大的网上支付公司)、spacex太空探索技术公司、环保跑车公司特...

    能根据文字生成图片的GAN,深度学习领域的又一新星
    能根据文字生成图片的GAN,深度学习领域的又一新星

    2014 年 6 月,Ian Goodfellow等学者发表了论文《Generative Adversarial Nets》,题目即“生成对抗网络”,标志着 GAN 的诞生。2015 年还名不见经传的 GAN ...

    CNCC2016|清华大学张钹院士起底:后深度学习时代的人工智能
    CNCC2016|清华大学张钹院士起底:后深度学习时代的人工智能

    今天CNCC 2016在山西太原盛大开幕,开场演讲中,CCF会士、CCF终身成就获得者,中国科学院士、清华大学教授,中国自动化学会、中国计算机学报副主编、2011年获得德国汉堡社会大学自然科学博士学位...

    为什么吴恩达认为未来属于迁移学习?
    为什么吴恩达认为未来属于迁移学习?

    雷锋网按:日前,知名 AI 博主、爱尔兰国立大学 NLP 博士生 Sebastian Ruder 以“迁移学习:机器学习的下一个前线”为题,对迁移学习的技术原理、重要性与意义、应用方法做了详细阐述。本文对其中讨论迁移学习的原理、重要性...

    Google重磅突破相比LSTM,NLP关键任务提升20%
    Google重磅突破相比LSTM,NLP关键任务提升20%

    新智元编译 自然语言理解(NLP)是人工智能领域使用程度最高的技术之一。受益于最近 自然语言理解技术的发展,现在已经可以应用在很多领域,例如航班预定、客服服务、任务管理、聊天助手等。“自然语言处理已经成为了数据经济掌控之战的制高点...

    国内最大木结构建筑模型入住明堂
    国内最大木结构建筑模型入住明堂

    明堂模型外貌榫卯结构让整个模型非常牢固国内最大的木结构建筑模型——历时两年制作、耗费3万多个纯实木构件打造的明堂模型近日一入住明堂,就吸引了不少游客的目光。11月2日,《洛阳晚报》记者来到位于中州路与定鼎路交叉口的隋唐洛阳城国家遗址公园...

    图像验证码和大规模图像识别技术
    图像验证码和大规模图像识别技术

    为区分人和计算机,互联网上的很多服务都使用了验证码技术,例如电子邮箱申请,银行系统登录,电子商务系统的交易确认,等等。虽然字符识别仍然是最常用的验证码方法,但是基于图像语义识别的验证码逐渐出现在一些重要的互联网应用上,并引起了热议。

    人工智能已“睁开双眼”,能像人类一样学习
    人工智能已“睁开双眼”,能像人类一样学习

    还记得《终结者》系列电影中的天网(Skynet)吗?这个人类于20世纪后期创造的,以计算机为基础的人工智能防御系统,后来因自我意识觉醒,视全人类为威胁,发动了审判日。现在,这样的情景或许会在不远的将来发生在现实生活中,理由是人类的认知能力正被人工智能逐渐习得。

    简洁又美丽的标准模型方程
    简洁又美丽的标准模型方程

    我记得最清楚的是,当我提出一个自认为能使人信服而又合理的建议时,爱因斯坦一点也不表示反对,而只是说,“啊,多么丑!”当他遇到一个他认为丑的方程时,他只是对它不感兴趣,并且不能理解为什么有些人愿意花费那么多时间在它上面。

    延伸热词
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    万花镜 版权所有 京ICP备14059027号
    值班QQ:3012642954
    邮箱:wanhuajingnews@qq.com