万花镜
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    购物世界电影科幻片

    如何区分人工智能、机器学习和深度学习?

    2017年3月17日 作者:硅谷密探

    本文内容来自于硅谷投资人Lake Dai,LDV Partners合伙人。严肃编辑整理。

    人工智能(Artificial Intelligence)是一个最广泛的概念,人工智能的目的就是让计算机这台机器能够象人一样思考,而机器学习(Machine Learning)是人工智能的分支,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,使之不断改善自身的性能。

    深度学习(Deep Learning)是一种机器学习的方法,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层(神经网络)对数据进行高层抽象的算法。

    神经网络是一组大致模仿人类大脑构造设计的算法,用于识别模式。神经网络通过机器感知系统解释传感器数据,能够对原始输入进行标记或聚类等操作。神经网络所能识别的模式是数值形式,因此图像、声音、文本、时间序列等一切现实世界的数据必须转换为数值。

    在深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂,因为每一层会整合并重组前一层的特征。

    (http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)

    上图显示了一个神经网络用于判定一个图片是不是一条狗的过程,输入是图片,通过深层神经网络对狗的低层特征进行抽象,最后输出是图片是狗的概率。

    深度学习的过程同样是分为训练和推理(既“评估”)两个过程,通过训练过程来获得数据模型,然后用于评估新的数据。

    数据模型分为两种,一种是所谓判别模型(Discriminative Model),也就是说模型可以直接用来判别事物的。这里所说的判别事物,最典型的就是做分类。既然直接可以用来分类,也就是说我们可以在已知属性的条件下,对该记录进行判断。所以,判别模型是对条件概率进行的建模,也就是p(Y|X)。这里X就是属性集合,实际上就是一个向量;而Y则可能是一个值(此时对应分类问题), 可能是一个向量(此时对应序列标注问题)。判别模型常用于处理分类问题(比如鉴定垃圾邮件)、图像识别等等。

    再说一说生成模型(Generative Model)。生成模型可以描述数据的生成过程。换句话说,已知了这个模型,我们就可以产生该模型描述的数据。而数据由两部分组成,也就是(X,Y),前者是特征,后者则是类别(Y是标量)或者序列类别(Y是向量)。要描述整个数据,也就是要对p(X,Y)进行建模,所以是对联合概率进行建模。生成模型本身不是做分类或者序列标注的,但是可以用来解决这些问题,也可以用于生成式问题,比如聊天机器人、比如AI谱曲等问题。

    而机器学习可以分成下面几种类别:

    监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练数据中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。

    无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类。

    半监督学习介于监督学习与无监督学习之间。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。。

    增强学习通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。

    在传统的机器学习领域,监督学习最大的问题是训练数据标注成本比较高,而无监督学习应用范围有限。利用少量的训练样本和大量无标注数据的半监督学习一直是机器学习的研究重点。

    当前非常流行的深度学习GAN模型和半监督学习的思路有相通之处,GAN是“生成对抗网络”(Generative Adversarial Networks)的简称,包括了一个生成模型G和一个判别模型D,GAN的目标函数是关于D与G的一个零和游戏,也是一个最小-最大化问题。

    GAN实际上就是生成模型和判别模型之间的一个模仿游戏。生成模型的目的,就是要尽量去模仿、建模和学习真实数据的分布规律;而判别模型则是要判别自己所得到的一个输入数据,究竟是来自于真实的数据分布还是来自于一个生成模型。通过这两个内部模型之间不断的竞争,从而提高两个模型的生成能力和判别能力。

    (图片来自Nvidia Deep Learning Training Workshop)

    目前主流的深度学习框架:

    Caffe 由Berkeley提出

    TensorFlow 由Google提出 (Apache 2.0)

    Torch (BSD License), facebook是主要使用者

    MXNet 一个相对中立的机器学习框架(Apache 2.0), 被Amazon AWS使用

    CNTK2 由Microsoft提出 (MIT License)

    人工智能在各个行业的公司分布

    目前人工智能在各个领域的初创公司数量(2016年的数据):

    Deep learning/机器学习 (通用)(123家公司)

    Deep learning/机器学习 (应用) (260家公司)

    NLP (通用) (154家公司)

    NLP (语音识别) (78家公司)

    计算机视觉/图像识别 (通用) (106家公司)

    计算机视觉/图像识别 (应用) (83 家公司)

    手势控制 (33 家公司)

    虚拟个人助理 (92 家公司)

    智能机器人 (65 家公司)

    推荐系统 (60 家公司)

    Context aware computing (28 家公司)

    语音即时翻译 (15 家公司)

    视频识别 (14 家公司)

    下图是目前人工智能在各个行业的热度

    上图是2011到2016年最积极的人工智能企业投资者

    下图是福布斯关注的50家人工智能公司。

    (图片来自http://fortune.com/2017/02/23/artificial-intelligence-companies/)

    融资最多的人工智能初创公司(2011-2016)

    Sentient Technologies:使用先进的人工智能技术,大规模分布式计算和科学的方法来验证新发现的策略,Sentient Technologies为各种领域中的复杂问题提供了新的解决方案。

    Ayasdi:机器学习平台,数据可视化,分析,金融技术,医疗保健代理系统:

    Vicarious: 这是一家神秘的人工智能公司,Vicarious的目标定位于“建立下一代的人工智能算法”。并且声称要构建“像人类一样思考的软件”,实现“人脑级别的视觉、语言和自动控制系统”,致力于研究通用人工智能,目前他们的研究重点是实现人工视觉识别系统。

    Context Relevant:Context Relevant通过使用机器学习驱动的自动化数据科学平台,来解决一些世界上最棘手的大数据,预测和行为挑战 - 比任何其他解决方案更快更有效。

    Cortia:Cortica的技术模拟人类皮层,以便以最高的精度理解和识别图像。

    Workfusion:WorkFusion是全球运营的完整自动化解决方案,将您需要的复杂业务流程数字化所需的核心功能整合到一个平台中:业务流程管理(BPM),机器人过程自动化(RPA),劳动力编排和机器学习提供的认知自动化。

    RapidMiner:开源预测分析平台,使企业能够在业务流程中包括预测分析

    Digital Reasoning Systems:确保合规性,保持安全性,并快速准确地分析信息。

    H2O.ai:H2O是世界领先的开源深度学习平台。 H2O被超过80,000个数据科学家和超过9,000个组织使用。

    Viv Labs:Viv在开发语音智能助理,已被三星收购。

    参考文献:

    https://www.amazon.com/b?ie=UTF8&node=16008589011#

    Nvidia Deep Learning Training Workshop

    Crunchbase

    CB Insights

    关注硅谷密探

    紧盯全球创新趋势

    (即可关注,神马,这居然是二维码!)

    位置:首页 > 科技
    加载更多评论...
    本类推荐
    未来;人工智能的天下
    未来;人工智能的天下

    由于我们整个团队接触的都是大数据和人工智能方面的信息和工作。接触的信息和咨询也是国内比较前沿的知识。有一个问题一直使我们非常的困惑,就是整个世界前进到底靠什么在驱动?为什么今天会是这个样子?我们以后会是什么样子?

    周末盘点五大可识别图片的人工智能技术
    周末盘点五大可识别图片的人工智能技术

    选自eweek机器之心编译出品参与:Sane,微胖很长一段时间以来,人工智能的研究都集中在让机器理解书面文字,比如著名的图灵测试(Turning Test),证明了机器能够像人类一样智能地回答书面问题。

    中国机场出现一架F22隐身战机,美军派卫星侦察,要求做出解释
    中国机场出现一架F22隐身战机,美军派卫星侦察,要求做出解释

    美国的F-22战斗机被誉为世界上最为先进的战斗机,集超音速巡航、超机动性、低可探测性、先进的航电系统为一体,可以说在其服役的前期,相当长的一段时间里都没有对手,但再先进的战斗机也有其弱点,所以为了保证此款战机能够长期立足于战斗机之巅...

    StuartRussell:人工智能就好比核武器
    StuartRussell:人工智能就好比核武器

    从1920年的戏剧《R.U.R.》中愤怒的机器人到电影《2001:太空漫游》中嗜杀成性的计算机H.A.L.9000,自人工智能这个概念进入到我们共同的想象中以来,科幻小说作者浓墨重彩地描写了它黑暗的一面。

    论文推荐|陈良:GNSS增强系统中精密实时钟差高频估计及应用研究
    论文推荐|陈良:GNSS增强系统中精密实时钟差高频估计及应用研究

    陈良1,23, 耿长江1,2, 葛茂荣41. 中国航天电子技术研究院卫星导航系统工程中心, 北京 100094;2. 中国卫星导航系统管理办公室测试评估研究中心, 北京 100094;3. 武汉大学卫星导航定位技术研究中心, 武汉 430079;

    人工智能将成为约炮神器?
    人工智能将成为约炮神器?

    四年前,那个躁动的春天,i黑马写的一篇《约炮神器TOP10》刷遍互联网圈,全网累计阅读破千万,成为无数宅男宅女人生幸福指南。四年后,这个燥热的夏天,i黑马在深入研究了人工智能产业之后猛然发现——人工智能很可能将再让“约炮”成为历史。

    一个神经网络学习一切!谷歌又放了个大卫星(附论文)
    一个神经网络学习一切!谷歌又放了个大卫星(附论文)

    李林 问耕 编译自 Arxiv量子位 出品 | 公众号 QbitAI最近,Google又在论文题目上口出狂言:One Model To Learn Them All,一个模型什么都能学。非营利研究机构OpenAI的研究员Andrej Karpathy在Twitter上评论说...

    一文了解机器学习知识点及其算法(附python代码)
    一文了解机器学习知识点及其算法(附python代码)

    老师,我建议你多挂点人如果不让小明通过答辩,他会不会跳楼?这个社会在极严厉的惩罚不读书的人寒门如何出贵子机器学习发展到现在,已经形成较为完善的知识体系,同时大量的数据科学家的研究成果也让现实问题的处理有了相对成熟的应对算法。

    GitHub最受欢迎深度学习应用项目Top16(持续更新)
    GitHub最受欢迎深度学习应用项目Top16(持续更新)

    新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:jobs@aiera.com.cn13552313024新智元为COO和执行总编提供最高超百万的年薪激励;

    重磅!阿里妈妈首次公开自研CTR预估核心算法MLR
    重磅!阿里妈妈首次公开自研CTR预估核心算法MLR

    一、 技术背景CTR(Click-Through-Rate)即点击通过率,是互联网广告常用的术语,指网络广告(图片广告/文字广告/关键词广告/排名广告/视频广告等)的点击到达率,即该广告的实际点击次数除以广告的展现量。

    Google工程师:从零开始学习无人驾驶技术—端到端无人驾驶
    Google工程师:从零开始学习无人驾驶技术—端到端无人驾驶

    雷锋网按:本文作者夏飞,清华大学计算机软件学士,卡内基梅隆大学人工智能硕士。现为谷歌软件工程师。雷锋网首发文章。TLDR (or the take away)视频结果:无人车以 30m/h (~ 50km/h) 在Simulator中行驶。

    人类输了!机器人批改作文打分比老师还准!AI怎么做到的?
    人类输了!机器人批改作文打分比老师还准!AI怎么做到的?

    出品:中国科普博览 SELF格致论道讲坛导语:2045年,中国77%的工作将被人工智能取代,耳熟能详的人工智能真的只会让人失业吗?当AI取代人力承担繁重的批阅工作,当AI实现因材施教,当AI将老师从工作中解脱出来,教育会迎来怎样的变革呢?

    延伸热词
    首页社会国际娱乐科技时尚军事汽车探索美食旅游历史健康育儿
    万花镜 版权所有 京ICP备14059027号
    值班QQ:3012642954
    邮箱:wanhuajingnews@qq.com