入门人工智能

3,028 阅读11分钟

一、引言

1、什么是人工智能?

如果你是一个新技术的爱好者或者从事工科学习的学生,你一定听说过人工智能(AI),对于什么是人工智能,百度是这样子给出的定义:

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。 人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。 2017年12月,人工智能入选“2017年度中国媒体十大流行语”。 ----来自百度

再就是按照UCLA教授朱松纯教授的定义,AI大概可以分为一下六类:

(1)计算机视觉 -> 人类的视觉能力 (2)自然语言处理 -> 人类的语言文字能力 (3)语音识别与生成 -> 人类的听与说能力 (4)机器人学 -> 人类的运动能力和运动智能 (5)博弈与合作 -> 人类对抗与合作的能力 (6)机器学习 -> 人类的学习能力

2、实际应用

机器视觉,指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,自动规划,智能搜索,定理证明,博弈,自动程序设计,智能控制,机器人学,语言和图像理解,遗传编程等。

AI分类

3、学科范畴

人工智能是一门边缘学科,属于自然科学和社会科学的交叉。

4、涉及学科

哲学和认知科学,数学,神经生理学,心理学,计算机科学,信息论,控制论,不定性论

5、研究范畴

自然语言处理,知识表现,智能搜索,推理,规划,机器学习,知识获取,组合调度问题,感知问题,模式识别,逻辑程序设计软计算,不精确和不确定的管理,人工生命,神经网络,复杂系统,遗传算法

6、意识和人工智能

人工智能就其本质而言,是对人的思维的信息过程的模拟。

对于人的思维模拟可以从两条道路进行,一是结构模拟,仿照人脑的结构机制,制造出“类人脑”的机器;二是功能模拟,暂时撇开人脑的内部结构,而从其功能过程进行模拟。现代电子计算机的产生便是对人脑思维功能的模拟,是对人脑思维的信息过程的模拟。

弱人工智能如今不断地迅猛发展,尤其是2008年经济危机后,美日欧希望借机器人等实现再工业化,工业机器人以比以往任何时候更快的速度发展,更加带动了弱人工智能和相关领域产业的不断突破,很多必须用人来做的工作如今已经能用机器人实现。

而强人工智能则暂时处于瓶颈,还需要科学家们和人类的努力。

二、介绍

回到我们文章的正题,实现人工智能(AI)的方法:机器学习、深度学习。

1、机器学习:一种实现人工智能的方法

机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。举个简单的例子,当我们浏览网上商城时,经常会出现商品推荐的信息。这是商城根据你往期的购物记录和冗长的收藏清单,识别出这其中哪些是你真正感兴趣,并且愿意购买的产品。这样的决策模型,可以帮助商城为客户提供建议并鼓励产品消费。机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。从学习方法上来分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习。传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。

2、深度学习:一种实现机器学习的技术

深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。但由于近几年该领域发展迅猛,一些特有的学习手段相继被提出(如残差网络),因此越来越多的人将其单独看作一种学习的方法。最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。其实有不少想法早年间也曾有过,但由于当时训练数据量不足、计算能力落后,因此最终的效果不尽如人意。深度学习摧枯拉朽般地实现了各种任务,使得似乎所有的机器辅助功能都变为可能。无人驾驶汽车,预防性医疗保健,甚至是更好的电影推荐,都近在眼前,或者即将实现。

3、三者的区别和联系

机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。我们就用最简单的方法——同心圆,可视化地展现出它们三者的关系。

三者关系

目前,业界有一种错误的较为普遍的意识,即“深度学习最终可能会淘汰掉其他所有机器学习算法”。这种意识的产生主要是因为,当下深度学习在计算机视觉、自然语言处理领域的应用远超过传统的机器学习方法,并且媒体对深度学习进行了大肆夸大的报道。深度学习,作为目前最热的机器学习方法,但并不意味着是机器学习的终点。起码目前存在以下问题:

  1. 深度学习模型需要大量的训练数据,才能展现出神奇的效果,但现实生活中往往会遇到小样本问题,此时深度学习方法无法入手,传统的机器学习方法就可以处理;
  2. 有些领域,采用传统的简单的机器学习方法,可以很好地解决了,没必要非得用复杂的深度学习方法;
  3. 深度学习的思想,来源于人脑的启发,但绝不是人脑的模拟,举个例子,给一个三四岁的小孩看一辆自行车之后,再见到哪怕外观完全不同的自行车,小孩也十有八九能做出那是一辆自行车的判断,也就是说,人类的学习过程往往不需要大规模的训练数据,而现在的深度学习方法显然不是对人脑的模拟。

三、入门

作为一个新技术的爱好者,相信每一个人都跟我一样,想要接触新技术,但又不知道如何入手,接下来就给大家一些推荐:

1、书籍

《统计学习方法》:李航博士的经典教材。用最精炼的语言描述机器学习算法,转行AI必读书籍。

《机器学习》:周志华教授的西瓜书。统计学习方法涵盖面太窄,配合西瓜书来扩展宽度。

《python机器学习及实现》:适合入门,学习曲线平滑,理论书看累了,就跟着这本书打一遍代码,对kaggle就会大致的了解。

《集体编程的智慧》:有各种算法的实现代码,配合理论书看,能更深入的理解算法。

《PRML》:机器学习经典,贝叶斯经典。

《神经网络与深度学习》:邱老师的开源书。

《深度学习》:“花书”,也算是深度学习的经典书籍了。

《机器学习实战》。

《动手学深度学习》。

《百面机器学习》:俗称葫芦书,已提问的方式归纳机器学习面试中的种种知识点,面算法建议准备一本。

《剑指offer》: 面试必刷书籍,因为很多面试官都是从里面找题。

2、视频

  • 斯坦福CS229机器学习(Machine Learning)- 吴恩达(Andrew Ng):

2009版视频:斯坦福课堂视频,内容比较充实,但要看板书,而且有些没必要的课堂互动,容易分心。

2014版视频:这是吴恩达在coursera上的授课视频,一段视频一个主题,更加精炼清晰。

  • 机器学习基石和机器学习技法-林轩田:

吴恩达的课程一大问题是英文授课,有些小伙伴畏惧英语,就退缩了。 这样的话,台湾大学林轩田老师的机器学习基石及技法是非常不错的选择。 这门课深度深一些,更数学一些,会讲一些非常基础的机器学习理论,如VC维,KKT条件等。 我的建议是一开始听不懂直接过,学完之后再来反刍。

  • 机器学习与神经网络-Hinton:

讲神经网络恐怕没有比祖师爷更好的了,Hinton老爷子的思想非常深邃,换句话说可能不太好懂,但这不影响这是非常优秀的课程。

  • 斯坦福CS231-深度学习计算机视觉-李飞飞:

计算机视觉无疑是这波深度学习浪潮的弄潮儿,搞计算机视觉方向经典的入门视频,里面会介绍各式各样的卷积神经网络。

  • 斯坦福CS224-深度学习自然语言处理-Chris Manning:

人工智能另外一个重要领域是自然语言处理,搞这个方向经典的入门视频莫过于CS224。

  • 机器学习-李宏毅:

上面的视频虽然经典,但是英文授课,这让很多小宝宝很崩溃,但没事,来看台湾大学的深度学习吧!

  • 机器学习-白板推导系列:

b站推出的教学视频,条理清晰,重点明确,而且每个章节讲解才20分钟左右,up主语速偏慢,1.5或2倍速看也没有问题,非常适合入门。

四、建议

学习再多,不如去亲手做一下,无论是项目还是竞赛。