Python为什么成为人工智能的首选语言

2,159 阅读7分钟

前言

之前一直都是在学习Python与机器学习,深度学习。但是究竟为什么在众多的编程语言中选择Python作为人工智能的首选语言呢我一直不得而知,今天就来以我的理解来梳理下吧。首先在我不再赘述Python的前世今生,只是深入的说一下Python与人工智能的关系。

一、从人工智能说起

首先人工智能话题的热度再度升起应该是开始于一个引发全民狂欢的科技新闻:2016年到2017年,谷歌开发的围棋AI程序AlphaGo接连击败欧洲冠军樊麾、韩国九段棋手李世石、世界围棋冠军柯洁,登顶地球之巅。此时距离深蓝在国际象棋中横扫人类选手刚好20年。几个月后,AlphaGo的升级版化名AlphaGo Zero卷土重来,仅仅通过3天的自我训练就击败了已经击败了李世石的AlphaGo Lee,经过40天的训练,又轻描淡写的击败了已经击败了柯洁的AlphaGo Master,没有一点防备,也没有一丝顾虑,围棋这个被认为是人类智慧遮羞布的领域就这样被机器按在地上狠狠摩擦,这也就彻底引发了舆论的狂欢。这个时候,许多人说人工智能的时代又一次到来...

在上面所说的是人工智能在游戏领域的应用,其实人工智能的应用还有很多,比如计算机视觉、语音识别、无人驾驶、自然语言处理、推荐系统等,在接下来,我们就重点讲讲我们本文的核心话题:Python为什么成为人工智能的首选语言吧

二、Python成为人工智能的首选编程语言?

首先我们需要明白一点,人工智能所有的核心算法,都是依赖C或者C++完成的,这些算法跑起来非常复杂,属于计算密集型任务,需要榨干硬件的每一分性能。而Python本身的性能只能说是可惜,Java的性能一直被人诟病,Python比Java还要更下一层楼,如果一个人黑python,那么肯定是朝性能这个点狠揍。python在人工智能、深度学习等领域扮演的更多是一个工具人的角色,也就是发挥一个前端或者说“花瓶”的作用,Python虽然不快,但是它易学易用易推倒,你只需要拿Python做做可视化,调用下Api接口,写写展示层的逻辑就完事了。现在的人工智能还处于人工智障阶段,快速搭建一个可以调用和迭代的原型比什么都重要。一些专门搞科研和算法的牛人精力都不在编程语言上,用python能以最低的学习成本快速上手。

为什么不学习其他的低成本的编程语言呢?

  1. Python的前期优势巨大,尤其是和人工智能相关的数据分析领域,Python更是深耕多年,早早占据了先机,像一些广受欢迎的数据分析框架:Numpy、Pandas等都是出自python的手笔;

  2. 一些大型的互联网公司,比如谷歌和FaceBook对Python也是十分的钟爱,而这两家公司都是走在人工智能前沿的先锋,谷歌发布了深度学习框架TensorFlow,FaceBook推出的机器学习库PyTorch,都将Python放在了扛把子的位置;

  3. Python的学术圈和科研圈的渗透力度也远非其他语言可以相提并论,放着简单易学库多的Python不学,难道去学C++嘛,博士也是人,柿子也挑软的捏;

  4. 在美国,特朗普政府和奥巴马政府也花费大量金钱来推广计算机教育;

  5. 打铁还需自身硬,python语言也有其自己独特的优势:

  1. Python的定位是“优雅”、“明确”、“简单”,所以Python程序看上去总是简单易懂,初学者学Python,不但入门容易,而且将来深入下去,可以编写那些非常非常复杂的程序。
  2. 开发效率非常高,Python有非常强大的第三方库,基本上你想通过计算机实现任何功能,Python官方库里都有相应的模块进行支持,直接下载调用后,在基础库的基础上再进行开发,大大降低开发周期,避免重复造轮子。
  3. 高级语言————当你用Python语言编写程序的时候,你无需考虑诸如如何管理你的程序使用的内存一类的底层细节
  4. 可移植性————由于它的开源本质,Python已经被移植在许多平台上(经过改动使它能够工 作在不同平台上)。如果你小心地避免使用依赖于系统的特性,那么你的所有Python程序无需修改就几乎可以在市场上所有的系统平台上运行
  5. 可扩展性————如果你需要你的一段关键代码运行得更快或者希望某些算法不公开,你可以把你的部分程序用C或C++编写,然后在你的Python程序中使用它们。
  6. 可嵌入性————你可以把Python嵌入你的C/C++程序,从而向你的程序用户提供脚本功能。

三、其他补充

Python在一些公司的应用

  • 谷歌:Google App Engine 、code.google.com 、Google earth 、谷歌爬虫、Google广告等项目都在大量使用Python开发
  • CIA: 美国中情局网站就是用Python开发的
  • NASA: 美国航天局(NASA)大量使用Python进行数据分析和运算
  • YouTube:世界上最大的视频网站YouTube就是用Python开发的
  • Dropbox:美国最大的在线云存储网站,全部用Python实现,每天网站处理10亿个文件的上传和下载
  • Instagram:美国最大的图片分享社交网站,每天超过3千万张照片被分享,全部用python开发
  • Facebook:大量的基础库均通过Python实现的
  • Redhat: 世界上最流行的Linux发行版本中的yum包管理工具就是用python开发的
  • 豆瓣: 公司几乎所有的业务均是通过Python开发的
  • 知乎: 国内最大的问答社区,通过Python开发(国外Quora)
  • 春雨医生:国内知名的在线医疗网站是用Python开发的

除上面之外,还有搜狐、金山、腾讯、盛大、网易、百度、阿里、淘宝 、土豆、新浪、果壳等公司都在使用Python完成各种各样的任务。

Python的缺点:

  1. 速度慢,Python 的运行速度相比C语言确实慢很多,跟JAVA相比也要慢一些,因此这也是很多所谓的大牛不屑于使用Python的主要原因,但其实这里所指的运行速度慢在大多数情况下用户是无法直接感知到的,必须借助测试工具才能体现出来,比如你用C运一个程序花了0.1s,用Python是0.01s,这样C语言直接比Python快了10s,算是非常夸张了,但是你是无法直接通过肉眼感知的,因为一个正常人所能感知的时间最小单位是0.15-0.4s左右,哈哈。其实在大多数情况下Python已经完全可以满足你对程序速度的要求,除非你要写对速度要求极高的搜索引擎等,这种情况下,当然还是建议你用C去实现的。
  2. 代码不能加密,因为PYTHON是解释性语言,它的源码都是以名文形式存放的,不过我不认为这算是一个缺点,如果你的项目要求源代码必须是加密的,那你一开始就不应该用Python来去实现。
  3. 线程不能利用多CPU问题,这是Python被人诟病最多的一个缺点,GIL即全局解释器锁(Global Interpreter Lock),是计算机程序设计语言解释器用于同步线程的工具,使得任何时刻仅有一个线程在执行,Python的线程是操作系统的原生线程。在Linux上为pthread,在Windows上为Win thread,完全由操作系统调度线程的执行。一个python解释器进程内有一条主线程,以及多条用户程序的执行线程。即使在多核CPU平台上,由于GIL的存在,所以禁止多线程的并行执行。关于这个问题的折衷解决方法,我们在以后线程和进程章节里再进行详细探讨。