机器学习入门资料推荐

1,983 阅读9分钟
原文链接: mp.weixin.qq.com

2019 第 34 篇文章,总第 58 篇文章

本文大约 9000 字,资料挺多建议收藏慢慢看

上篇文章说的总结机器学习方面的资料,整理好了,主要是分为以下几个方面的资料:

  • 编程语言:实现机器学习,主要是介绍 Python 方面的语言;

  • 书籍:看书通常是入门的一种方法,比较适合自律性强的同学;

  • 视频:入门的第二种方法就是看视频,虽然会比看书慢一些,但是胜在详细,对完全零基础者是非常友好的;

  • 教程:主要是一些教程文章;

  • 博客网站:常去的网站,包括一些大神博客;

  • Github 项目:Github 上的一些项目;

  • 比赛:最好的学习方法还是通过项目实战来加深理解,机器学习还有很多公开的比赛;

  • 论文:无论是学生还是工作,看论文都是为了紧跟大牛的步伐,了解研究领域最先进最好的算法。

由于微信公众号不支持外链,可以点击文末“阅读原文”,方便点击链接。


1. 编程语言

目前机器学习领域最常使用的就是 Python,并且它对初学者非常友好,所以推荐的是 Python 方面的一些教程、书籍资料。

教程

  • Python 3.7.3 文档

https://docs.python.org/zh-cn/3.7/

  • 廖雪峰老师的 Python3 教程

https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000

  • Comprehensive Python Cheatsheet:python 知识点小抄

https://github.com/gto76/python-cheatsheet

书籍

  • 《Python 编程从入门到实践》

  • 《流畅的 Python》

常用工具库介绍

Numpy

最基础的 Python 库,可以用于处理数组、矩阵相关的计算。

  • 官网

http://www.numpy.org/

  • 官方教程

https://www.numpy.org/devdocs/user/quickstart.html

  • numpy-100练习题

http://www.labri.fr/perso/nrougier/teaching/numpy.100/

Pandas
  • 官方文档

https://pandas.pydata.org/pandas-docs/stable/

  • 10 Minutes to pandas

http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html

Scipy
  • 官方教程

https://docs.scipy.org/doc/scipy/reference/tutorial/index.html

Matplotlib
  • Matplotlib 教程

https://liam.page/2014/09/11/matplotlib-tutorial-zh-cn/

Scikit-learn
  • 官网

https://scikit-learn.org/

  • 官方教程

https://scikit-learn.org/stable/tutorial/index.html

Jupyter Notebook
  • Awesome Jupyter--介绍了 Jupyter 相关的库、资源和教程,总共11个类别等

https://github.com/markusschanta/awesome-jupyter

  • Jupyter Notebook 教程,入门+进阶

https://www.dataquest.io/blog/jupyter-notebook-tutorial/

https://www.dataquest.io/blog/advanced-jupyter-notebooks-tutorial/

Pycharm
  • 喏,你们要的 PyCharm 快速上手指南

https://zhuanlan.zhihu.com/p/26066151

  • Pycharm 官方教程

http://www.jetbrains.com/pycharm/documentation/

  • Pycharm toolbar window

http://www.jetbrains.com/help/pycharm/2016.3/debug-tool-window.html%23steptoolbar

  • Pycharm 皮肤主题及个性化设置

http://blog.csdn.net/garfielder007/article/details/53873787

  • Pycharm 更换主题

http://blog.csdn.net/felcon/article/details/38491413

  • pycharm快捷键及一些常用设置

http://www.cnblogs.com/kaituorensheng/p/5371366.html

2. 书籍

  • 《统计学习方法》:李航老师的书,非常经典,强力推荐!并且现在已经有实现书中算法的代码,可以搭配使用!

代码:https://github.com/wzyonggege/statistical-learning-method

https://github.com/WenDesi/lihang_book_algorithm

https://blog.csdn.net/tudaodiaozhale

https://github.com/fengdu78/lihang-code

  • 《机器学习》:周志华老师的书,也称为西瓜书,同样也是推荐阅读。基本涵盖了机器学习的所有分支,包括监督学习、无监督学习、强化学习、特征选择等。

  • 《机器学习实战》:这是一本比较偏实战方面的书,每种经典的算法都用 Python 代码一步步实现,包括 KNN、决策树、贝叶斯、逻辑回归、SVM、AdaBoost 这几种分类算法,还有回归、无监督学习、降维以及大数据方面的内容。

  • 《hands-on-ml-with-sklearn-and-tf》:一本入门书籍,并且附带使用 sklearn 和  tensorflow 两个库,目前有中文版的翻译,推荐!

电子书:

http://download.csdn.net/download/xinconan1992/9877225

中文版:

https://github.com/apachecn/hands_on_Ml_with_Sklearn_and_TF

Code:

https://github.com/ageron/handson-ml

  • 《百面机器学习》:这本书可以用于查漏补缺,看看你对机器学习是否真正了解透彻,可以看看这本书,看看有哪些知识点还需要深入学习或者是补充的。

  • 《推荐系统实战》:适合对于像了解推荐系统的小伙伴们!

  • 《深度学习》:一本非常经典的书,如果想了解深度学习的内容,可以考虑看这本书,当然书非常厚,而且包含非常多的知识,从基础的数学到深度学习的 CNN、RNN 模型。

3. 视频

视频课程主要推荐三位老师的课程。

  • 吴恩达老师的两门课程

机器学习:这也是很多人推荐的入门课程。

Couresa

https://www.coursera.org/learn/machine-learning

网易云

http://open.163.com/special/opencourse/machinelearning.html

深度学习 deeplearning.ai Coursera

http://www.coursera.org/specializations/deep-learning

网易云课堂

http://mooc.study.163.com/smartSpec/detail/1001319001.htm

  • 李宏毅老师的课程

2019 机器学习课程

youtube

https://www.youtube.com/playlist?list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4

B站

https://www.bilibili.com/video/av46561029/

课程资料链

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML19.html

深度学习课程 b站视频

  • 林轩田老师的两门课程课程主页

https://www.csie.ntu.edu.tw/~htlin/

机器学习基石

b站视频

https://www.bilibili.com/video/av12463015/

配套书籍:Learning From Data

http://amlbook.com/

机器学习技法

b站视频

https://www.bilibili.com/video/av36760800/

4. 教程

推荐一些网上的教程,包括机器学习、深度学习方面的教程,可以用于辅助学习,在看书或者看视频的时候,如果觉得理解还不够透彻,可以看看这些网上教程,有助于更好的理解算法。

  • http://www.huaxiaozhuan.com/--AI算法工程师手册,包含数学基础、机器学习、深度学习、计算机视觉和NLP等知识

  • https://github.com/apachecn/AiLearning--AiLearning: 机器学习 - MachineLearning - ML、深度学习 - DeepLearning - DL、自然语言处理 NLP

  • https://feisky.xyz/machine-learning/--机器学习与人工智能学习笔记,包括机器学习、深度学习以及常用开源框架(Tensorflow、PyTorch)等

  • https://github.com/open-source-for-science/TensorFlow-Course#why-use-tensorflow--简单快速入门的TF教程

  • https://github.com/aymericdamien/TensorFlow-Examples/--2w6的Star的教程,从机器学习算法到深度学习,以及一些使用方法,比如数据加载、模型保存、多GPU、可视化

  • https://github.com/zeusees/HyperDL-Tutorial?from=singlemessage&isappinstalled=0--整理深度学习方面的教程,包括基础网络、框架总结、网络设计和转换等

  • https://zybuluo.com/hanbingtao/note/433855--总共七章内容,从感知器、CNN到RNN、LSTM

  • https://github.com/scutan90/DeepLearning-500-questions:深度学习500问,以问答的形式介绍了机器学习、深度学习的一些知识点

5. 博客 & 网站

推荐一些大牛和公司团队的博客或者网站。

博客

分别推荐国内外的博客:

国内

1.机器学习--这是别人学习机器学习和深度学习做下笔记的博客,有好几十篇博文呢。

http://www.cnblogs.com/tornadomeet/tag/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/default.html?page=1

2.zouxy09的专栏--这个博客不只有机器学习内容,还有一个深度学习的系列。

http://blog.csdn.net/zouxy09

3.Machine Learning--也是有关机器学习的一个博客。

http://www.cnblogs.com/jerrylead/tag/Machine%20Learning/default.html?page=1

4.美团技术团队

https://tech.meituan.com/

5.苏剑林的博客

https://spaces.ac.cn/

6.火光摇曳:腾讯技术大牛们的博客

http://www.flickering.cn/

国外

1.OpenAI

https://blog.openai.com/

2.Distill

https://distill.pub/

3.Google AI Blog--谷歌AI的博客

https://ai.googleblog.com/

4.Notes on machine learning

https://peterroelants.github.io/

5.BAIR Blog--伯克利大学AI小组博客

http://bair.berkeley.edu/blog/

6.DeepMind Blog--DeepMind的博客

https://deepmind.com/blog/?category=research

7.FAIR Blog--Facebook AI博客

https://research.fb.com/blog/

8.Netflix:Netflix技术博客

https://medium.com/netflix-techblog

  1. Towards Data Science

https://towardsdatascience.com/

网站

同样也是分国内和国外的几个网站

国内
  • (推荐)机器之心--国内 AI 领域非常出名的公众号及平台

https://www.jiqizhixin.com/

  • PaperWeekly--论文阅读笔记

https://www.paperweekly.site/tags/176/papers

  • 通天塔--论文阅读,中英文翻译对比

http://tongtianta.site/

国外
  • Arxiv--寻找最新论文的网站

https://arxiv.org/

  • Arxiv Sanity Preserver--对 arXiv 更好的展示论文

http://www.arxiv-sanity.com/

  • 强力推荐)Papers With Code--论文及其实现代码

https://paperswithcode.com/

  • 强力推荐)Browse state-of-the-art记录了16个大类,总共950+个任务的当前最先进的技术

https://paperswithcode.com/sota

  • RSIP vision--图像处理和计算机上视觉

https://www.rsipvision.com/

  • Learn Opencv

https://www.learnopencv.com/

  • (推荐)PyimageSearch--计算机视觉、opencv等,并且都是详细实现代码,每一步实现都解释得很清楚!

https://www.pyimagesearch.com

6. Github 项目

  • Tensorflow/models--TensorFlow 官方 Github

https://github.com/tensorflow/models

  • gluon-cv--GluonCV 提供了当前计算机视觉性能最优的深度学习模型

https://github.com/dmlc/gluon-cv

  • Deep Learning - All You Need to Know--深度学习资源,包含了论文、网络模型、教程、数据集、博客、框架等等

https://github.com/osforscience/deep-learning-ocean

人脸

  • awesome-Face_Recognition--近十年的人脸相关的所有论文合集

https://github.com/ChanChiChoi/awesome-Face_Recognition

  • face_recognition--人脸识别库,可以实现识别、检测、匹配等等功能

https://github.com/ageitgey/face_recognition

计算机视觉

  • Awesome Image Classification--图像分类方面的汇总,常用的网络模型的性能结果,代码实现以及论文

https://github.com/weiaicunzai/awesome-image-classification

  • Awesome-Image-Inpainting--图像修复方面的资料汇总

https://github.com/1900zyh/Awesome-Image-Inpainting

7. 比赛

比赛网站

1.Kaggle

https://www.kaggle.com/

2.天池

https://tianchi.aliyun.com/home/

3.DataFountain

https://www.datafountain.cn/4.FlyAI

https://www.flyai.com/5.JData

https://jdata.jd.com/

比赛经验

  • https://zhuanlan.zhihu.com/p/25742261

  • https://zhuanlan.zhihu.com/p/27424282

  • [https://zhuanlan.zhihu.com/p/37663895

  • https://www.zhihu.com/question/24533374

  • https://zhuanlan.zhihu.com/p/25686876

  • https://zhuanlan.zhihu.com/p/29923137

8. 论文

最后就是介绍论文,对于选择读研的同学,了解熟悉自己所在领域的顶会是很有必要的,通过阅读研究领域的一些经典以及最新论文,了解当前领域的最新进展,并且也有助于发表论文。

这里主要介绍机器学习领域,特别是计算机视觉领域的几个顶会。

顶会

  • AAAI: 顶级人工智能综合会议

2019年 accepted paper:

https://aaai.org/Conferences/AAAI-19/wp-content/uploads/2018/11/AAAI-19_Accepted_Papers.pdf

2018年 accepted paper:

https://aaai.org/Conferences/AAAI-18/wp-content/uploads/2017/12/AAAI-18-Accepted-Paper-List.Web_.pdf

2017年 accepted paper:

https://www.aaai.org/Conferences/AAAI/2017/aaai17accepted-papers.pdf

  • IJCAI: 顶级人工智能综合会议

2018年accepted paper:

http://www.ijcai-18.org/accepted-papers/index.html

2017年accepted paper:

https://ijcai-17.org/accepted-papers.html

  • ICML :顶级机器学习会议

2018年 accepted paper:

https://icml.cc/Conferences/2018/Schedule?type=Poster

2017年 accepted paper:

https://icml.cc/Conferences/2017/Schedule?type=Poster

  • NIPS:顶级综合人工智能会议

2018年 accepted paper:

https://nips.cc/Conferences/2018/Schedule?type=Poster

2017年 accepted paper:

https://nips.cc/Conferences/2017/Schedule?type=Poster

  • CVPR:计算机视觉与模式识别

CVPR 2018 accepted paper:http://openaccess.thecvf.com/CVPR2018.py

CVPR 2017 accepted paper:http://openaccess.thecvf.com/CVPR2017.py

  • ICCV:国际计算机视觉大会

ICCV 2017 accepted paper:http://openaccess.thecvf.com/ICCV2017.py

  • ECCV:欧洲计算机视觉国际会议

ECCV 2018 accepted paper:http://openaccess.thecvf.com/ECCV2018.py

综合资源

  • deep-learning-papers-translation--Github 深度学习论文翻译,包括分类论文,检测论文等

https://github.com/SnailTyan/deep-learning-papers-translation

  • deep-learning-papers--深度学习的论文,包括视觉、文本、音频

https://github.com/sbrugman/deep-learning-papers

  • 各种机器学习任务的顶级结果(论文)汇总--汇总多个任务,包括视觉、语音、NLP、强化学习等方向的最顶级结果的论文

https://github.com/RedditSota/state-of-the-art-result-for-machine-learning-problems


小结

最后,对于机器学习的初学者:

  • 如果是喜欢看书的,推荐直接看书,李航老师的《统计学习方法》和周志华老师的《机器学习》两者选一本作为入门,也可以搭配《机器学习实战》来一步步通过代码实现算法;

  • 如果希望通过视频入门,那么推荐的三位老师的课程,可以选择其中一位老师的课程来学习,刚好每位老师都有两个系列的课程,由浅入深。

  • 第三种选择也可以看网上的教程,有很多不同的系列文章,并且写得也通俗易懂,也是可以选择的一种入门方式!

最后上述机器学习资料我也放到 Github 上了,欢迎 star!

https://github.com/ccc013/DeepLearning_Notes#deeplearning_notes

推荐的书籍以及视频都打包放到网盘上了,获取方式如下:

  1. 关注公众号“机器学习与计算机视觉

  2. 在公众号会话界面回复“机器学习”,即可获取网盘链接

今日留言主题:谈谈你当初通过哪本书或者哪个视频课程开始你的机器学习之旅的

欢迎点击下方图片,进行留言!

欢迎关注我的微信公众号--机器学习与计算机视觉,或者扫描下方的二维码,大家一起交流,学习和进步!

往期精彩推荐

机器学习系列
Github项目 & 资源教程推荐