[资源推荐] 必须收藏的两个查找论文和代码实现的网站!

15,377 阅读5分钟

无论是研究方向是 AI 方面的学生,或者是做机器学习方面的算法工程师,在掌握基础的机器学习相关知识后,都必须掌握搜索论文的技能,特别是研究或者工作领域方向的最新论文,更进阶一点的技能,就是可以复现论文的算法,这是在论文作者没有开源代码的时候的一个解决办法,但是在能够掌握这项技能前,我们希望能够搜索到其他人复现的代码。

因此,今天我会推荐两个相关的网站,并且都是同个团队的成果,这个两个网站,一个可以用于展示带有代码实现的论文算法,另一个给出了多个领域最新最好的算法论文结果。

1. Papers with Code

首先给出这个网站的网址:

paperswithcode.com

这是 Reddit 的一个用户 rstoj 做的一个网站,将 ArXiv 上的最新机器学习论文与 Github 上的代码(TensorFlow/PyTorch/MXNet/等)对应起来。相比之前推荐的阅读 ArXiv 的网站,这位用户做出了满足更多研究者的最大需求--寻找论文算法实现的代码!

这个项目索引了大约 5 万篇论文(最近 5 年发布在 arxiv 上的论文)和 1 万个 Github 库

你可以按标题关键词查询,或者研究领域关键词,如图像分类、文本分类等搜索,也可以按流行程度、最新论文以及 Github 上 Star 数量最多来排列。这个网站能让你跟上机器学习社区流行的最新动态。

首先是看下这个网站大概长什么样的:

上图给出的是按照流行程度来排列,对每篇论文给出了题目、作者、投稿的会议或者顶会,一些简介,比如是否当前领域最先进算法,标签(即关键词,论文研究的方向)和采用的代码框架(比如是 Pytorch 还是 TensorFlow 或者其他框架),论文和代码链接,还有当前 Github 的 Star 数量,以及每小时增加的 Star 数量。

如果是按照 Github Star 数量最多排列,如下图所示:

可以看到最多 Star 数量前两位都是 TensorFlow ,第三位是 Caffe 框架。

另外,如果我们在搜索框输入研究领域的关键词,比如图像分类--Image Classification,搜索结果如下所示:

它会展示当前包含该领域带有论文的共 250 篇论文,然后是展示几个数据集上效果最好的算法和论文,以及开源项目(如果开源了),然后就是子领域--Subtasks,最后是该领域的有代码的论文,按照 Github 上 Star 数量来排列。


2. Browse state-of-the-art

同样先给出网址:

paperswithcode.com/sota

这个网站主要是解决另一个问题--寻找一个领域目前最好的(State of the art, Sota)算法的论文以及实现代码。这也是刚接触到一个新领域时候,必须要做的事情,先找到最新最好的算法论文,然后根据这篇论文的代码实现,先跑下代码,接着再去了解细节,或者是根据它的参考论文,来学习这个领域最近几年的论文(一般是 3 年到 5 年内的),逐渐熟悉这个领域的研究方向和难点所在。

还是 Papers with Code 的团队做出了一个可以查询领域最新算法的网站,它总共包含了 16 个大类,950+的单独子类任务,500+个评估结果(包含 Sota 结果)、700+数据库,8000+论文。如下图所示:

16 个分类包括:

  • 计算机视觉
  • 自然语言处理
  • 医疗
  • 研究方法
  • 杂类
  • 语音
  • 游戏
  • 图(Graphs)
  • 时间序列
  • 音频
  • 机器人
  • 音乐
  • 推理
  • 计算机编码
  • 知识库
  • 对抗性(Adversarial)

点击计算机视觉这个大类,可以看到具体又划分了450+个子任务,如下图所示:

这里可以继续点击进去每个子任务,比如图像分类,然后会得到如下图所示:

上图其实就是在刚刚介绍 Paper with Code 网站时候,介绍搜索领域关键词例子中的图例了。


最后,再给出两个网站的网址:

有了上述两个网站帮助,相信可以帮助大家更好的去学习和熟悉研究领域方向的工作了!

欢迎关注我的微信公众号--机器学习与计算机视觉,或者扫描下方的二维码,大家一起交流,学习和进步!

往期精彩推荐

学习笔记
Python-100 练习系列
数学学习笔记
Github项目 & 资源教程推荐