机器学习小课堂

赞

0

|

搜索文章

反向强化学习2——基本形式

本文收录在无痛的机器学习第二季目录。在上一节反向增强学习入门1——基本概念，我们介绍了反向强化学习的基本概念，也介绍了它和强化学习的区别。对于一个强化学习的问题，如果状态和行动空间已知，状态转移概率确定，对于强化学习来，它是要通过回报函数求出最优策略；而对于反向强化学习来说，…

5年前
172
点赞
评论

[福利]《深度学习核心技术与实践》送书活动(5本)

• 在深度学习流行之前的传统机器学习年代，我们认为“人工”更多强调的是特征工程之难，需要机器学习从业者不断分析数据，挖掘新的特征。 • 在深度学习流行的这几年，我们认为这句话依然成立，只是“人工”更多地强调人工标注，因为深度学习需要大量的标注数据。当然，也有人反驳说不需要标注，…

5年前
176
点赞
评论

[送书福利]强化学习精要：核心算法与TensorFlow实现（5本）

这一次在知乎的更新有点滞后了，经过了一年多的积累，我的新书《强化学习精要：核心算法与TensorFlow实现》问世了。强化学习是一个十分火热的领域，在这一年我也得到了很多的收获，并将我的感悟凝结成了这本书。这本书介绍了很多强化学习的基本知识，也整理了近年来部分经典的算法原理和实…

5年前
310
点赞
评论

反向强化学习3——求解线性规划

本文收录在无痛的机器学习第二季目录中。在上一节我们介绍了反向强化学习的公式形式，接下来我们就要完成求解了。这个问题本质上是一个线性规划的问题，但是目前的公式形式还不是一个易于求解的形式，于是我们要把公式进行转变，采用变量替换的方式，将问题变换成标准的线性规划形式。这里涉及两个…

5年前
198
点赞
评论

无痛的机器学习第二季目录

以下是对这一年来完成的文章的汇总贴，陆续还会有新的内容加入，尽情期待！欢迎大家了解我的书：《强化学习精要：核心算法与TensorFlow实现》(冯超)【摘要书评试读】-京东图书item.jd.com

5年前
167
点赞
评论

聊点轻松的——这其实是个招聘贴

最近被大佬点赞，招来了大量的关注者，在此非常感谢大家的关注。专栏自16年7月开张到现在，积累了70多篇文章，一路走来自己也得到了很大的成长，也感谢各位对专栏提出的宝贵意见。 2017年也快要过去了，这一年来忙于很多事，专栏的更新整体偏慢，后面会适当加快一些。在此放出新的一季（此…

5年前
103
点赞
评论

机器学习入门：重要的概念---信息熵（Shannon’s Entropy Model）

原创文章，一家之言。（-------------------------）这么重要。好了，那边拿枪的朋友，请把你的刀从我脖子上拿开，还有那边挥拳头的朋友，你踢到我了。机器学习中很多地方都要根据目前的信息做出决策，信息熵主要是反应信息的不确定性，它的一个很重要的作用，就是做…

5年前
713
1
评论

机器学习中非平衡数据处理

这一篇主要说一下机器学习中非平衡数据的处理方式以及用python如何实现. 在前面的一篇推文中我们提到过，非平衡数据会影响最后的评判效果，严重的会带来过拟合的效果，即模型总是把样本划分到样本量较多的那一种。为了让模型的评判更准确，我们需要对非平衡数据进行一定的处理，主要有以下几…

5年前
214
点赞
评论

反向增强学习入门1——基本概念

本文收录在无痛的机器学习第二季目录。今天我们来聊一个新的内容，那就是反向增强学习。反向增强学习这个东西，从名字上看就知道，它和增强学习有很密切的关系。不熟悉增强学习的朋友可以回头看看专栏的增强学习系列内容，内容还在连载中。反向增强学习也被称为模仿学习（Imitation L…

5年前
147
点赞
评论

解决Sparse Reward RL任务的简单回顾

这篇总结文章来自于我在PRICAI2018 Reinforcement Learning Workshop上的部分演讲内容。相信大家对于强化学习已经有了一定的概念，其中Model-Free的强化学习方法更是获得很大的成功，并在一些任务上达到了与人类专家媲美的效果。利用当前某一…

5年前
157
点赞
评论

个人成就

文章被点赞 8

文章被阅读 4,990

加入于

2018-10-26