首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
机器学习小课堂
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
反向强化学习2——基本形式
本文收录在无痛的机器学习第二季目录。 在上一节反向增强学习入门1——基本概念,我们介绍了反向强化学习的基本概念,也介绍了它和强化学习的区别。对于一个强化学习的问题,如果状态和行动空间已知,状态转移概率确定,对于强化学习来,它是要通过回报函数求出最优策略;而对于反向强化学习来说,…
[福利]《深度学习核心技术与实践》送书活动(5本)
• 在深度学习流行之前的传统机器学习年代,我们认为“人工”更多强调的是特征工程之难,需要机器学习从业者不断分析数据,挖掘新的特征。 • 在深度学习流行的这几年,我们认为这句话依然成立,只是“人工”更多地强调人工标注,因为深度学习需要大量的标注数据。当然,也有人反驳说不需要标注,…
[送书福利]强化学习精要:核心算法与TensorFlow实现(5本)
这一次在知乎的更新有点滞后了,经过了一年多的积累,我的新书《强化学习精要:核心算法与TensorFlow实现》问世了。强化学习是一个十分火热的领域,在这一年我也得到了很多的收获,并将我的感悟凝结成了这本书。这本书介绍了很多强化学习的基本知识,也整理了近年来部分经典的算法原理和实…
反向强化学习3——求解线性规划
本文收录在无痛的机器学习第二季目录中。 在上一节我们介绍了反向强化学习的公式形式,接下来我们就要完成求解了。这个问题本质上是一个线性规划的问题,但是目前的公式形式还不是一个易于求解的形式,于是我们要把公式进行转变,采用变量替换的方式,将问题变换成标准的线性规划形式。这里涉及两个…
无痛的机器学习第二季目录
以下是对这一年来完成的文章的汇总贴,陆续还会有新的内容加入,尽情期待!欢迎大家了解我的书:《强化学习精要:核心算法与TensorFlow实现》(冯超)【摘要书评试读】-京东图书item.jd.com
聊点轻松的——这其实是个招聘贴
最近被大佬点赞,招来了大量的关注者,在此非常感谢大家的关注。专栏自16年7月开张到现在,积累了70多篇文章,一路走来自己也得到了很大的成长,也感谢各位对专栏提出的宝贵意见。 2017年也快要过去了,这一年来忙于很多事,专栏的更新整体偏慢,后面会适当加快一些。在此放出新的一季(此…
机器学习入门:重要的概念---信息熵(Shannon’s Entropy Model)
原创文章,一家之言。 (-------------------------)这么重要。 好了,那边拿枪的朋友,请把你的刀从我脖子上拿开,还有那边挥拳头的朋友,你踢到我了。 机器学习中很多地方都要根据目前的信息做出决策,信息熵主要是反应信息的不确定性,它的一个很重要的作用,就是做…
机器学习中非平衡数据处理
这一篇主要说一下机器学习中非平衡数据的处理方式以及用python如何实现. 在前面的一篇推文中我们提到过,非平衡数据会影响最后的评判效果,严重的会带来过拟合的效果,即模型总是把样本划分到样本量较多的那一种。为了让模型的评判更准确,我们需要对非平衡数据进行一定的处理,主要有以下几…
反向增强学习入门1——基本概念
本文收录在无痛的机器学习第二季目录。 今天我们来聊一个新的内容,那就是反向增强学习。反向增强学习这个东西,从名字上看就知道,它和增强学习有很密切的关系。不熟悉增强学习的朋友可以回头看看专栏的增强学习系列内容,内容还在连载中。 反向增强学习也被称为模仿学习(Imitation L…
解决Sparse Reward RL任务的简单回顾
这篇总结文章来自于我在PRICAI2018 Reinforcement Learning Workshop上的部分演讲内容。 相信大家对于强化学习已经有了一定的概念,其中Model-Free的强化学习方法更是获得很大的成功,并在一些任务上达到了与人类专家媲美的效果。利用当前某一…
下一页
个人成就
文章被点赞
8
文章被阅读
4,990
掘力值
103
关注了
0
关注者
702
收藏集
0
关注标签
0
加入于
2018-10-26