揭秘知乎限流

阅读 1123
收藏 20
2017-08-11
原文链接:zhuanlan.zhihu.com

有很多人问过知乎限流的问题,所以我不得不写下这篇文章,做一次详细的解释。

一群连流量是什么都不知道的人在讨论限流,我想问你知道怎么统计流量吗???

知乎流量数据是无法获得的,只能通过大量的测试进行估算。

经过我的测试,保守估计100赞1万PV,500赞5万PV,1000赞就等于公众号的10万+

for feed in me.feeds.filter({
    FeedType.COLLECT_ANSWER,
    FeedType.COLLECT_ARTICLE,
    FeedType.COLUMN_POPULAR_ARTICLE,
    FeedType.CREATE_ANSWER,
    FeedType.CREATE_ARTICLE,
    FeedType.CREATE_PIN,
    FeedType.CREATE_QUESTION,
    FeedType.FOLLOW_COLLECTION,
    FeedType.FOLLOW_COLUMN,
    FeedType.FOLLOW_QUESTION,
    FeedType.FOLLOW_ROUNDTABLE,
    FeedType.FOLLOW_TOPIC,
    FeedType.LIKE_PIN,
    FeedType.VOTEUP_ANSWER,
    FeedType.VOTEUP_ARTICLE,
    FeedType.ANSWER_FROM_TOPIC,
    FeedType.ARTICLE_FROM_TOPIC,
    FeedType.QUESTION_FROM_TOPIC,
    FeedType.EBOOK_FROM_TOPIC,
    FeedType.AD,
})

常见FeedType有这20种,把首页的数据爬一爬,用数据说话

先拿出一个白号,没有任何行为,只关注路人甲

爬取白号的所有动态,一共2007条:来自热门内容1990条,来自路人甲的17条

热门内容分为15类,分布如图

再拿出一个男性账号,没有任何行为,关注了32个人,全是大胸美女。

爬取男号的所有动态,一共1960条:来自关注者动态667条,热门内容360条,来自话题810条,你可能感兴趣123条

再拿出一个大胸美女账号(轮子哥点过赞的),正常用户的行为,关注的都是男人

爬取女号的所有动态,一共1998条:来自关注者动态176条,来自话题635条,你可能感兴趣1187条

最后拿出大号lxghost,只关注200个人。一共2967条动态,内容全部来自关注者动态

出现次数分布如下,红色为万粉以上

可以看出,每个人都是平等的,越活跃的人出现的次数越多,不是说你的关注者越多,出现的次数就会越多,应该是取决于活跃度。请教我该如何限流?对谁进行限流?限流是为了什么?

知乎小管家只出现了两次,出现率为万分之6.7,肯定是被限流了。

下面是大家最关心的问题,为什么首页会这样呢?取决于三个因素
1.用户画像
每个用户都有个性化标签,对用户属性进行挖掘
2.内容分析
新内容进入流水线分析,打上各种标签
3.排序算法
前面两个都是用户不可见的,用户能看到只有结果,首页内容由排序算法决定。以前是类似EdgeRank,现在是Pointwise 和 Pairwise 的 Learning to Rank

上面都是废话,到底是为什么呢?一切的答案就在这个首页动态开关

新版首页和旧版首页是完全不一样的,2014年以前的用户会有这个选项,之后的用户都是默认新版并且不可修改!

所以只有lxghost这个账号内容是100%来自关注的人,内容是固定的,爬几次都是一样。

但是白号、男号、女号的注册时间晚,首页内容是动态生成的,每次爬都不一样!

现在的用户基本都是2014年以后注册的,关注了某人,只能看到他的部分动态。
首页动态上限为2000条左右,由关注者、来自话题、热门内容、你可能感兴趣四块组成 。
账号行为为空白时,会推荐一些大的话题,推送热门内容,其中受限制话题必须主动关注才能看到。
随着账号行为增多,热门内容不再推送,根据个性化标签推送可能感兴趣的话题,所以说你看到的内容都是你自己选择的,要学会使用举报和屏蔽功能,看到垃圾及时举报屏蔽。

看到这里,你应该能理解为什么看不到关注的人的动态了吧。

这个年代笑贫不笑娼,比较暴力比较黄,你只要赞数不要脸,已经忘了如何写文章。

标准的套路就是接个软文,然后找几个大V点赞,发现赞涨不上去,达不到客户要求....那么就刷点赞,心满意足地去交差。最后再哭诉下,我被知乎限流了,我发的别人都看不到。。。

你们肯定忘了,以前的高赞都是优质内容,让人看了觉得写的真好,才会点赞。连知乎排第一的张佳玮也不能保证每篇回答文章一定能获得高赞,一般人发个软文就几十个赞(大部分还是刷的),PV低的可怜,说实话赞同数并不是重要的指标。

浏览量(PV),站内取决于阅读、赞同、收藏、感谢、评论、分享,站外取决于曝光、搜索引擎、外链分享。最关键的是内容,优质的内容才是王道,能写出优质内容的人才在哪里~

如果不相信我的话,请自己爬取数据进行分析,研究点赞的效果,研究出来了记得告诉我。

如果有个人或机构号想一起研究数据的,现在可以免费教你!

不忘初心,方得始终,与君共勉~

参考 知乎湾区机器学习分享会

评论
说说你的看法