阅读 857

我在掘金的这3年 - 如何实现一个永动机

打算写几篇文章作为我在掘金担任技术总监这3年的总结. 分别从技术, 产品, 管理这三个角度谈一谈我的思考和收获.

本篇是其中第二篇, 没错, 这次我们来讨论如何实现一个永动机. 作为一个论述性质的文章, 我打算由浅入深的介绍这玩意如何实现. 当然, 不要被标题迷惑, 这次是讨论互联网产品的, 标题只是确保你能进来多看一眼的 "互联网" 手段.

先来考古

我不知道正在阅读本文的各位现在还有没有在订阅杂志. 杂志是个伟大的发明. 最早的杂志是《Erbauliche Monaths Unterredungen》(于1663年在德国发行). 但即使是最早的杂志, 也有着现如今内容社区的最基本要素:

  • 非常内聚的内容核心和内容 (内容)
  • 聚集了优秀的作者 (内容的生产者)
  • 广大的订阅用户 (内容的消费者)

随着发展, 杂志的内容无论 PGC (Professionally-generated Content, 专业生产内容), UGC (User-generated Content, 用户生产内容) 还是 OGC (Occupationally-generated Content, 品牌生产内容). 一应俱全. 甚至有的杂志不仅是社区, 甚至是媒体, 又或是二者的混合.

我订阅时间最长的杂志是《电脑爱好者》, 直到 2001 年我的电脑装上了个 56k Modem. 我立刻就有了新的获取内容的渠道. 这时的网络正是门户网站, 论坛, 聊天室的兴起时代. 但在我没经历过的互联网早期, 内容是在新闻组中产生和被消费的.

(新闻组, 图片来自 O'REILLY Learning the Unix Operating System Ch 6.6 Usenet News)

不要小看这个酷似 GNU nano 的界面, 新闻组同样有着内容主题. 优秀的作者. 广大的订阅用户. 并不弱于杂志.

(图来自 攻壳机动队TV Stand Alone Complex Ep19. 偽装網に抱かれて CAPTIVATED, 这里的 9大网络 的灵感可能来源于 Usenet NewsgroupBig 8 即 Usenet 新闻组将内容分为了计算机, 新闻, 科学等8大类来管理.)

看上去新闻组跟杂志的模式没有多少变化? 但实际上变化很大:

  • 从生产内容到消费内容的流程很明显变快了. 杂志即使是周刊, 也要有一周的发行间隔. 但新闻组的话是随时都有人发的(依据wikipedia数据, 最受欢迎的新闻组一小时会产生数千帖).
  • 生产者和消费者的界限变得模糊了. 这次回复的人, 下次就可能是发布内容的人.

1990年代左右开始流行 BBS, 那时候的 BBS 是使用拨号上网, Telnet 进行访问的, 不过模式跟今天的论坛并没有太大区别, 与新闻组相比:

  • 主题变得更轻量化(很可能只是个话题), 消费更容易, 交流更方便.
  • 参与者变得更多元化, 数量更多, 虽然1990年代拥有电脑的人不是很多, 但很明显比1980年代还是多很多了.

(这个图应该承载了不少人的回忆)

同时, WWW 开始普及, 到2000年左右, 连农村都可以上网了. 当然, 2000 年的网络内容远没有现在那么丰富, 但是作为一个刚刚真·村通网的我 (我家是村子里第一个办理拨号上网业务的. 村里第一台电脑是村政府的, 第二台是我家的, 第三台是村中学的, 第四台是村小学的, 我全都修过... ), 这个时代是 WEB 1.0 的辉煌时期, 大家开始用浏览器访问网络, 各种论坛层出不穷, 而且有精美的界面 (相对于Telnet时期的BBS) 和图片. 与BBS相比:

  • 承载的媒体开始变多了, 能在网上看到图片, 听到音乐(虽然下载个MP3可能要半小时), 甚至是动图(Gif).
  • 内容更新速度更快, 甚至有专职的编辑负责生产内容
  • 参与者也变得更多, 毕竟开始村通网了

这时, 信息的集大成者, 门户网站出现了.

(图来自 archive.org, 是网易主页的 2000 年的截图.)

与新闻组, BBS和论坛相比, 门户网站是一种全新的内容承载形式, 它揉合了搜索引擎, 导航站, 传统WEB站点等多种模式, 内容的运营要素非常强.

另外还出现了聊天室这种速度比论坛还快的内容较流形式. 以及, 个人 Blog 也开始出现, 虽然这个时期还没有自媒体的概念, 但个人 Blog 代表了内容的进一步细分和 isolation.

内容载体内容生产速度内容形式单篇内容消费速度内容作者平台用户量
传统纸质媒体, 杂志一张报纸大概每天有40篇文章? 我猜的文字, 图片几分钟至几十分钟大部分是头部作者或专业编辑进行生产千万级别 (世界上发行量最高的杂志 AARP The Magazine 的发行量在 2016 年为 23,428,878. 世界发行量最大的报纸 读卖新闻 的发行量在 2005 为 10,019,000)
新闻组每天约 50 篇文章 (1983年)文字几分钟至几十分钟大众500 多个主机 (1983 年, 过去的主机可能许多人共用一台)
BBS每天约 2 万篇文章 (以 PTT 为例)文字, ASCII 图几分钟至几十分钟大众150 万注册用户 (以 PTT 为例, 实际上 Telnet BBS 过去由于技术和硬件限制导致同时在线很可能都达不到千人, 水木BBS当年注册用户在 30 万左右)
门户网站每天生产百万级别文章 (目前最大的门户网站是 qq.com, 依据我之前对门户网站抓取的工作经验, 消重后内容量级在每天一百万多一些)文字, 图片, 视频几分钟至几十分钟签约作者, 专业编辑进行生产, 机器抓取436,584,000 (qq.com 的每月UV)

通过以上表格的汇总, 我们可以明显看到, 在早期互联网内容在各个方面可能还不如传统纸质媒体好, 但随着技术的进步, 门户网站最终在各个方面都超越了传统纸质媒体. 无论是内容的生产速度, 还是消费者数量.

但我们也可以看到一些另外的情况: 单篇内容的消费速度在这个时代并不被人关注, 垄断头部流量的载体更多趋向于用运营的方式来稳定成生产内容. 内容作者和内容消费者完全不是同样的群体(存在着割裂). 而大众能生产内容的社区, 规模则很有限.

何为量产

随着技术的进步, 2007年人类终于将电脑捆到了自己身上. 对的, 智能手机诞生了. 但与其说智能机是广义的电脑, 不如说智能机是广义的"内容消费终端". 让我们直接将时间跳到现在, 纸质媒体销量几乎完蛋, 互联网完全能覆盖超过50%全国人口的情况. 与上一段的互联网早期一样, 我们直接看几个现象级产品.

Twitter / 饭否 / 微博. 以140字为代表的短内容出现, 彻底降低并固定了内容消费的难度, 让内容消费变得更快速. 同时, 内容长度非常短的规则还带来了生产内容效率的提升, 毕竟水140字比写个1000字的 Blog 简单多了.

问答社区. 问答社区内容长度中等, 本身看上去与其他 WEB 内容并没有太大区别. 但问答社区有一个最大的与众不同之处, 它用最简单的方式实现了量产. 到这里, 我们终于提到了本文的主题, 量产. 什么是量产呢? 以问答社区为例即, 问答社区只要目标用户正确, 就会不断有用户来提问题, 同时又有用户来回答问题. 题问和回答的组合即内容, 内容可以实现批量生产即量产. 当然, 大部分问答社区存在的问题则是内容质量低下, 或目标用户群体较小, 导致规模受到限制.

那么, 微博实现了量产么? 很明显没有, 微博充其量降低了量产的难度 (限制你发短内容), 促进了量产, 完全没有实现内容的量产. 虽然水140个字可能很简单, 但大部分人也不一定天天发微博的. 微博依然缺乏量产的关键要素.

我们再来看一个不太一样的问答社区, 知乎. 根据上面的结论, 我们知道问答社区基本都可以实现量产, 虽然很可能量产单位内容的周期可能很长, 比如大家还是不怎么愿意题问, 题问没有人愿意回答, 进而进入了负循环, 社区始终活跃不起来. 而知乎相比于传统问答社区, 将量产的前一部分也是最关键的一部分, 内容题材变得可以运营了. 即, 知乎上的问题是知乎本身可以运营的. 进而可以间接控制内容量, 内容质量或内容的消费水平. 比如 Apple 发布了新的 iPhone, 知乎的运营同学完全就可以直接在后台添加一个问题 "如何看待苹果新发布的 iPhone 22?"

好的, 那么量产这个概念该如何定义呢? 简单来讲, 量产就是造句或者命题作文, 给定内容生产者完全固定的内容核心来生产内容. 这里要注意区分量产促进量产的这两种截然不同的概念, 促进量产更像是材料作文. 按照现如今普通用户的创作意愿以及创作本身的难度而言, 造句相比材料作文的难度有本质性的差异, 甚至直接决定了创作者是否会有意愿去创作.

我们来看目前实现量产最可怕的产品. 抖音. 废话不多说, 直接看下面这个视频(我随便找了个滤镜拍的我家猫):

t.cn/A6UQVTmu

很遗憾掘金还不支持上传视频, 因此喜欢的同学可以点开链接看.

可能你第一次看这个视频并没有什么感觉. 但接下来我要跟你讲这个视频的可怕之处.

  • 这个内容完全是为了量产准备的 (你只要照着拍或摆动作就可以了).
  • 这个内容量产耗时仅需6秒 (视频时长6秒, 我把我家猫弄过去拍了3条, 总计耗时10分钟).
  • 这个内容消费最多也只需6秒 (看完6秒的视频当然也需要6秒, 或者看一半不愿意看了).
  • 这个内容可以重复量产 (作者可以重复拍, 其他人也可以拍).
  • 这个内容量产门槛不高 (只要你愿意找个猫拍).
  • 冷启动可以可控实现 (冷启动可以直接让公司的内容运营小姐姐拍了放上去).
  • 拥有完整的工具链帮助量产, 甚至还内嵌了各种滤镜和美颜相机 (只要你有手机就能拍).

感受到抖音的可怕了么? 如果感受还没那么强烈, 我们再拿 Biliblil 和 抖音 横向对比下.

首先在Bilibili投稿不是一件简单事情. 因为视频的创作比文字创作要复杂多了. 首先视频创作会涉及到采集过程, 这个过程会无比的漫长, 对于新手而言, 拍摄素质高的视频是十分困难的的, 不仅有时间和精力上的投入, 物质上的投入也不可或缺. 视频拍摄完毕后还需要编辑. 这又是一个门槛, 需要投入成本学习相关软件的使用. 并且编辑过程也相当漫长, 最后压制也会变得漫长. 这里可不是只压制一次的问题. 视频不满意就需要重新压制, 虽然可以通过分段制作来降低压制耗时, 但耗时也比预览下文章长太多了. 当然不是没有更好的方法去量产, 但这需要流水线作业和团队才能完成. 普通的Up主可能连个灯都没有, 更别提影棚了. 最后, 即使你投入了这么做, 辛苦做出来的长达10分钟的精彩视频, 播放量可能还不到抖音那个摆姿势视频的一半...

为什么? 是因为劣币驱逐良币吗? 我们先不考虑这么复杂的问题. 造成这个问题的原因其实很简单. 那就是, 视频时长太长了.

假设每个人每天用在看视频娱乐的时间有1小时. Bilibili的视频平均长度10分钟, 抖音的平均长度60秒.(这里是假设, 实际上都比这个数值要短, 只是为了凸显数据的差距) 那么, 平均每人每天在Bilibili和抖音各能观看多少视频呢? 答案是 B站能看6个, 抖音能看60个! 被展示概率高10倍!

当然你可以说抖音的投稿量也会比B站要高, 因此内容被展示的概率会下降. 但在机器学习的精准分发下, 这不是什么问题. 反而B站的分发模式不够好, 造成了展示概率的进一步下降.

而展示本身直接决定了后续流量(关注, 点赞, 评论等行为)的产生. 因此展示不够是致命的.

B站一个视频生产耗时非常长, 我跟 @awpak78 和 @LuvLetter 大佬交流过, 平时上班的话, 想要量产视频, 2周一个是极限了, 平时1个月一个已经很不错了. 想要做到一定质量的每周更新, 基本要有团队全职才可以完成, 而且过程无比痛苦, 然后消费这样生产出来的视频需要10分钟.

抖音一个视频生产耗时6秒, 即使算上我把我家猫弄到床上然后打个光拍废3条, 也不会超过10分钟, 更何况如果小姐姐拍还有美颜相机, 可能根本不用化妆. 制作过程有趣且无脑, 然后消费生产出来的视频耗时6秒. 怎么打? 没法打的.

很多人都在说字节跳动的成功在于算法优秀, 我则想告诉大家, 在高效的分发之前, 它就已经在另一个维度上赢了.

等等! 那内容质量该怎么办?

看到这里你也许会提出一个问题, "内容质量问题怎么办?" 我刚开始也有这个疑问, 内容质量不高, 用户是不会去消费的, 久而久之用户会流失的. 但其实, 这是个错误的假设. 想要论证这一点其实很简单, 人均 200 的餐馆肯定好吃, 但绝大部分人不会天天吃. 依据用户层次, 适合用户的内容才是好的内容.

这不是什么骇人听闻的新鲜结论, 我来说一些其他概念, 不知道你是否听过以下词汇并了解它的意义? 比如: "傲娇", "无口", "天然呆", "腹黑", "电波", "毒舌", "元气" 等等等等. 如果你是个忠实的三次元, 没有听过这些词汇, 那么想象一下相声有 "捧哏" 和 "逗哏", 它们其实是一样的. 都是某种 设计模式 (这里的设计模式是广义的设计模式, 特指方便组织内容的框架元素或一般方式). 而现如今的内容, 更多的都是用这些设计模式而设计出来的, 而不是什么旷世传奇或无法再现的绝世经典.

比如, 我们现在就来设计一部新番, 人设上女1是冰美人, 女2则是天然呆, 背景设定则是发生在高中的故事, 他们都喜欢野外露营. 好嘛, 这不就是 摇曳露营 嘛. 然后我们换一下, 女1是天然呆, 女2是黑长直. 他们喜欢玩乐器. 好嘛, 这是 轻音少女. 为了拯救废校的危机, 得, 这是 LoveLive!. 出门就被车撞了, 您这是 佐贺偶像是传奇... 而设计校园主题的剧情也很简单: 开学, 文化祭, 暑假, 修学旅行, 新年, 盂兰盆节, 社团, 学生会, 考试, 补考, 游泳课, 合宿, 学习会... 简直12话都不够.

(非二次元的同学可以想象成郭老师和于老师分别用: 吃黄豆, 我是你爸爸, 又打人了 三个包袱设计三个相声段子).

说这么多其实想说, 内容都是可以量产的, 并且他们的质量可以很可靠的控制. 熟悉小说的同学肯定很了解, 起点上小说的经典设计模式. 上面的修仙文, 就是量产出来的. 而且是可以稳定被消费的. 我也不是量产理论的第一个提出者.

大塚英志 在《物語消費論改》中详细论述了将内容制作的理论化, 体系化 (即量产) 是业界在 1980 年代就已经开始实践的技术, 并且现在已经是完全的高度工业化的产物. 它的本质, 是结构主义, 后现代主义和现代的流量模式的结合.

而顶尖的内容并不能获得所有用户喜欢. 我和 @awpak78 年初开始一起搞一些关于电脑和电子垃圾的内容, @awpak78 发现可以用二手的 OCP 卡以极低的成本做一张万兆网卡, 于是他做了一期视频投稿了 Bilibili 比网线还便宜的双口万兆网卡!, 教大家如何用差不多30块搞定一张万兆网卡 (万兆网卡在此之前最便宜的也需要200多, 还是二手拆机的), 甚至 PCB 设计方案都开源了. 这个视频发出来后, OCP 卡从 10 块涨到了 25 一张. 现在咸鱼搜 OCP 转接卡, 全是照着我们的开源方案做出来的成品转接卡.

如此给力的项目, 这个视频播放量有多少呢? 7.2 万 (2020-03 至 2020-08). 不及喝82年拉菲视频的一个零头. 说实话, 这样的播放量让我俩很受打击. 但没办法, 这个内容注定了它的受众实在是太窄了. 普通电脑发烧友根本看不懂, 也没技术去嘉利创去打 PCB 最后自己焊接个转接卡.

也许你会说, 金子总会发光的, 高质量的内容更不容易被时间淘汰. 的确是这样, 高质量内容的阅读量半衰期更长, 那么有多长呢? 我们在掘金做的一个数据挖掘结果表明, 无论多好的文章, 3天基本是内容分发的极限了, 3天后阅读量就会降低到第一天的1/10以下. 而我自己在知乎上发布的专栏文章基本也是这样的水平. 所以, 无论是对于内容作者还是内容平台, 与其提高内容水平, 不如稳定一个内容水平, 争取最大化量产获得的收益更高. 所以你看, 那些科普视频看完了并不会让你学会什么, 但是科普视频的播放量就是比大学公开课要高多了. 现在, 你应该明白这是为什么了吧.

我了解了, 那如何实现量产呢?

回到文章最初的主旨, 有同学知道我 2016 - 2019 年在掘金工作, 本文也是为了反思我在掘金的工作经历而写的. 如果不知道掘金是什么, 大家可以看一眼: 掘金.

用过知乎的同学也许会有既视感, 这不就是抄知乎么? 我现在觉得这句话根本不含有任何贬义, 甚至是过誉了. 我们没有抄到知乎的精髓. 掘金从诞生到现在都没有实现量产.

  • 首先, 用户到了这里都不知道该生产什么内容. 虽然右上角有醒目的 发沸点, 写文章. 但点进去后完全不知道该写什么.
  • 量产时间不确定, 但可以肯定60秒啥也量产不出来, 在掘金水一篇1000字的文章起码得半小时.
  • 很难重复生产, 内容有排他性, 同样的内容容易被头部作者垄断.
  • 内容生产门槛高. 不懂编程, 没有专业知识没办法生产.
  • 工具链只有编辑器, 虽然掘金的 markdown 编辑器应该是内容社区中体验最棒的 (这点不是自夸, 我们的 markdown 编辑器比其他网站好太多), 但这毫无卵用.

不仅掘金面临这个问题, 实际上绝大部分内容社区都面临这种问题. 无法实现量产. 生产时间长, 内容不易被消费.

别看我在这里说的头头是道, 但其实我真正得出量产这个概念已经很晚了, 在 2019 年初, 我发现我在知乎水的一个 搭建家庭 NAS 服务器有什么好方案? 的帖子意外的受到好评, 于是我开始思考, 我能否持续产出这种质量的内容? 对, 这是我第一次站在真正的内容生产者, 而不是之前作为掘金的开发者自以为是的猜测该如何量产.

当然, 我们之前也不是没有意识到掘金面临量产上的问题, 我和掘金的站长 @阴明 一直认为, 像 StackExchange (StackOverflow.com 就是它旗下的板块) 一样的网站是我们心目中追求的目标, 一个完美的永动机. 工程师工作会遇到问题, 遇到问题就会想看看 StackOverflow 上有没有办法解决, 如果还没有, 那就提问. 总会有大佬来回答的. 我们只要在网站上挂个广告, 躺着就能赚钱了. 完美的闭环有没有? 永动机有没有? 但很遗憾, 掘金到现在都没有做到这一点.

但其实, StackOverflow 也并没有实现可控量产, 它上面的问题也是用户自己在实际中遇到问题才会去进行提问的, 我们假设一种极限场景, 新出现了一个叫 MoneyExplode 的竞品网站, 在上面提问的人会获得积分, 积分可以换钱 (多模经典的"互联网模式"). 那么可以想象, 久而久之, StackOverflow 上题问的人会越来越少, 上面的问题终究会被时效性而淘汰. StackOverflow 就死掉了.

而想要改变这一切也很简单, 实现可控量产就可以了. 最简单的就是, 找一些有编程经验的编辑来主动发布问题. 又或者更简单粗暴一些, 直接去网上抓取问题, 消重加工后, 变成你自己的问题.

那么, 对于掘金, 我能想到的量产模式的核心是, 提高用户的写作意愿. 当然我们也实践过类似的方式, 比如"掘金征文大赛", 但这个跟我说的花钱刺激量产实际上是一样的, 治标不治本. 但我想说, 这个模式其实很接近了, 只需要把征文大赛换成命题作文就可以了, 比如我们实践过的 "2018 与我的技术之路", 这个模式可以延续下去, 做到每周征文, 比如 "来说说你最喜欢的VSCode插件", "做一个聊天软件大家一起聊天吧!", "Docker都有哪些新玩法?". 然后分发和展示模式一变, 就将知乎的精髓学到了手.

如果你是个内容作者, 如何实现量产也是你稳定增长的核心. 我来举一个例子, 你注册个微博号, 就叫每日雅思单词, 都说到这了, 懂了吧? 我自己的经验是, 如果你没有固定的模式去量产(就刚才说的每日雅思单词), 那么维持一个缓冲池是个很好的办法, 这东西在业内叫ネタ帳(捏他账), 这是日语里面的说法, 换成国内的话, 大概就是类似题材库, 段子本的东西. 这个东西看似简单, 其实维护起来很难. 一个好的ネタ帳记录的点子需要在最快的时间内吸引读者的注意同时能产出适当的内容. 但是很遗憾, 这个东西只能平时自己维护. 但我们看到, 在知乎, 里面的具有热度的问题直接解决了这个难题. 只要选择自己擅长的问题回答就行了.

另外, 实现量产的工作流程也很重要, 大家都知道专业摄影都有影棚, 电影或电视剧则有影视基地, 为什么? 因为这些东西会花掉量产过程的大量时间. 以我自己为例, 如果我想拍视频, 我要先收拾桌子, 然后把设备从桌子下面的箱子里拿出来摆好, 然后设置好灯光, 才能开始拍摄. 光这些每次可能就要花掉1小时. 而写技术文章可能也是这样, 比如你很可能需要一个塞满数据的测试用Redis, 或者需要一个装着 gcc 3 至 10 版本的测试环境, 而Docker就可以很好的解决这个问题.

结论

  • 量产即命题作文.
  • 量产是从小作坊到工业化转变的标志.
  • 用户想要量产是非常难的. 如果是视频内容量产, 难度还要上升几个数量级. 所以平台要帮助用户完成这一过程, 才会带来增长.
  • 平台如果实现了量产, 不仅可以显著增加内容, 还可以间接提升内容创作者数量. 让内容, 作者, 消费者的新增形成正循环.
  • 根据以上结论, 平台总关注用户新增是没有意义的, 内容创作者新增才是更有效的数据目标.
  • 在用户新增远远没到天花板之前, 想着通过新功能来提升用户黏性以提升留存是放屁.

课后作业

  • 为什么微博现在可以发长微博了? 为什么抖音可以发长视频了? 为什么Bilibili有B博了? (30分)
  • 如果你负责百度贴吧, 该如何拯救这个产品? 微博呢? 知乎呢? (70分)

扩展阅读