写给即将上岗的码农们

阅读 424
收藏 15
2018-03-14
原文链接:zhuanlan.zhihu.com

前两天公司学院的同学给我看了一下即将入职的应届生的数量,真是不少。感慨一下,一批新人即将到来,而自己又老去了一岁。码农是一个必将终身学习的职业。而相关的知识越来越多了。接下来该学什么?接下来该干什么?这个需要你对自己,对这个行业,对供需关系有自己的判断。

码农需要学习的对于这么多的知识,我把它们分成这些类别

大致上每一类知识对应了一个分工的角色。

这三个模块构成了所谓的基础架构。他们解决的都是机器,以及机器引起的问题。主要的问题就两个:

  • 可用性问题:机器都是会出故障的,软件也会有bug。利用软件冗余提高系统的可用性。利用良好的运维自动化系统,用人类来解决重大的系统性故障。
  • 成本问题:合理配置资源。运维自动化。理解硬件,最大化硬件利用效率。利用算法和数据结构,构造高效的系统。如何在性能满足的情况下,保证一致性。

这四个模块解决的都是人的问题。现在还需要人来写大量的复杂的代码。因为代码量很大,就需要很多的人来共同协作。复杂的人性,加上复杂的代码逻辑和分工。共同构成了这么一个接近艺术的领域:

  • 解决分工的问题:这些复杂度需要被管理起来,使得代码可以被理解。管理的手段一般被称之为架构。从编程语言,到大量的框架和库,到业务的模块划分。大量的代码不是解决机器的问题,也不是在解决业务的问题。这些代码是在解决人的问题。
  • 解决个体开发效率和质量的问题:编码指的是类似测试驱动开发等教你如何做好写代码工作的知识。
  • 解决群体开发效率和质量的问题:测试指的是黑盒测试,白盒测试这些。
  • 解决无法按时交付的问题:项目管理的目标是把各种参与方整合起来,按进度完成目标。

这四个模块一般都是割裂成不同的角色来分工的。但是实际上是互相关联的。比如不好管理的项目,往往是复杂度管理方面出了问题。

所有其他的一切都是围绕业务来做的。最终的目标是用计算机来做一些有价值的事情。计算机程序有两种编码方式:

  • 用人来写:需要理解业务,编写业务逻辑。需要组织一帮人来写,需要分工。分工不能瞎来,得基于对业务的理解来。所以部分的复杂度管理是和业务领域高度相关的。
  • 用机器来写:同样也是需要理解业务,选取特征。在业务理解的基础上,用合适的数学工具,降低计算复杂度。但是编写程序的过程是由机器来完成的。而且学习出来的模型不需要人来理解和修改,所以不存在复杂度管理的问题。

机器学习得到的程序是一种基于模式匹配的机器,目前这种机器仍然无法直接对规则类代码进行编写。看似和人工编码的规则是相辅相成的关系。但是某种程度上是在替代人工编码的规则的。规则类代码实现规则只是手段不是目的。从优化的角度来说,规则只是一种优化的手段。法律也只是优化社会稳定性这个指标的一种手段。

然后可以列一个目录,我们可以看到和码农相关的知识类别还是很多的。很多年轻的朋友,一说起要学习。就是要学习golang,要学习网络知识。掌握底层技术栈的码农虽然仍然稀缺,但是这个问题领域的需求并不如过去那么旺盛了。不要把鸡蛋放到一个篮子里,综合性地建立自己地知识体系会对长远发展更有帮助。

  • 解决机器的问题
    • 如何减少时间和空间复杂度:算法和数据结构
      • 如何用排序提高效率
      • 如何用哈希提高效率
      • 如何用算法保证分布式一致性
    • 如何利用好硬件:理解硬件
      • CPU/GPU是如何应对内存延迟高随机读带宽小的问题的
        • OoO: out of order
        • SIMD
        • SIMT
        • SMT
    • 如何让人类更好地在半自动化系统下工作:自动化
      • 如何让人类更好地影响自动化了的部分:发布变更
      • 如何让人类更好地收到反馈,分析处理灾难:监控告警
  • 解决人的问题
    • 解决分工问题:复杂度管理
      • 按结构分工
      • 按时序分工
      • 按层次分工
        • 按同时同地发生的不同特性来分工
        • 按计算的依赖层次分工:具体场景的,模板业务逻辑的,流程平台的,基础架构的
    • 解决个体开发的效率和质量问题:编码
      • 如何最大化对个体的反馈
        • 测试驱动开发
        • 日志
        • 可视化
    • 解决群体开发的效率和质量问题:测试
      • 如何让一群人获得整体的反馈
    • 解决按期交付问题:项目管理
  • 解决业务问题
    • 人工编码
      • 让一群人干好活:复杂度管理
        • 在这个业务场景下,如何分工才能最小化沟通
          • 如何才能理解业务之间的联系:沟通来自业务内在的耦合
          • 微服务
          • 领域驱动开发
          • 面向对象:单变量派发,多变量派发
      • 干好我的活:业务逻辑
        • 熟练的使用框架和库:踩在巨人的肩膀上,快速落地。要能快速学习新的语言和框架
        • 证明业务收益:效果评估,置信度
        • 找到业务价值:数据分析
        • 理解业务如何运作:业务流程的理解和建模
        • 软件可用性:如何让用户喜欢,高效。基本的交互设计能力
        • 视觉设计:至少得会画界面原型
        • 产品设计:竞品分析,市场研究
    • 机器学习
      • 提高业务得到的收益
      • 降低计算成本

复杂度管理部分,展开一下

相同空间,相同时间:在一个点上多股“不相关”的逻辑汇聚到了一起

1、功能性需求和非功能性需求的同时处理,比如计费和内存分配,同时管理。很多类型申明的活是为了硬件优化,比如const和immutable。处理特定编解码的逻辑,和

2、正常流程和多种异常流程的同时处理,高可用需要额外加很多代码。但是和主线业务的理解是无关的。

3、同时操作多个CPU核:用一条指令操作说明多个并行的计算流程,比如SIMD本质上是把并行的计算用一个指令流来操作

4、多线程共享的代码:要考虑同一段代码被多个线程并行执行的各种交错的时序

5、不同侧面的业务需求同时处理:发单和促销和运力撮合

备注1:相关和不相关和阅读者有关。特别是非正交的业务需求。

备注2:分开了之后也未必就不复杂了。有些时候存粹就是解决方法太笨拙。有些事情是问题本身就是一个逻辑上很复杂的求解过程。

相同空间,不同时间

1、不幂等的代码。有副作用的代码。全局变量多的代码。两次执行会有不同的结果,需要考虑之前的状态。

不同空间,相同时间

1、在多份代码上保持概念上的完整性。极端例子是拷贝的代码。让多个模块都认一个概念(比如n元组),也算是维护概念完整性。

2、在多个存储上保持数据上的一致性

3、完整的一段逻辑被拆成特别细碎的小函数,造成每个函数都没法说明自己到底干了啥。这里函数也可以换成微服务。

不同空间,不同时间

1、同一个流程的多个步骤逻辑被打撒到了步骤的代码里,和该步骤的其他业务混到了一起。没有一个视觉上可见的实体来代表一块前后有密切联系的“功能特性”。

2、跨越多个代码库,多个时间点的职责上的循环依赖

简单来说可以归纳成两种:

1、需要关注到一个物体的时候,没法聚焦。分散到很多地方了,或者被其他逻辑淹没了。

2、同时跟踪多个物体

评论