以前端架构师身份，从零开始搞事搞事搞事（1）

0. 前情提要

0.1 背景

在阿里加班加腻了的我，遂选择国企，作为人生的下一站。

众所周知，当今中国，不考虑某些不和谐的东西，最赚钱的只有两个行业，那就是 IT，以及金融。

于是，聪明的我，既然已经干过 IT 了，那么接下来，当然要去干金融小……！——哦不，是在金融业干 IT。

于是，我回到了西安，选择了一家信托公司开始干前端组长（请不要理解错，不是那个干），这个还算有点前途的工作。

0.2 当时环境

这是一家信托公司，也是一家国企。

众所周知，大部分国企的技术体系，很一般。不过还好的是，从上面的大领导，到部门领导，都很有能力，也很有魄力。这也是为什么我来这家公司的原因。毕竟，来国企虽然虽然为了稳定，但也不想混日子嘛。

在我刚刚来到这家公司时，面对的是前任留下的烂摊子。具体来说，有以下这些：

现有前端组员 3 人，优点是态度很好，缺点是技术水平一般，特别是代码习惯并不好；
遗留前端项目一个，但问题很大，具体情况下面说；
原本预期工期三个月的项目，已经 5 个月了，还没完成；
后端提供的接口，变更频率很大，并且经常无告知变更，导致代码容易突然不能运行；
其他，略；

特别要说一下这个前端工程相关的问题：

所有后端接口都是跨域访问的，一方面后端是开跨域的，另一方面，当访问到后端接口，前端用的路径是绝对路径；
有四个环境（开发/测试/预生产/生产），打包到不同环境需要执行四个不同的命令（记不记第一条例，绝对路径的接口url），也就是说打四种包；
没有自动化部署（即 CI/CD），需要手动打包，然后复制代码，（防盗：作者:零零水，wechat:qq20004604）通过 ftp 上传到不同服务器。所以很容易误操作；
其他基本没有。

基本上，只有烂摊子，没什么值得称道的地方。

唯一值得庆幸的是，领导的支持力度还可以，虽然只能招外包开发，但是招人的权利全权放给我，我说要，那就招。

0.3 上一篇博客

19 年 5 月，我写过一篇 8000 字的《大型项目前端架构浅谈》，当时在掘金曾经最高升到历史总榜第三的位置（累计阅读接近 12w，点赞 3500+）。但又有一些人反馈，觉得说的有点浅，缺少具体实现方法。

但那篇，即使谈的比较浅，也已经 8000 字了，这篇相对上一篇博客，细化谈了几点，我在写这句话的时候算了一下，大概也已经有 8000 字了。

所以不是我不想谈深一点，是想写深一点，每一点都可能有 8000 字以上，尽力了。

1. 解决遗留问题

1.1 定思路

在做事前，必须明确思路。几个原则：

确保现有稳定；
先做低成本高产出的事情；
考虑长期成本尽可能低；

结合以上情况，我判断：

最重要的是人的因素；
其次是判断问题的轻重缓急，逐个解决；
最后是在日常搭建优化前端技术体系，尽量通过工具和规范来提高大家代码质量。

虽然以上问题，我都可以一个人解决，并且做的很好，但是，我一个人写不完所有的项目。即使我能力再强，但随着团队扩大，边际效益必然越来越低。

1.2 了解团队成员

所以我先单独约每位同学聊天，了解其为人想法，以及个人情况，为接下来的行动做准备。

谈话过程中，我先了解他们想法、个人情况，基于其个人意愿，为他们的未来提出设想，并给出具体可行的发展方向。

谈话结果总体还可以，起码大家表面上来看（防盗：作者:零零水，wechat:qq20004604），大家都是有想法有干劲的（最后验证，的确如此）。不用担心有人故意拖后腿。

【ok，人的问题解决】

1.3 轻重缓急分析

对已有问题进行分析判断：

问题	严重程度	修复成本
接口变更	高，严重影响进度	低，只要和后端协调好即可
缺少CI/CD	中	低，需要写个脚本自动从 gitlab 同步代码
脚手架质量低	中	中，对旧项目影响大
接口跨域	高	已有代码中，新工程低
组员代码不规范	高	高，需要时间
忘了列出来的	*	*

【现有问题明确】

1.4 明确架构师任务

前端架构师进行前端技术建设的核心目的，是为了提高开发效率，保证开发质量，为保障项目高质量按时交付。

同时兼顾考虑中长期研发实际情况，结合团队实际能力，为未来做技术储备，为业务发展提供更多的可能性。

于是，将自己的任务分为以下三类：

基础架构设计：主要目的是从架构层面出发，通过流程化设计，规避常见问题，提高开发效率；
工程化设计：与代码强相关，主要目的是提高代码质量，增强代码的长期可维护性，降低开发时间和成本；
团队管理类：通过合理有效的团队管理，提高团队人效比，为未来项目研发、技术发展，进行人才储备、技术研发；

我要从以上三个角度切入，既能解决已有问题，又能为长期未来提供支持。

【方向明确】

于是，开始干活，用了 4 个月，做了以下工作。

2. 基础架构设计

2.1 前端pipeline

基础架构的核心设计，是流程设计。好的流程可以高效率低成本的运行，同时可以通过流程化规避大量问题。

基本流程设计如下：

在这个流程中，代码被分成了三层：【个人代码——主分支代码——线上代码】，其中线上代码又分成了dev、qa、pro 三个版本。

开发人员只对个人代码拥有可控权，而无法直接影响改变主分支代码，当需要提交到主分支时，需要发起 merge 请求，并经过管理员 review 代码后，将其代码合并到主分支。

而主分支代码又和线上代码进行隔离，（防盗：作者:零零水，wechat:qq20004604）由管理员将指定版本代码发布到指定环境。无论是哪个dev、qa 还是 pro，都将直接从 gitlab 上拉取指定提交，然后打包发布。

通过这种二次隔离，导致代码环境可控、干净、稳定。因此，无论在哪个环境，代码的发布都是幂等的，换句话说，是稳定可控可预期的。

通过以上流程，前端代码能被保证以高质量高稳定性的状态，运行在服务器端。

2.2 代码版本控制

传统前后端分离项目中，前端代码通常由前端自己独立部署，打包完成后，直接部署到指定目录下。但该流程有几个严重的问题：

缓存问题：为了提高用户访问速度，降低加载资源带来的流量压力，我们通常会对前端静态资源做缓存处理。但缺点在于，当我们需要发布或者回滚版本时，不可避免的会有用户访问到缓存静态文件。
版本发布、回滚速度慢：传统方案，每次需要发布、回滚都需要重新打包发布代码。（作者:零零|水，wechat:qq20004604）这个流程一方面比较慢，另一方面，不一定能准确打包到具体的某一次提交（不准确）。

因此，根据实际情况，使用自研的前端 pipline 管理。核心有以下几点：

代码版本管理：对于需要提交到线上服务器的代码，在 gitlab 对其添加 tag，只有添加正确 tag 的代码才会被打包发布到线上。该操作关键在于 css、js 等静态资源文件，以版本号作为文件夹目录，同时多版本并存线上。html 不做 cache，作为入口，引入不同版本。示例目录如下：

在 nginx 层，html 做无缓存处理，每次加载都加载最新的。其他静态资源做 cache，过期时间 15 天，发布流程见上图。切换版本时，具体如下：

2.多版本共存：由于静态文件本身资源大小比较小（由于做了公共静态文件抽离，所以其实更小），（作者:零|零水）目前财富二期打包后只有 16 MB，未来二次优化后，将降低到 10 MB 左右。所以即使多版本同时放到服务器上，其占用也不多。

管控方法是作为入口的 html 文件是唯一的，通过修改 html 里，指向的静态资源文件的版本号，来指定用户当前访问的版本号。用户访问流程图如下：

可以从上图中看出，用户只会在第一次访问的时候，加载静态资源。其余时间访问的都是本地 cache，可以极大的提高用户访问速度和用户体验，降低服务器网络 IO 压力。

而html 不做缓存处理，又可以避免在新版本发布后，用户访问到的是旧版本页面，而导致业务处理出现异常。

同时，因为每个版本号都是和commit 强耦合的，所以无论哪个环境下，同一个版本号的代码，都必然是幂等相同的，不需要担心不同环境下代码表现不同的问题。

2.3 私有npm源

由于我们通常访问的是内网，因此，需要考虑以后内外网隔离的问题。因此，搭建私有 npm 源，提前从基础设计层面解决问题。私有源采用开源技术方案Verdaccio。优势有以下几点：

轻量：verdaccio基于 Node.js 开发，占用资源少，运行速度快，配置简便，适合我们公司实际情况；
配置难度低：可以快速配置用户组、权限、运行端口、存放地址等，足以满足一般场景；
保证依赖版本稳定：相对于将依赖放到第三方远程源，放本地更稳定，一方面可以提高下载速度（因为部分第三方依赖连外网不稳定），另一方面，可以确保依赖始终存在（被缓存到本地私有 npm 源）；

通过以上三点组合，从架构层面上，解决了发布的线上代码不确定性问题，提高了前端代码的可靠性。

另外，我们前端组会将一些自己封装的 npm 包发布到自己的 npm 源，提供给不同工程使用，避免重复开发带来的研发浪费，以及开发人员能力不稳定带来的公共依赖不可靠的问题。

2.4 公共静态资源cache

除了业务代码以外，前端还会有一些公共静态资源，例如 Vue 的 js 文件、ElementUI的资源文件、Echarts 资源文件，以及一些图片文件等。

对于这些文件，是所有工程所共享的，假如这些文件分散在各个工程里，既没必要，也容易导致不同工程依赖文件不统一。另外，也会重复加载这些文件，浪费网络带宽和静态服务器存储空间，没有意义。

因此，设一个公共静态路径，通过在脚手架里进行配置，当需要加载这些资源时，直接去指定 nginx 静态服务器里加载，并做长时间 cache，可以提高访问效率和性能。

未来，将做一个专门的静态资源管理服务，用于将静态资源（主要是图片），传到静态资源服务，并进行 CDN 加速，然后前端工程通过直接引入图片 url 来使用这些资源。这样可以减轻自己的服务器的网络带宽消耗。

2.5 其他

以上都是已实现的，其他还有一些，但过于琐碎——其实主要是我写不动了，就不写了。

3. 工程化设计

3.1 定制 webpack 脚手架

为了低成本高效率的提高代码质量，基于公司实际情况，定制化开发了一个 webpack 脚手架，解决了以下问题：

避免了无限制引入第三方库：无限制引入第三方库，是一种常被忽略，但却很容易带来问题的行为（例如 vue+jquery 等）。因为开发人员通常并不会阅读第三方库的源代码，不能保证其是安全可靠的。而定制脚手架，提供了所有开发中需要的依赖，并严控新依赖的引入，则确保整个工程是安全的。（防盗：wechat:qq20004604）
约束开发人员代码规范：开发最常见问题是代码规范混乱，各写各的，导致维护成本高企。而通过引入 eslint，强行规定代码风格，自动对不符合规范的代码报错，解决了这些问题。并且由于 IDE 支持通过应用 eslint 规则，自动格式化代码。也降低了对开发人员的约束成本，降低推行代码规范的难度。
方便提供给其他开发使用标准的脚手架，并提供技术支持（比如可以统一大前端的技术栈）。

我使用的脚手架，是自己基于 webpack5 配置的 vue 脚手架，包含各种各样的配置。

3.2 集成调试控制台

考虑到项目的页面里，有大量的表单内容。为了方便开发测试联调，避免每次都需要手动输入很多表单，因此集成了专门的调试控制台。通过特殊操作打开调试控制台后，页面上会出现一个小浮窗，浮窗上有一些预置按钮，点击可以执行一些预定行为（比如填写表单）。

如下图，点击 test 按钮，表单将被自动填满：

通过集成调试控制台，有以下好处：

减少重复性操作的低效率行为：自动填写表单是最常见的一种场景，也可以在需要无限下拉加载时，直接加载指定页码或增加每页加载数量，从而快速获取到某页数据，并且无需修改业务代码；
更多的调试信息：相对于用户使用来说，开发时，有时候有必要需要在页面上显示更多信息，但若修改原有业务代码，则是不优雅的。因此通过调试控制台开启关闭是否显示这些额外信息。并且由于其是默认关闭的且本地独立的，因此也可以在线上调试的时候使用；
线上调试：未来添加埋点系统后，当用户遇见异常情况而无法复现时，可以教用户打开调试控制台，然后点击按钮推送用户历史操作。之后可以在服务器端分析用户行为，查看问题出现的原因。

3.3 多页主从设计

针对公司实际业务需要——以工作台为核心平台，其他页面接入，并且后端是微服务设计。故设计思路为多工程多页面主从管理。具体来说，有以下几点：

多工程：考虑到我们未来将以工作台为核心，多系统接入的形式来部署。因此拆分前端工程，以工作台为核心入口，然后 story、开发人员、系统等，拆分为多个中小型前端工程。通过这样的拆分，降低了代码开发、维护难度，也减少不同story 开发之间协作成本；
多页面：对于一个长期维护的项目来说，必须考虑到长期维护难度。因此，结合我之前踩坑、维护历史项目的经验，将前端页面设计为多页面模式。具体来说，各个story根据功能点拆分为不同的页面，页面之间跳转以本地缓存、浏览器参数等进行数据交换。通过这样的隔离，无论后续需求是，加入新页面新功能、重构单个页面，还是在新页面上进行新技术尝试，其成本都非常低；
主从管理：介入的工程。其他页面需要在工作台打开的话，需要预先注册后，通过页面 id 来调用打开。这样可以通过集中控制，禁止第三方网页在工作台打开非法页面，提高系统安全性；

通过这样的设计，将传统大型前端工程，拆分为类似后端微服务的微前端工程，提高开发效率，特别是并行开发效率。也增强了权限管理，确保了代码的安全性。

具体设计结构如下图：

他们之间的交互流程如下图

无论背后如何跳转，但因为是通过 nginx 转发的，所以表面上，用户访问的都是同一个网址，不影响用户认知。

4. 团队管理

4.1 权限控制

这里的权限控制，主要是指代码权限控制，目的是确保代码安全，问题可控可避免可追溯。

具体管理举措有以下几条：

保证依赖版本稳定：代码属于公司财产，因此基于 gitlab，对代码进行权限隔离，默认关闭所有访问权限，针对每个工程，按实际需要给开发赋予指定权限。可以避免因代码泄露的公司财产损失；
提交权限：允许开发在自己分支上提交，但涉及到主分支的合并，必须提交 merge，然后在组长进行 code review 后，才能提交到主分支。通过这样的形式，主分支的代码必然是可控的，不会引入严重问题；
发布权限：对于将要发布到 dev、qa、pro 的代码，收敛权限到组长，只允许组长进行发布。好处在于，一方面可以提供一个可靠可控版本的线上代码，另一方面，降低开发人员技能要求。

4.2 前后端接口对接管控

在去年十月十一月份时，前后端开发联调有一个严重问题，就是后端接口变动时，不会在事前事后通知相应前端开发、测试人员。开发效率非常低，并且会出现各种异常情况。

因此，通过梳理开发流程，强制要求后端提供接口文档前置，并且要求有一个可控稳定的接口文档，作为对接标准。

在十二月以后，因为接口临时变动带来的 bug 和开发、测试阻塞问题，粗略估计减少了 80%。

但实际情况中，还是会有一些接口文档和实际接口不符的情况发生，导致接口测试被迫重做，接下来需要设法减少此类问题。

4.3 人员管理

工作都是人在做，所以相对来说，把好人员关，有时候比做事更重要。因此为了确保人员的可靠性、稳定性，从以下几个角度入手：

实战入职面试题：采用理论题+实际业务题结合的方式，确保入职人员真的懂业务开发，避免人员能力风险。在通过初步面试后，安排做一道代码量少，但有一定难度，考验解决问题能力，同时考察态度的笔试题，如果愿意做且能做出来的，根据目前经验来看，基本都比较可靠；
导师帮带：在新人进来后，安排一个人带着他，答复常见问题，带着做一个story。与由组长直接管理培训相比，更有利于新成员融入团队中；（防盗：作者:零零水，wechat:qq20004604）
新人适应：新人常见问题是不明确自己的定位。因此，组长负责安排新成员的发展方向，并在新人入职的第一周，先安排其开发日报系统，了解脚手架，再安排其做基于现有页面的优化，帮助其了解不同人负责的 story；
责任明确：明确团队里每个人的定位，并使其知晓。根据团队成员能力不同，态度不同，安排适合其的任务。举例来说，成亚旭多负责简单页面，以及自测串 story 等工作，马倩负责业务核心 story，王超负责需要一定技术创新的内容；

5. 未来计划

其实还做了一些其他的，但由于篇幅所限，就暂时不写了。（主要是写不动了，这些已经写了一周了啊~~）

1、静态图片资源服务器：

目前是把图片打包到工程里，但这种缺点是工程太重，其次是 nginx 服务器压力大。所以未来需要考虑做一个专门的静态资源服务器，上传后，自动传到 cdn，并返回 cdn 上图片链接。然后在页面里直接引入图片链接即可；

2、backend 层渲染 html：

这个是我未来核心工作重点。相对于目前的nginx 渲染 html，更好的选择是 backend 渲染 html。好处有以下几点：

降低 nginx 服务器压力；
版本发布，从需要手动执行脚本替换html，变为只需要更改配置就能变更前端代码版本；
可以以中间件形式，嵌入一些公共 js、css，比如埋点 js 等；
可以解决 csrf 问题；
强约束网页入口；

缺点是，需要 backend 层开发配合，可能需要改造代码。

gitlab 集成 eslint：

相对于要求开发自己检测代码质量，即使继承了 eslint，效果也不是最好的。因此，最好的办法是将 eslint 集成到 CI/CD 中。在开发提交代码到 gitlab 时，自动执行 eslint 审查代码，如果审查失败，则自动打回；

埋点系统：

我们常见问题是无法得知用户操作习惯，以及对报错情况无法捕获。因此，埋点系统是十分有必要的。嵌入埋点系统后，可以从数据层面统计系统的各方面信息，包括访问速度、访问时间段、访问人数、不同岗位人数访问的网页分布情况、

CSRF：

金融系统的安全性是非常重要的，除了常规的防止 xss 注入之外，也需要防止 CSRF（跨站请求伪造）攻击。解决方法就是上 csrf-token 来避免。

终：

总的来说，前端相关的技术建设，已经做了一些，但未来还有更多需要去建设，特别是使其自动化、GUI 化、便利化、集中化。

例如自建 OA 系统，接入钉钉考勤，接入 gitlab，进行全流程自动化（一键发布、推送到服务器、检查可靠性、通知到相关负责人），线上出问题自动报警通知相关负责人。

而且我们最近 2 个月上了 k8s（本文是在开始之前写的，所以其实也只是截止于 k8s 之前的情况），更多东西，将在下面博客继续说吧（估计起码得鸽子半年）。

未来需要做的工作还很多，前端架构师的施展领域，其实也有很多。