渲染时间点

还记得事件循环中,我们提到了渲染进程,并着重分析了渲染主线程、队列和其他线程的合作过程,要了解渲染时间点还需要网络进程以及它开启的网络线程。如下图:

浏览器渲染原理-渲染时间点

上图即是:当浏览器的网络线程收到 HTML 文档后,产生一个渲染任务,并将其传递给渲染主线程的消息队列。在事件循环机制的作用下,渲染主线程取出消息队列中的渲染任务,开启渲染流程。

渲染流程

整个渲染流程分为多个阶段,分别是:HTML 解析、样式计算、布局、分层、绘制、分块、光栅化、画。
每个阶段都有明确的输入输出,上一个阶段的输出会成为下一个阶段的输入。
这样,整个渲染流程就形成了一套组织严密的生产流水线。如下图:

浏览器渲染原理-渲染流程

解析 HTML(Parse HTML)

渲染的第一步是解析 HTML。

解析过程中遇到 CSS 解析 CSS,遇到 JS 执行 JS。为了提高解析效率,浏览器在开始解析前,会启动一个预解析的线程,率先下载 HTML 中的外部 CSS 文件和外部的 JS 文件。
如果主线程解析到 <link> 位置,此时外部的 CSS 文件还没有下载解析好,主线程不会等待,继续解析后续的 HTML。这是因为下载和解析 CSS 的工作是在预解析线程中进行的。这就是 CSS 不会阻塞 HTML 解析的根本原因。如下图所示:

浏览器渲染原理-解析HTML-CSS

如果主线程解析到 <script> 位置,会停止解析 HTML,转而等待 JS 文件下载好,并将全局代码解析执行完成后,才能继续解析 HTML。这是因为 JS 代码的执行过程可能会修改当前的 DOM 树,所以 DOM 树的生成必须暂停。这就是 JS 会阻塞 HTML 解析的根本原因。如下图所示:

浏览器渲染原理-解析HTML-JS

第一步完成后,会得到 DOM 树和 CSSOM(CSS Object Model)树,浏览器的默认样式、内部样式、外部样式、行内样式均会包含在 CSSOM 树中。

样式计算(Recalculate Style)

解析 HTML 的下一步是样式计算。
主线程会遍历得到的 DOM 树,依次为树中的每个节点计算出它最终的样式,称之为 Computed Style
在这一过程中,很多预设值会变成绝对值,比如 red 会变成 rgb(255,0,0),相对单位会变成绝对单位,比如 em 会变成 px
这一步完成后,会得到一棵带有样式的 DOM 树。

布局(Layout)

接下来是布局,布局完成后会得到布局树。
布局阶段会依次遍历 DOM 树的每一个节点,计算每个节点的几何信息。例如节点的宽高、相对包含块的位置。

大部分时候,DOM 树和布局树并非一一对应。
比如 display:none 的节点没有几何信息,因此不会生成到布局树;又比如使用了伪元素选择器,虽然 DOM 树中不存在这些伪元素节点,但它们拥有几何信息,所以会生成到布局树中。还有匿名行盒、匿名块盒等等都会导致 DOM 树和布局树无法一一对应。

分层(Layer)

这一步的分层结果可以借助浏览器开发者工具(F12)的图层(Layers)工具可视化地看见。每个浏览器甚至浏览器它自己的每个版本,对分层的实现方式都可能不太一样。

分层结果可以被堆叠上下文有关的属性(z-indexopacitytransform……)影响,但只是影响决策,不一定影响到最终结果。其中对结果影响比较大的属性是 will-change,比如单独给一个类名为 containerdiv 进行分层可以写成:

1
2
3
.container {
  will-change: transform;
}

总的来说,主线程会使用一套复杂的策略对整个布局树中进行分层。
分层的好处在于,将来某一个层改变后,仅会对该层进行后续处理,从而提升效率。

滚动条、堆叠上下文、transformopacity 等样式都会或多或少的影响分层结果,也可以通过 wilL-change 属性更大程度的影响分层结果。

注意,仅当效率出了问题,发现是分层的影响,某一区域经常变动,不希望重绘太多次,就可以尝试使用 wilL-change

绘制(Paint)

这里的绘制指的不是绘制这个动作,而是为每一个分层单独产生绘制指令集,用来描述这一层该如何绘制。

完成绘制之后,渲染主线程将每个图层的绘制信息交给合成线程,渲染主线程的工作到此为止,剩余将由合成线程完成。

分块(Tiling)

合成线程首先对每个图层进行分块工作,将其划分为更多的小区域,这一工作将会启动多个线程来完成。

光栅化(Raster)

分块完成之后,就进入光栅化阶段。

合成线程会将块信息提交给 GPU 进程,GPU 进程会开启多个线程,以极高的速度完成光栅化,并且优先处理靠近视口区域的块。

光栅化的结果,就是一块一块的位图。

画(Draw)

合成线程拿到每个层、每个块的位图之后,生成一个个 "指引(quad)" 信息。

指引会标识出每个位图应该画到屏幕的哪个位置,以及考虑旋转、缩放等变形。

变形发生在合成线程,与渲染主线程无关,这就是 transform 效率高的本质原因。

由于渲染进程运行在沙盒中,与系统隔离,所以合成线程会把指引 quad 提交给 GPU 进程,由 GPU 进程产生系统调用,提交给 GPU 硬件,完成最终的屏幕成像。

什么是 reflow

reflow 的本质就是重新计算 layout 树。

当进行了会影响布局树的操作后,需要重新计算布局树,会引发 layout

为了避免连续的多次操作导致布局树反复计算,浏览器会合并这些操作,当 JS 代码全部完成后再进行统一计算。所以,改动属性造成的 reflow异步完成的。
也因为如此,当 JS 获取布局属性时,这一获取操作是同步的,就可能造成无法获取到最新的布局信息。

浏览器在反复权衡下,最终决定获取属性时,立即 reflow。

什么是 repaint

repaint 的本质就是重新根据分层信息计算了绘制指令。

当改动了可见样式后,就需要重新计算,会引发 repaint

由于元素的布局信息也属于可见样式,所以 reflow 一定会引起 repaint

为什么 transform 效率高

变形发生在合成线程,与渲染主线程无关,这就是 transform 效率高的本质原因。

可以通过下面的代码感受差别:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>浏览器渲染原理</title>
    <style>
        .ball {
            width: 100px;
            height: 100px;
            background-color: red;
            border-radius: 50%;
        }
        #ball1 {
            background-color: blue;
            animation: move1 1s alternate infinite ease-in-out;
        }
        #ball2 {
            position: fixed;
            left: 0;
            animation: move2 1s alternate infinite ease-in-out;
        }
        @keyframes move1 {
            to {
                transform: translate(200px);
            }
        }
        @keyframes move2 {
            to {
                left: 200px;
            }
        }
    </style>
</head>
<body>
<button id="btn">点我死循环3s</button>
<div id="ball1" class="ball"></div>
<div id="ball2" class="ball"></div>

<script>
  const btn = document.querySelector('#btn');
  const delay = (ms) => {
    let start = Date.now();
    while (Date.now() - start < ms) {
    }
  };
  // 点击触发死循环,阻塞渲染
  btn.onclick = () => {
    delay(3000); // 阻塞 3 秒
  };
</script>
</body>
</html>

ball1 使用 transform,而 ball2 通过更改 left 布局信息做动画。

值得一提的是,滚动条的滚动也是只发生在 draw 阶段的,所以当页面阻塞时,页面还是可以正常滚动。