「硬核JS」一次搞懂 JS 运行机制
原标题:「硬核JS」一次搞懂 JS 运行机制
前言
本文大致分为以下这样的步骤来帮助我们由广入深更加清晰的了解JS运行机制
-
首先我们要了解进程和线程的概念
-
其次我们要知道浏览器的进程线程常识
-
再然后通过Event Loop、宏任务(macrotask)微任务(microtask)来看浏览器的几个线程间是怎样配合的
-
再然后通过例子来印证我们的猜想
-
最后提下NodeJS的运行机制
灵魂一问
JS运行机制在平常前端面试时不管是笔试题还是面试题命中率都极高
说到JS运行机制,你知道多少
看到这大家可能回说:JS运行机制嘛,很简单,事件循环、宏微任务那点东西
是的,作为一名前端我们都了解,但是如果这真的面试问到了这个地方,你真的可以答好吗(灵魂一问?️)
不管你对JS了解多少,到这里大家不防先停止一下阅读,假设你目前在面试,面试官让你阐述下JS运行机制,思考下你的答案,用20秒的时间(面试时20s已经很长了),然后带着答案再接着往下看,有人曾经说过: 没有思考的阅读纯粹是消磨时间罢了 ,这话很好(因为是我说的,皮一下?)
也有很多刚开始接触JS的同学会被 任务队列 执行栈 微任务 宏任务 这些高大上点的名次搞的很懵
接下来,我们来细致的梳理一遍你就可以清晰的了解它们了
进程与线程什么是进程
我们都知道, CPU 是计算机的核心,承担所有的计算任务
官网说法, 进程 是 CPU 资源分配的最小单位
字面意思就是进行中的程序,我将它理解为一个可以独立运行且拥有自己的资源空间的任务程序
进程 包括运行中的程序和程序所使用到的内存和系统资源
CPU 可以有很多进程,我们的电脑每打开一个软件就会产生一个或多个 进程 ,为什么电脑运行的软件多就会卡,是因为 CPU 给每个 进程 分配资源空间,但是一个 CPU 一共就那么多资源,分出去越多,越卡,每个 进程 之间是相互独立的, CPU 在运行一个 进程 时,其他的进程处于非运行状态, CPU 使用 [时间片轮转调度算法](https://link.juejin.cn?target=undefined) 来实现同时运行多个 进程
什么是线程
线程 是 CPU 调度的最小单位
线程 是建立在 进程 的基础上的一次程序运行单位,通俗点解释 线程 就是程序中的一个执行流,一个 进程 可以有多个 线程
一个 进程 中只有一个执行流称作 单线程 ,即程序执行时,所走的程序路径按照连续顺序排下来,前面的必须处理好,后面的才会执行
一个 进程 中有多个执行流称作 多线程 ,即在一个程序中可以同时运行多个不同的 线程 来执行不同的任务, 也就是说允许单个程序创建多个并行执行的 线程 来完成各自的任务
进程和线程的区别
进程是操作系统分配资源的最小单位,线程是程序执行的最小单位
一个进程由一个或多个线程组成,线程可以理解为是一个进程中代码的不同执行路线
进程之间相互独立,但同一进程下的各个线程间共享程序的内存空间(包括代码段、数据集、堆等)及一些进程级的资源(如打开文件和信号)
调度和切换:线程上下文切换比进程上下文切换要快得多
多进程和多线程
多进程:多进程指的是在同一个时间里,同一个计算机系统中如果允许两个或两个以上的进程处于运行状态。多进程带来的好处是明显的,比如大家可以在网易云听歌的同时打开编辑器敲代码,编辑器和网易云的进程之间不会相互干扰
多线程:多线程是指程序中包含多个执行流,即在一个程序中可以同时运行多个不同的线程来执行不同的任务,也就是说允许单个程序创建多个并行执行的线程来完成各自的任务
JS为什么是单线程
JS的单线程,与它的用途有关。作为浏览器脚本语言,Java的主要用途是与用户互动,以及操作DOM。这决定了它只能是单线程,否则会带来很复杂的同步问题。比如,假定Java同时有两个线程,一个线程在某个DOM节点上添加内容,另一个线程删除了这个节点,这时浏览器应该以哪个线程为准?
还有人说js还有Worker线程,对的,为了利用多核CPU的计算能力,HTML5提出Web Worker标准,允许Java脚本创建多个线程,但是子线程是完 全受主线程控制的,而且不得操作DOM
所以,这个标准并没有改变Java是单线程的本质
了解了进程和线程之后,接下来看看浏览器解析,浏览器之间也是有些许差距的,不过大致是差不多的,下文我们皆用市场占有比例最大的Chrome为例
浏览器浏览器是多进程的
作为前端,免不了和浏览器打交道,浏览器是多进程的,拿Chrome来说,我们每打开一个Tab页就会产生一个进程,我们使用Chrome打开很多标签页不关,电脑会越来越卡,不说其他,首先就很耗CPU
浏览器包含哪些进程
-
Browser进程
-
浏览器的主进程(负责协调、主控),该进程只有一个
-
负责浏览器界面显示,与用户交互。如前进,后退等
-
负责各个页面的管理,创建和销毁其他进程
-
将渲染(Renderer)进程得到的内存中的Bitmap(位图),绘制到用户界面上
-
网络资源的管理,下载等
-
第三方插件进程
-
每种类型的插件对应一个进程,当使用该插件时才创建
-
GPU进程
-
该进程也只有一个,用于3D绘制等等
-
渲染进程(重)
-
即通常所说的浏览器内核(Renderer进程,内部是多线程)
-
每个Tab页面都有一个渲染进程,互不影响
-
主要作用为页面渲染,脚本执行,事件处理等
为什么浏览器要多进程
我们假设浏览器是单进程,那么某个Tab页崩溃了,就影响了整个浏览器,体验有多差
同理如果插件崩溃了也会影响整个浏览器
当然多进程还有其它的诸多优势,不过多阐述
浏览器进程有很多,每个进程又有很多线程,都会占用内存
这也意味着内存等资源消耗会很大,有点拿空间换时间的意思
到此可不只是为了让我们理解为何Chrome运行时间长了电脑会卡,哈哈,第一个重点来了
简述渲染进程Renderer(重)
页面的渲染,JS的执行,事件的循环,都在渲染进程内执行,所以我们要重点了解渲染进程
渲染进程是多线程的,我们来看渲染进程的一些常用较为主要的线程
渲染进程Renderer的主要线程GUI渲染线程
-
负责渲染浏览器界面,解析HTML,CSS,构建DOM树和RenderObject树,布局和绘制等
-
解析html代码(HTML代码本质是字符串)转化为浏览器认识的节点,生成DOM树,也就是DOM Tree
-
解析css,生成CSSOM(CSS规则树)
-
把DOM Tree 和CSSOM结合,生成Rendering Tree(渲染树)
-
当我们修改了一些元素的颜色或者背景色,页面就会重绘(Repaint)
-
当我们修改元素的尺寸,页面就会回流(Reflow)
-
当页面需要Repaing和Reflow时GUI线程执行,绘制页面
-
回流(Reflow)比重绘(Repaint)的成本要高,我们要尽量避免Reflow和Repaint
-
GUI渲染线程与JS引擎线程是互斥的
-
当JS引擎执行时GUI线程会被挂起(相当于被冻结了)
-
GUI更新会被保存在一个队列中等到JS引擎空闲时立即被执行
JS引擎线程
-
JS引擎线程就是JS内核,负责处理Java脚本程序(例如V8引擎)
-
JS引擎线程负责解析Java脚本,运行代码
-
JS引擎一直等待着任务队列中任务的到来,然后加以处理
-
浏览器同时只能有一个JS引擎线程在运行JS程序,所以js是单线程运行的
-
一个Tab页(renderer进程)中无论什么时候都只有一个JS线程在运行JS程序
-
GUI渲染线程与JS引擎线程是互斥的,js引擎线程会阻塞GUI渲染线程
-
就是我们常遇到的JS执行时间过长,造成页面的渲染不连贯,导致页面渲染加载阻塞(就是加载慢)
-
例如浏览器渲染的时候遇到 <> 标签,就会停止GUI的渲染,然后js引擎线程开始工作,执行里面的js代码,等js执行完毕,js引擎线程停止工作,GUI继续渲染下面的内容。所以如果js执行时间太长就会造成页面卡顿的情况
事件触发线程
-
属于浏览器而不是JS引擎,用来控制事件循环,并且管理着一个事件队列(task queue)
-
当js执行碰到事件绑定和一些异步操作(如setTimeOut,也可来自浏览器内核的其他线程,如鼠标点击、AJAX异步请求等),会走事件触发线程将对应的事件添加到对应的线程中(比如定时器操作,便把定时器事件添加到定时器线程),等异步事件有了结果,便把他们的回调操作添加到事件队列,等待js引擎线程空闲时来处理。
-
当对应的事件符合触发条件被触发时,该线程会把事件添加到待处理队列的队尾,等待JS引擎的处理
-
因为JS是单线程,所以这些待处理队列中的事件都得排队等待JS引擎处理
定时触发器线程
-
setInterval 与 setTimeout 所在线程
-
浏览器定时计数器并不是由Java引擎计数的(因为Java引擎是单线程的,如果处于阻塞线程状态就会影响记计时的准确)
-
通过单独线程来计时并触发定时(计时完毕后,添加到事件触发线程的事件队列中,等待JS引擎空闲后执行),这个线程就是定时触发器线程,也叫定时器线程
-
W3C在HTML标准中规定,规定要求 setTimeout 中低于4ms的时间间隔算为4ms
异步http请求线程
-
在在连接后是通过浏览器新开一个线程请求
-
将检测到状态变更时,如果设置有回调函数,异步线程就产生状态变更事件,将这个回调再放入事件队列中再由Java引擎执行
-
简单说就是当执行到一个http异步请求时,就把异步请求事件添加到异步请求线程,等收到响应(准确来说应该是http状态变化),再把回调函数添加到事件队列,等待js引擎线程来执行
了解了上面这些基础后,接下来我们开始进入今天的正题
事件循环(Event Loop)初探
首先要知道,JS分为同步任务和异步任务
同步任务都在主线程(这里的主线程就是JS引擎线程)上执行,会形成一个 执行栈
主线程之外,事件触发线程管理着一个 任务队列 ,只要异步任务有了运行结果,就在 任务队列 之中放一个事件回调
一旦 执行栈 中的所有同步任务执行完毕(也就是JS引擎线程空闲了),系统就会读取 任务队列 ,将可运行的异步任务(任务队列中的事件回调,只要任务队列中有事件回调,就说明可以执行)添加到执行栈中,开始执行
我们来看一段简单的代码
letsetTimeoutCallBack =function{
console.log(“我是定时器回调”);
};
lethttpCallback =function{
console.log(“我是http请求回调”);
}
// 同步任务
console.log(“我是同步任务1”);
// 异步定时任务
setTimeout(setTimeoutCallBack,1000);
// 异步http请求任务
ajax.get(“/info”,httpCallback);
// 同步任务
console.log(“我是同步任务2”);
上述代码执行过程
JS是按照顺序从上往下依次执行的,可以先理解为这段代码时的执行环境就是主线程,也就是也就是当前执行栈
首先,执行 console.log(“我是同步任务1”)
接着,执行到 setTimeout 时,会移交给 定时器线程 ,通知 定时器线程 1s 后将 setTimeoutCallBack 这个回调交给 事件触发线程 处理,在 1s 后 事件触发线程 会收到 setTimeoutCallBack 这个回调并把它加入到 事件触发线程 所管理的事件队列中等待执行
接着,执行http请求,会移交给 异步http请求线程 发送网络请求,请求成功后将 httpCallback 这个回调交由事件触发线程处理, 事件触发线程 收到 httpCallback 这个回调后把它加入到 事件触发线程 所管理的事件队列中等待执行
再接着执行 console.log(“我是同步任务2”)
至此主线程执行栈中执行完毕, JS引擎线程 已经空闲,开始向 事件触发线程 发起询问,询问 事件触发线程 的事件队列中是否有需要执行的回调函数,如果有将事件队列中的回调事件加入执行栈中,开始执行回调,如果事件队列中没有回调, JS引擎线程 会一直发起询问,直到有为止
到了这里我们发现,浏览器上的所有线程的工作都很单一且独立,非常符合单一原则
定时触发线程只管理定时器且只关注定时不关心结果,定时结束就把回调扔给事件触发线程
异步http请求线程只管理http请求同样不关心结果,请求结束把回调扔给事件触发线程
事件触发线程只关心异步回调入事件队列
而我们JS引擎线程只会执行执行栈中的事件,执行栈中的代码执行完毕,就会读取事件队列中的事件并添加到执行栈中继续执行,这样反反复复就是我们所谓的事件循环(Event Loop)
图解
首先,执行栈开始顺序执行
判断是否为同步,异步则进入异步线程,最终事件回调给事件触发线程的任务队列等待执行,同步继续执行
执行栈空,询问任务队列中是否有事件回调
任务队列中有事件回调则把回调加入执行栈末尾继续从第一步开始执行
任务队列中没有事件回调则不停发起询问
宏任务(macrotask)