Node.js child_process

芝麻凛 2021年10月31日 618次浏览

Node.js child_process

进程 Process

场景

  • notepad.exe 是一个程序,不是进程
  • 双击notepad.exe时,操作系统会开启一个进程

定义

  • 进程是程序的执行实例
  • 程序在CPU上执行时的活动叫做进程
  • 实际上并没有明确的定义,只有一些规则

特点

  • 一个进程可以创建另一个进程(父进程与子进程)
  • 通过任务管理器可以看到进程

了解CPU

特点

  • 一个单核CPU,在一个时刻,只能做一件事情
  • 那么如何让用户同时看电影、听声音、写代码呢?
  • 答案是在不同进程中快速切换

多程序并发执行

  • 指多个程序在宏观上并行,微观上串行
  • 每个进程会出现 执行-暂停-执行 的规律
  • 多个进程之间会出现抢资源(入打印机)的现象

进程的两个状态

image20211031205544157.png
image20211031205620054.png

阻塞

等待执行的进程

  • 都是非运行态
  • 一些(A)在等待CPU资源
  • 另一些(B)在等待I/O完成(如文件读取)
  • 如果这个时候把CPU分配给B进程,B还是在等待I/O
  • 我们把这个B叫做阻塞进程,因此,分配程序只会把CPU分配给非阻塞进程

线程 Thread 的引入

分阶段

  • 在面向进程设计的系统中进程是程序的基本执行实体
  • 在面向线程设计的系统中,进程本身不是基本运行单位,而是线程的容器

引入原因

  • 进程是执行的基本实体,也是资源分配的基本实体
  • 导致进程的创建、切换、销毁都太耗费CPU的时间了
  • 于是引入线程,线程作为执行的基本实体
  • 而进程只作为资源分配的基本实体

线程 Thread

概念

  • CPU调度和执行的最小单元
  • 一个进程中至少有一个线程,可以有多个线程
  • 一个进程中的线程共享改进程的所有资源
  • 进程的第一个线程叫做初始化线程
  • 线程的调度可以由操作系统负责,也可以用户自己负责

例子

  • 浏览器进程里面有渲染引擎、V8引擎、存储模块、网络模块、用户界面模块等
  • 每个模块都可以放在一个线程里

分析

  • 子进程 V.S. 线程

child_process

Node.js 进程控制,child_process用于新建子进程

使用目的

  • 子进程的运行结果储存在系统缓存中(最大200Kb)
  • 等到子进程运行结束之后,主进程再用回调函数读取子进程的运行结果

API

exec(cmd,options,fn)

  • execute的缩写,用于执行bash命令
  • 同步版本:execSync

  • 返回一个流
const exec = require('child_process').exec;
const child = exec('ls -l')

child.stdout.on('data',function(data){
	console.log('stdout: ' + data)
});

child.stderr.on('data',function(data){
	console.log('stdout: ' + data);
});
child.on('close',function(code){
	console.log('closing code: ' + code)
})

Promise

  • 可以使其Promise化(用 util.promisify)
const util = require("util")
const child_process = require('child_process')
const { exec } = child_process

const exec2 = util.promisify(exec)

exec2("ls ../").then(data => {
    console.log(data.stdout);
})

有漏洞

  • 如果cmd 被注入了,可能执行意外的代码
  • 推荐使用 execFile
const util = require("util")
const child_process = require('child_process')
const { exec } = child_process

const exec2 = util.promisify(exec)
const userInput = '. && rm -rf /'

exec2(`ls ${userInput}`).then(data => {
    console.log(data.stdout);
});

execFile

  • 只执行特定的程序
  • 命令行的参数要用数组形式传入,无法注入
  • 同步版本:execFileSync
const child_process = require('child_process')
const { execFile } = child_process

const userInput = '.'

execFile('ls', ['-la', userInput], (error, stdout) => {
    console.log(error);
    console.log(stdout);
})

支持流

const child_process = require('child_process')
const { execFile } = child_process

const userInput = '.'

const stream = execFile('ls', ['-la', userInput]);

stream.stdout.on('data', (chunk) => {
    console.log(chunk);
})

options常用选项

  • cwd - Current working directory
  • env - 环境变量
  • shell - 用什么 shell
  • maxBuffer - 最大缓存,默认1024 * 1024 字节

spawn

  • 用法和execFile方法类似
  • 没有回调函数,只能通过流事件获取结果
  • 没有最大200Kb的限制(因为是流)

经验

  • 能用spawn的时候不要用execFile

fork

  • 创建一个子进程,执行Node脚本
  • fork('./child.js') 相当于 spawn('node',['./child.js'])

特点

  • 会多出一个message时间,用于父子通信
  • 会出多一个send方法
// n.js
const child_process = require('child_process')
const n = child_process.fork('./child.js')
n.on('message', function (m) {
    console.log('PARENT got message: ', m);
});
n.send({ hello: 'woeld' });
// child.js
setTimeout(() => {
    process.send({ foo: "bar" });
}, 2000)

process.on('message', (data) => {
    console.log('子进程得到值');
    console.log(data);
})

worker_threads API

API 列表

  • isMainThread
  • new Worker(filename)
  • parentPort
  • postMessage

事件列表

  • message
  • exit

关于 Node.js 的 child_process 模块

  1. exec 可以创建一个进程并获取结果,但是存在注入风险
  2. execFile 可以创建一个进程并获取结果,但如果使用回调形式,结果最大不能超过 200kb
  3. spawn 可以创建一个进程并获取结果,只支持流的形式获取结果
  4. fork 可以创建一个 Node.js 进程并获取结果