第4章 模块系统

学习目标

  • 理解模块化编程方式
  • 掌握模块通信规则
  • 知道模块的三种分类
  • 了解模块加载过程

什么是模块化

当你的网站开发越来越复杂代码越来越多的时候会经常遇到什么问题?

  • 恼人的命名冲突
  • 繁琐的文件依赖

历史上,JavaScript一直没有模块(module)体系, 无法将一个大程序拆分成互相依赖的小文件,再用简单的方法拼装起来。 其他语言都有这项功能,比如Ruby的 require、Python的 import , 甚至就连CSS都有 @import ,但是JavaScript任何这方面的支持都没有,这对开发大型的、复杂的项目形成了巨大障碍。

模块化

现实角度(手机、电脑、活动板房):

  • 生产效率高
    • 可维护性好

程序角度(就是把大一个文件中很多的代码拆分到不同的小文件中,每个小文件就称之为一个模块,例如我们看到的 jQuery 真正的源码)

  • 开发效率高(不需要在一个文件中翻来翻去,例如 jQuery 不可能在一个文件写 1w+ 代码,按照功能划分到不同文件中)
  • 可维护性好(哪个功能出问题,直接定位该功能模块即可)

模块化的概念有了,那程序中的模块到底该具有哪些特性就满足我们的使用了呢?

  • 模块作用域
    • 好处就是模块不需要考虑全局命名空间冲突的问题
  • 模块通信规则
    • 所有模块如果都是封闭自然不行,我们需要让组件与组件相互组织联系起来,例如 CPU 需要读取内存中的数据来进行计算,然后把计算结果又交给了我们的操作系统
    • 所以我们的模块也是需要具有通信的能力的
    • 所谓的通信说白了也就是输入与输出

下面我们具体来看一下在 Node.js 中如何在多模块之间进行输入与输出。

模块通信规则

require 模块导入

  1. // 核心模块
  2. var fs = require('fs')
  3. // 第三方模块
  4. // npm install marked
  5. var marked = require('marked')
  6. // 用户模块(自己写的),正确的,正确的方式
  7. // 注意:加载自己写的模块,相对路径不能省略 ./
  8. var foo = require('./foo.js')
  9. // 用户模块(自己写的),正确的(推荐),可以省略后缀名 .js
  10. var foo = require('./foo')

exports 模块导出

导出多个成员:写法一(麻烦,不推荐):

  1. // 导出多个成员:写法一
  2. module.exports.a = 123
  3. module.exports.b = 456
  4. module.exports.c = 789

导出多个成员:写法二(推荐)

Node 为了降低开发人员的痛苦,所以为 module.exports 提供了一个别名 exports (下面协大等价于上面的写法)。

  1. console.log(exports === module.exports) // => true
  2. exports.a = 123
  3. exports.b = 456
  4. exports.c = 789
  5. exports.fn = function () {
  6. }

导出多个成员:写法三(代码少可以,但是代码一多就不推荐了):

  1. // module.exports = {
  2. // d: 'hello',
  3. // e: 'world',
  4. // fn: function () {
  5. // //
  6. // //
  7. // //
  8. // //
  9. // //
  10. // //
  11. // //
  12. // //
  13. // //
  14. // //
  15. // //
  16. // //
  17. // //
  18. // //
  19. // //
  20. // //
  21. // //
  22. // //
  23. // //
  24. // //
  25. // //
  26. // //
  27. // //
  28. // //
  29. // //
  30. // //
  31. // //
  32. // //
  33. // // fs.readFile(function () {
  34. // // })
  35. // }
  36. // }

导出单个成员:(唯一的写法):

  1. // 导出单个成员:错误的写法
  2. // 因为每个模块最终导出是 module.exports 而不是 exports 这个别名
  3. // exports = function (x, y) {
  4. // return x + y
  5. // }
  6. // 导出单个成员:必须这么写
  7. module.exports = function (x, y) {
  8. return x + y
  9. }

注意:导出单个只能导出一次,下面的情况后者会覆盖前者:

  1. module.exports = 'hello'
  2. // 以这个为准,后者会覆盖前者
  3. module.exports = function (x, y) {
  4. return x + y
  5. }

为什么 exports = xxx 不行

画图

exports 和 module.exports 的一个引用:

  1. function fn() {
  2. // 每个模块内部有一个 module 对象
  3. // module 对象中有一个成员 exports 也是一个对象
  4. var module = {
  5. exports: {}
  6. }
  7. // 模块中同时还有一个成员 exports 等价于 module.exports
  8. var exports = module.exports
  9. console.log(exports === module.exports) // => true
  10. // 这样是可以的,因为 exports === module.exports
  11. // module.exports.a = 123
  12. // exports.b = 456
  13. // 这里重新赋值不管用,因为模块最后 return 的是 module.exports
  14. // exports = function () {
  15. // }
  16. // 这才是正确的方式
  17. module.exports = function () {
  18. console.log(123)
  19. }
  20. // 最后导出的是 module.exports
  21. return module.exports
  22. }
  23. var ret = fn()
  24. console.log(ret)

exports 和 module.exports 的区别

  • exports 和 module.exports 的区别
    • 每个模块中都有一个 module 对象
    • module 对象中有一个 exports 对象
    • 我们可以把需要导出的成员都挂载到 module.exports 接口对象中
    • 也就是:moudle.exports.xxx = xxx 的方式
    • 但是每次都 moudle.exports.xxx = xxx 很麻烦,点儿的太多了
    • 所以 Node 为了你方便,同时在每一个模块中都提供了一个成员叫:exports
    • exports === module.exports 结果为 true
    • 所以对于:moudle.exports.xxx = xxx 的方式 完全可以:expots.xxx = xxx
    • 当一个模块需要导出单个成员的时候,这个时候必须使用:module.exports = xxx 的方式
    • 不要使用 exports = xxx 不管用
    • 因为每个模块最终向外 return 的是 module.exports
    • exports 只是 module.exports 的一个引用
    • 所以即便你为 exports = xx 重新赋值,也不会影响 module.exports
    • 但是有一种赋值方式比较特殊:exports = module.exports 这个用来重新建立引用关系的
    • 之所以让大家明白这个道理,是希望可以更灵活的去用它

特殊的导出方式

  1. exports = module.exports = function () {
  2. console.log('默认函数被调用了')
  3. }
  4. exports.ajax = function () {
  5. console.log('ajax 方法被调用了')
  6. }
  7. exports.get = function () {
  8. console.log('get 方法被调用了')
  9. }

模块分类

在开始了解具体的规则之前,我们先来了解一下在 Node 中对不模块的一个具体分类,一共就三种类别:

  • 核心模块
    • 由 Node 本身提供,具名的,例如 fs 文件操作模块、http 网络操作模块
  • 第三方模块
    • 由第三方提供,使用的时候我们需要通过 npm 进行下载然后才可以加载使用,例如我们使用过的 mimeart-templatemarked
    • 注意:不可能有第三方包的名字和核心模块的名字是一样的,否则会造成冲突
  • 用户模块(自己写的)
    • 我们在文件中写的代码很多的情况下不好编写和维护,所以我们可以考虑把文件中的代码拆分到多个文件中,那这些我们自己创建的文件就是用户模块

核心模块

参考文档:https://nodejs.org/dist/latest-v9.x/docs/api/

  • 核心模块就是 node 内置的模块,需要通过唯一的标识名称来进行获取。
  • 每一个核心模块基本上都是暴露了一个对象,里面包含一些方法供我们使用
  • 一般在加载核心模块的时候,变量的起名最好就和核心模块的标识名同名即可
    • 例如:const fs = require('fs')
  • 核心模块本质上也是文件模块
    • 核心模块已经被编译到了 node 的可执行程序,一般看不到
    • 可以通过查看 node 的源码看到核心模块文件
    • 核心模块也是基于 CommonJS 模块规范

Node 中都以具名的方式提供了不同功能的模块,例如操作文件就是:fs

核心模块(系统模块)由 Node 提供,使用的时候都必须根据特定的核心模块名称来加载使用。例如使用文件操作模块:fs

  1. var fs = require('fs')
  2. // fs.readFile
  3. // fs.writeFile
  4. // fs.appendFile
模块名称 作用
fs 文件操作
http 网络操作
path 路径操作
url url 地址操作
os 操作系统信息
net 一种更底层的网络操作方式
querystring 解析查询字符串
util 工具函数模块

文件模块

./../ 开头的模块标识就是文件模块,一般就是用户编写的。

第三方模块

  • moment
  • marked

一般就是通过 npm install 安装的模块就是第三方模块。

加载规则如下:

  • 如果不是文件模块,也不是核心模块
  • node 会去 node_modules 目录中找(找跟你引用的名称一样的目录),例如这里 require('underscore')
  • 如果在 node_modules 目录中找到 underscore 目录,则找该目录下的 package.json 文件
  • 如果找到 package.json 文件,则找该文件中的 main 属性,拿到 main 指定的入口模块
  • 如果过程都找不到,node 则取上一级目录下找 node_modules 目录,规则同上。。。
  • 如果一直找到代码文件的根路径还找不到,则报错。。。

注意:对于第三方模块,我们都是 npm install 命令进行下载的,就放到项目根目录下的 node_modules 目录。

深入模块加载机制

简单流程

img

详细流程

img

简而言之,如果require绝对路径的文件,查找时不会去遍历每一个node_modules目录,其速度最快。其余流程如下:

  1. 从module path数组中取出第一个目录作为查找基准。
  2. 直接从目录中查找该文件,如果存在,则结束查找。如果不存在,则进行下一条查找。
  3. 尝试添加.js、.json、.node后缀后查找,如果存在文件,则结束查找。如果不存在,则进行下一条。
  4. 尝试将require的参数作为一个包来进行查找,读取目录下的package.json文件,取得main参数指定的文件。
  5. 尝试查找该文件,如果存在,则结束查找。如果不存在,则进行第3条查找。
  6. 如果继续失败,则取出module path数组中的下一个目录作为基准查找,循环第1至5个步骤。
  7. 如果继续失败,循环第1至6个步骤,直到module path中的最后一个值。
  8. 如果仍然失败,则抛出异常。

整个查找过程十分类似原型链的查找和作用域的查找。所幸Node.js对路径查找实现了缓存机制,否则由于每次判断路径都是同步阻塞式进行,会导致严重的性能消耗。

小结