邹洋的博客

Don't be the same, be better !

zouyang0921's avatar zouyang0921

JavaScript 模块化

随着 JavaScript 日新月异的发展,超过了它产生时候的自我定位,由于没有模块管理的概念,在做大型项目或文件组织的时候,就会异常纠结,而且后续也很难维护,长此以往,模块化是必然趋势~

模块化的主要特征是:

  • 可复用
  • 封装了变量和函数,和全局的 namaspace 不接触,松耦合
  • 只暴露可用的 public 方法,其它私有方法全部隐藏

目前比较流行的 JS 模块化规范有 CommonJS、AMD、CMD、UMD 以及 ES6 的模块化。

CommonJS

Node.js 是 CommonJS 规范的主要实践者,它有四个重要的环境变量为模块化的实现提供支持:moduleexportsrequireglobal。实际使用时,通过 module.exports 导出对外的变量或接口,通过 require 导入其它模块的输出到当前的模块的作用域中。

模块定义

//  定义模块 math.js
var basicNum = 0;
function add(a, b) {
    return a + b;
}

module.exports = { // 在这里写需要向外暴露的变量或函数
    basicNum: basicNum,
    add: add
};

模块引用

// 引入自定义的模块,参数需要包含路径,可省略后缀.js
var math = require('./math);
math.add(3, 5);
// 引入核心模块,参数直接写模块名,不需要包含路径
var http = require('http');
http.createServer(...).listen(8080);

module.exports v.s. exports

很多时候,我们会看到在一个模块中有两种方式来输出变量:

方式一:对 module.exports 赋值

// hello.js
function sayHello() {
    console.log('Hello');
}
function sayGoodbye() {
    console.log('Goodbye');
}

module.exports = {
    sayHello: sayHello,
    sayGoodbye: sayGoodbye
};

方式二:直接使用 exports

// hello.js
function sayHello() {
    console.log('Hello');
}
function sayGoodbye() {
    console.log('Goodbye');
}

exports.sayHello = sayHello;
exports.sayGoodbye = sayGoodbye;

但是,不可以直接对 exports 赋值。

// 代码可以执行,但是并没有输出任何变量
exports = {
    sayHello: sayHello,
    sayGoodbye: sayGoodbye
};

原因是什么呢?我们来分析一下 Node.js 的加载机制。

首先,Node.js 会把待加载的文件 hello.js 放入一个包装函数 load() 中执行。在执行 load() 函数前,Node.js 准备好了 module 变量:

var module = {
    id: 'hello',
    exports: {}
};

load() 函数最终返回 module.exports

var load = function(module) {
    // hello.js 文件的内容
    ...

    // load 函数返回
    return module.exports;
};

var exports = load(module);

也就是说,exports 实际上是 module.exports 的引用,或者理解为 exports 是一个指针,指向 module.exports ,所以在使用 exports 的时候,只能是 exports.sayHello = function() {...} 这样的方式,而不能使用

exports = { sayHello: function() {}}

这种方式相当于重新定义了 exportsmodule.exports 仍然是空对象 {},所以给 exports 赋值是无效的。

优点:解决了依赖、全局变量污染的问题。

缺点:CommonJS 用同步的方式加载模块。在服务端,模块文件都存在本地磁盘,读取非常快,所以这样做不会有问题。但是在浏览器端,限于网络原因,更合理的方案是使用异步加载。

AMD

AMD( Asynchronous Module Definition ) 是 Require.js 在推广过程中对模块定义的规范化产出。

AMD 规范采用异步方式加载模块,所有依赖这个模块的语句都定义在一个回调函数中,等到加载完成后,这个回调函数才会执行。

实现 AMD 规范的模块化通过 define() 方法将代码定义为模块,通过 require() 方法实现模块的加载。

这里以 require.js 为例,首先将 require.js 引入到页面中:

<script src="js/require.js" data-main="js/main"></script>

定义模块

(1)独立模块

即 不需要依赖任何其他模块

// math.js
define(function() {
    var basicNum = 0;
    var add = function(a, b) {
        return a + b;
    };
    return {
        basicNum: basicNum,
        add: add
    };
});

(2)非独立模块

即 需要依赖其他模块

define(['underscore'], function(_) {
    var classify = function(list) {
        _.countBy(list, function(num) {
            return num > 30 ? 'old' : 'young';
        });
    };
    return {
        classify: classify
    };
});

引用模块

require(['jquery', 'math'], function($, math) {
    var sum = math.add(3, 5);
    $('#sum').html(sum);
});

require.js 还提供了一个 API: require.config() ,可以用来配置项目中用到的基础模块。

// 通过 config() 指定各模块路径和引用名
require.config({
    baseUrl: 'js/lib',
    paths: {
        'jquery': 'jquery.min', // 实际路径为 js/lib/jquery.min.js
        'underscore': 'underscore.min'
    }
});

// 引入模块
require(['jquery', 'underscore'], function($, _) {
    ...
});

优点:适合在浏览器环境中异步加载模块,可以并行加载多个模块。

缺点:不能按需加载,开发成本大。

CMD

CMD( Common Module Definition ) 是 Sea.js 在推广过程中对模块定义的规范化产出。

AMD 推崇依赖前置、提前执行,CMD 推崇依赖就近、延迟执行。

// AMD 写法
define(['a', 'b', 'c', 'd', 'e'], function(a, b, c, d, e) {
    // 等于在最前面声明并初始化了所有依赖的模块
    a.doSomething();
    if (false) {
        // 即使没有用到某个模块 b,但 b 还是提前执行了
        b.doSomething();
    }
});

// CMD 写法
define(function(require, exports, module) {
    var a = require('./a); // 在需要时声明
    a.doSomething();
    if (false) {
        var b = require('./b);
        b.doSomething();
    }
});

UMD

UMD ( Universal Module Definition ),希望提供一个前后端跨平台的解决方案(支持 AMD 与 CommonJS 模块方式)。

UMD 的实现原理:

  1. 先判断是否支持 Node.js 模块格式( exports 是否存在 ),存在则使用 Node.js 模块格式。
  2. 再判断是否支持 AMD(define 是否存在),存在则使用 AMD 方式加载模块。
  3. 前两个都不存在,则将模块公开到全局( window 或 global )。

下面是一个示例:

eventUtil.js

(function(root, factory) {
    if (typef exports === 'object') {
        module.exports = factory();
    } else if (typeof define === 'function' && define.amd) {
        define(factory);
    } else {
        root.eventUtil = factory();
    }
})(this, function() {
    // module
    return {
        addEvent: function(el, type, handle) {
            // ...
        },
        removeEvent: function(el, type, handle) {
            // ...
        }
    };
});

ES6 Module

在 ES6 中, 我们可以通过 import 引入模块,通过 export 导出模块,功能比前几个方案更强大,也是我们推荐使用的,但是由于浏览器对 ES6 的支持程度不同,目前都是使用 babel 或 traceur 把 ES6 代码转化为 ES5 代码,然后再在浏览器环境中执行。

// 定义模块 math.js
var basicNum = 0;
var add = function(a, b) {
    return a + b;
};

export { basicNum, add };
// 引用模块
import { basicNum, add } from './math';

function test(element) {
    element.textContent = add(basicNum, 99);
}
test();

导出模块时还可以用 export default ,为模块指定默认输出,对应的 import 语句不需要使用大括号。

// 输出模块
export default {
    basicNum,
    add
}

// 引入模块
import math from './math';

注:一个模块只能有一个 export default。

CommonJS 与 ES6 模块化的差异

1. CommonJS 支持动态导入,也就是 require(${path}/xx.js) ,ES6 目前还不支持,但是已有提案。

2. CommonJS 是同步导入,ES6是异步导入。

  • CommonJS 因为用于服务端,文件都在本地,同步导入即使卡住主线程影响也不大。
  • ES6 因为用于浏览器,需要下载文件,如果也采用同步导入会对渲染有很大影响。

3. CommonJS 模块输出的是一个值的拷贝,ES6 模块输出的是值的引用。

  • CommonJS 模块输出的是值的拷贝,也就是说,一旦输出一个值,模块内部的变化就影响不到这个值;另一方面,如果导出的值变了,导入的值也不会变,所以如果想更新值,必须重新导入一次。
  • ES6 采用实时绑定的方式,导入和导出的值都指向同一个内存地址,所以导入的值会跟随导出的值变化。

4. CommonJS 模块是运行时加载,ES6 模块是编译时加载。

  • CommonJS 模块就是一个对象,在导入时先加载整个模块,生成一个对象( 这个对象只有在脚本运行完才会生成 ),然后再从这个对象上读取方法,这种加载称为“运行时加载”。
  • ES6 模块不是对象,它的对外接口只是一种静态定义,在代码运行之前( 即编译时 )的静态解析阶段就完成了模块加载,比 CommonJS 模块的加载方式更高效。