视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
nodejs读取本地中文json文件出现乱码解决方法
2020-11-27 22:06:21 责编:小采
文档

1. 确定json文件是UTF-8 无BOM编码的的。如果有BOM,会在读取第一行的时候出现乱码。

Per "fs.readFileSync(filename, 'utf8') doesn't strip BOM markers #1918", fs.readFile is
working as designed: BOM is not stripped from the header of the UTF-8 file, if it exists. It at the discretion of the developer to handle this.

Possible workarounds:

  • data= data.replace(/^\uFEFF/, ''); perhttps://github.com/joyent/node/issues/1918#issuecomment-2480359
  • Transform the incoming stream to remove the BOM header with the NPM module bomstrip perhttps://github.com/joyent/node/issues/1918#issuecomment-38491548
  • What you are getting is the byte order mark header (BOM) of the UTF-8 file. When JSON.parse sees
    this, it gives an syntax error (read: "unexpected character" error). You must strip the byte order mark from the file before passing it to JSON.parse:

    fs.readFile('./myconfig.json', 'utf8', function (err, data) {
     myconfig = JSON.parse(data.toString('utf8').replace(/^\uFEFF/, ''));
    });
    // note: data is an instance of Buffer
    

    2. 确定json没有格式错误。我在用utf8编码并用utf8 encoding来读取文件之后依然报错,百思不得其解。

    最后发现json有两个editor没有发现的格式错误,一个是一个数组中两个元素之间少了一个“,”,另一个是另一个数组最后多了一个“,”。

    注1:Node的iconv模块,仅支持linux,不支持Windows,因此要用纯js的iconv-lite,另:作者说iconv-lite的性能更好,具体参考Git站点:iconv-lite

    注2:我在测试读写文件时,始终无法把中文写入文件,一直乱码,读取正常,后来同事帮我发现:js文件的编码格式是ansi,nodejs的代码文件必须是utf8格式

    注3:如果程序操作的文件,都是以UTF8编码格式保存的,那么就不需要使用iconv模块,直接以utf8格式读取文件即可,如:

    // 参数file,必须保存为utf8格式,否则里面的中文会乱码  
    function readFile(file){  
        // readFile的第2个参数表示读取编码格式,如果未传递这个参数,表示返回Buffer字节数组  
        fs.readFile(file, "utf8", function(err, data){  
            if(err)  
                console.log("读取文件fail " + err);  
            else{  
                // 读取成功时  
                console.log(data);// 直接
    输出中文字符串了           }       });   }

    nodejs读取中文文件编码问题

    准备一个文本文件(当然也可以是csv文件等)test.txt和text.csv,nodejs文件test.js如下:

    var iconv = require('iconv-lite');  
      
    var fs = require('fs');  
    var fileStr = fs.readFileSync('D:\\test.csv', {encoding:'binary'});  
      
    var buf = new Buffer(fileStr, 'binary');  
      
    var str = iconv.decode(buf, 'GBK');  
    console.log(str);  

    直接读文件的话是乱码,不信你可以试试。需要先统一用二进制编码方式读取,然后再用GBK解码。

    下载本文
    显示全文
    专题