视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
js处理包含中文的字符串
2020-11-27 20:12:13 责编:小采
文档


场景:

js中String类型自带的属性length获取的是字符串的字符数目,但是前端经常会需要字符串的显示长度,一个中文字符又大概占两个英文小写字符的显示位置,所以中英文混合的情况下用length值来判断显示长度往往并不正确。

常规的解决办法是遍历字符串,中文字符计长度2,非中文字符计长度1,通过新计算出来长度总和来字符串的显示长度。看代码↓↓↓

var Tools ={ //是否包含中文
 hasZh: function(str){ 
 for(var i = 0;i < str.length; i++)
 { 
 if(str.charCodeAt(i) > 255) //如果是汉字,则字符串长度加2
 return true; 
 return false;
 }
 }, //重新计算长度,中文+2,英文+1
 getlen: function(str){ 
 var strlen = 0; 
 for(var i = 0;i < str.length; i++)
 { 
 if(str.charCodeAt(i) > 255) //如果是汉字,则字符串长度加2
 strlen += 2; 
 else
 strlen++;
 } return strlen;
 }, //长度
 limitlen: function(str, len){ 
 var result = ""; 
 var strlen = 0; 
 for(var i = 0;i < str.length; i++)
 { 
 if(str.charCodeAt(i) > 255) //如果是汉字,则字符串长度加2
 strlen += 2; 
 else
 strlen++;

 result += str.substr(i,1); 
 if(strlen >= len){ 
 break;
 }
 } return result;
 }
}

这种方法的原理是根据中英文的unicode编码范围不同来判断的,中文占2个字节,英文占1个字节,所以中文的unicode编码值肯定大于2^8-1=255。

上述方法可以更严谨一点:就是考虑unicode编码范围,具体的范围可以戳Unicode Table

PS: 汉字的unicode编码范围16进制为4E00-9FA5,10进制则为:19968-40869,即判断中文的准确表达式为:

str.charCodeAt(i)>=19968 && str.charCodeAt(i)<=40869

插一句不太严谨的话,代码不用太严谨的范围,毕竟你不知道用户(测试)会输哪些奇怪的东西。

下载本文
显示全文
专题