区分中英文字符的两种方法

JS区分中英文字符的两种方法: 正则和charCodeAt()方法。

正则无疑是最强大的判断各种条件的方法, 最近也在研习它, 虽然枯燥, 但仍有乐趣. 用它来判断一个双字节的中文字符也是轻而易举地. 而判断中文字符,  简单且执行效率高.

 

[javascript] view plain copy
 

regExpForm.onblur=function(){  
        entryVal=this.value;  
        entryLen=entryVal.length;  
        cnChar=entryVal.match(/[^x00-x80]/g);//利用match方法检索出中文字符并返回一个存放中文的数组  
        entryLen =cnChar.length;//算出实际的字符长度  
    }  

 

第二种方法是通过charCodeAt()方法判断Unicode码值, 若大于255即为中文字符, 它的执行效率没有正则高, 也没有正则简单.

 

[javascript] view plain copy
 

entryVal=this.value;  
        entryLen=entryVal.length;  
        for(var i=0;i<entryVal.length;i  ){  
            if(entryVal.charCodeAt(i)>255){//遍历判断字符串中每个字符的Unicode码,大于255则为中文  
                cnArr.push(entryVal[i]);//讲符合条件的值插入到中文字符数组中  
                //注意一个小bug,push是向数组的末尾添加一个或多个元素并返回新的长度,所以未刷新的情况下反复blur会累加字符值  
            }  
        }  
        entryLen =cnArr.length;  

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注