常用的正则表达式

2009年5月1日星期五

常用的正则表达式

匹配中文字符的正则表达式:[\u4e00-\u9fa5]

匹配双字节字符(包括汉字在内):/[^\x00-\xff]

匹配空行的正则表达式:\n[\s|]*\r

匹配HTML标记的正则表达式:/(.*).*\/\1|(.*)\//

匹配首尾空格的正则表达式:(^\s*)|(\s*$)

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w-./?%=]*)?

(1)应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
String.prototype.len=function(){returnthis.replace(/[^\x00-\xff]/g,aa).length;}

(2)应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现
String.prototype.trim=function()
{
returnthis.replace(/(^\s*)|(\s*$)/g,);
}
(3)应用:利用正则表达式分解和转换IP地址
functionIP2V(ip)//IP地址转换成对应数值
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g//匹配IP地址的正则表达式
if(re.test(ip))
{
returnRegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
thrownewError(NotavalidIPaddress!)
}
}

(4)应用:从URL地址中提取文件名的javascript程序

s=http://www.9499.net/page1.htm;
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,$2);//Page1.htm

(5)应用:利用正则表达式限制网页表单里的文本框输入内容

用正则表达式限制只能输入中文:onkeyup=value=value.replace(/[^\u4E00-\u9FA5]/g,'')onbeforepaste=clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))
用正则表达式限制只能输入全角字符:onkeyup=value=value.replace(/[^\uFF00-\uFFFF]/g,'')onbeforepaste=clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))
用正则表达式限制只能输入数字:onkeyup=value=value.replace(/[^\d]/g,'')onbeforepaste=clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))
用正则表达式限制只能输入数字和英文:onkeyup=value=value.replace(/[\W]/g,'')onbeforepaste=clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))

====================================================
正则表达式大全


正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新。

匹配中文字符的正则表达式:[\u4e00-\u9fa5]

匹配双字节字符(包括汉字在内):[^\x00-\xff]

应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

String.prototype.len=function(){returnthis.replace([^\x00-\xff]/g,aa).length;}

匹配空行的正则表达式:\n[\s|]*\r

匹配HTML标记的正则表达式:/(.*).*\/\1|(.*)\//

匹配首尾空格的正则表达式:(^\s*)|(\s*$)

应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:

String.prototype.trim=function()
{
returnthis.replace(/(^\s*)|(\s*$)/g,);
}

利用正则表达式分解和转换IP地址:

下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的javascript程序:

functionIP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g//匹配IP地址的正则表达式
if(re.test(ip))
{
returnRegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
thrownewError(NotavalidIPaddress!)
}
}

不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:

varip=10.100.20.168
ip=ip.split(.)
alert(IP值是:+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配网址URL的正则表达式:([\w-]+\.)+[\w-]+(/[\w-./?%=]*)?

利用正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见本贴回复]

vars=abacabefgeeii
vars1=s.replace(/(.).*\1/g,$1)
varre=newRegExp([+s1+],g?琼?涡獢p?????浜睹扥潜桴牥掼极慢?瑨m?)
vars2=s.replace(re,)
alert(s1+s2)//结果为:abcefgi

我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法,最终没有找到,这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符,再以重复的字符建立第二个表达式,取到不重复的字符,两者串连。这个方法对于字符顺序有要求的字符串可能不适用。

得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1

s=
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,$2)
alert(s)

利用正则表达式限制网页表单里的文本框输入内容:

用正则表达式限制只能输入中文:onkeyup=value=value.replace(/[^\u4E00-\u9FA5]/g,'')onbeforepaste=clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))

用正则表达式限制只能输入全角字符:onkeyup=value=value.replace(/[^\uFF00-\uFFFF]/g,'')onbeforepaste=clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))

用正则表达式限制只能输入数字:onkeyup=value=value.replace(/[^\d]/g,'')onbeforepaste=clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))

用正则表达式限制只能输入数字和英文:onkeyup=value=value.replace(/[\W]/g,'')onbeforepaste=clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))

补充:
^\d+$//匹配非负整数(正整数+0)
^[0-9]*[1-9][0-9]*$//匹配正整数
^((-\d+)|(0+))$//匹配非正整数(负整数+0)
^-[0-9]*[1-9][0-9]*$//匹配负整数
^-?\d+$//匹配整数
^\d+(\.\d+)?$//匹配非负浮点数(正浮点数+0)
^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$//匹配正浮点数
^((-\d+(\.\d+)?)|(0+(\.0+)?))$//匹配非正浮点数(负浮点数+0)
^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$//匹配负浮点数
^(-?\d+)(\.\d+)?$//匹配浮点数
^[A-Za-z]+$//匹配由26个英文字母组成的字符串
^[A-Z]+$//匹配由26个英文字母的大写组成的字符串
^[a-z]+$//匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$//匹配由数字和26个英文字母组成的字符串
^\w+$//匹配由数字、26个英文字母或者下划线组成的字符串
^[\w-]+(\.[\w?琼?涡獢p?????浜睹扥潜桴牥掼极慢?瑨m?-]+)*@[\w-]+(\.[\w-]+)+$//匹配email地址
^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$//匹配url



利用正则表达式去除字串中重复的字符的算法程序:

vars=abacabefgeeii
vars1=s.replace(/(.).*\1/g,$1)
varre=newRegExp([+s1+],g)
vars2=s.replace(re,)
alert(s1+s2)//结果为:abcefgi
===============================
如果vars=abacabefggeeii
结果就不对了,结果为:abeicfgg
正则表达式的能力有限

RE:totoro
谢谢你的指点,这个javascript正则表达式程序算法确实有问题,我会试着找更好的办法!!!

1.确认有效电子邮件格式
下面的代码示例使用静态Regex.IsMatch方法验证一个字符串是否为有效电子邮件格式。如果字符串包含一个有效的电子邮件地址,则IsValidEmail方法返回true,否则返回false,但不采取其他任何操作。您可以使用IsValidEmail,在应用程序将地址存储在数据库中或显示在ASP.NET页中之前,筛选出包含无效字符的电子邮件地址。

[VisualBasic]
FunctionIsValidEmail(strInAsString)AsBoolean
'ReturntrueifstrInisinvalide-mailformat.
ReturnRegex.IsMatch(strIn,(^([\w-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)|(([\w-]+\.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(\]?)$)
EndFunction
[C#]
boolIsValidEmail(stringstrIn)
{
//ReturntrueifstrInisinvalide-mailformat.
returnRegex.IsMatch(strIn,@^([\w-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)|(([\w-]+\.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(\]?)$);
}


2.清理输入字符串
下面的代码示例使用静态Regex.Replace方法从字符串中抽出无效字符。您可以使用这里定义的CleanInput方法,清除掉在接受用户输入的窗体的文本字段中输入的可能有害的字符。CleanInput在清除掉除@、-(连字符)和.(句点)以外的所有非字母数字字符后返回一个字符串。

[VisualBasic]
FunctionCleanInput(strInAsString)AsString
'Replaceinvalidcharacterswithemptystrings.
ReturnRegex.Replace(strIn,[^\w\.@-],)
EndFunction
[C#]
StringCleanInput(stringstrIn)
?琼?涡獢p?????浜睹扥潜桴牥掼极慢?瑨m?{
//Replaceinvalidcharacterswithemptystrings.
returnRegex.Replace(strIn,@[^\w\.@-],);
}


3.更改日期格式
以下代码示例使用Regex.Replace方法来用dd-mm-yy的日期形式代替mm/dd/yy的日期形式。

[VisualBasic]
FunctionMDYToDMY(inputAsString)AsString
ReturnRegex.Replace(input,_
\b(?month\d{1,2})/(?day\d{1,2})/(?year\d{2,4})\b,_
${day}-${month}-${year})
EndFunction
[C#]
StringMDYToDMY(Stringinput)
{
returnRegex.Replace(input,
\\b(?month\\d{1,2})/(?day\\d{1,2})/(?year\\d{2,4})\\b,
${day}-${month}-${year});
}
Regex替换模式
本示例说明如何在Regex.Replace的替换模式中使用命名的反向引用。其中,替换表达式${day}插入由(?day...)组捕获的子字符串。

有几种静态函数使您可以在使用正则表达式操作时无需创建显式正则表达式对象,而Regex.Replace函数正是其中之一。如果您不想保留编译的正则表达式,这将给您带来方便


部分实例:
//返回字符的长度,一个中文算2个
String.prototype.ChineseLength=function()
{
returnthis.replace(/[^\x00-\xff]/g,**).length;
}
//判断字符串是否以指定的字符串结束
String.prototype.EndsWith=function(str)
{
returnthis.substr(this.length-str.length)==str;
}
//去掉字符左端的的空白字符
String.prototype.LeftTrim=function()
{
returnthis.replace(/(^[\\s]*)/g,);
}
//去掉字符右端的空白字符
String.prototype.RightTrim=function()
{
returnthis.replace(/([\\s]*$)/g,);
}
//判断字符串是否以指定的字符串开始
String.prototype.StartsWith=function(str)
{
returnthis.substr(0,str.length)==str;
}
//去掉字符两端的空白字符
String.prototype.Trim=function()
{
returnthis.replace(/(^\s*)|(\s*$)/g,);
}

0 评论:

发表评论