数据验证介绍
纯客户端脚本验证
RequiredFieldValidator控件
CompareValidator控件
RangeValidator控件
正则表达式
RegularExpressionValidator控件
CustomValidator控件
ValidationSummary控件
分组校验技术
数据验证介绍
在我们的开发中要提高网站的健壮性,为了做到这些笔者曾经在企业培训时候提到了两个原则:
第一条原则:就是尽量减少让用户输入的机会,比如数据的录入时间我们可以设置该条记录的为数据库的当前时间,这个可以在创建或者设计表的时候实现。下面就是一个例子:
createtableActionLog(
LogID bigint identity(1,1),
UserID int notnull,
UserIP varchar(15) notnull,
ActionDate datetime nulldefaultgetdate(),
ActionDescription nvarchar(800) notnull,
ActionStatus tinyint notnull,
WebSiteID int notnull,
constraintPK_ACTIONLOGprimarykey(LogID)
)
Go
上面中的ActionDate字段就是设置成自动获取数据库服务器当前时间,这样在插入记录的时候无需在这个字段插入值。如果这个值让用户填写一来可能用户不能按照我们要求的格式填写,二来即使按照我们的要求填写也可能用户不会填写当前时间,如果采用上面的办法就能有效避免这个问题。
第二条原则:就是不要过分相信用户一定会按照我们的要求规规矩矩去做。最终使用我们的软件产品的用户大都计算机水平不高(如果水平高可能就会自己开发了),所以他们可能不太懂得什么格式和要求之类的,这就经常需要对用户填写的数据进行检查。如果我们对用户提交的数据经过充分检查,那么就能有效提高程序的健壮性,这样也能从某些途径堵住了黑客入侵我们系统的路子。
对数据的检查按时机来分可以分为客户端检查和服务器端检查。
在客户端检查是指通过客户端脚本(如javascript脚本或者vbscript脚本)来进行检查,利用客户端脚本检查的好处是减小网络流量、减轻服务器压力和反映迅速。因为客户端脚本是在客户端运行,我们可以定义好检验规则,在客户端就可以完成检验,一旦不能通过验证客户端马上就能得到提示,而不用将整个表单提交到服务器(笔者早些年曾经就有这样的经历:网速28.8K的情况下提交一个注册表单,数分钟后得到服务器的反馈说是用户名不符合要求,当时差点吐血),用户体验非常好。客户端验证也有一些缺点:因为我们的验证规则完全定义在客户端脚本中,不怀好意的窥探者可以从这些客户端代码找出我们脚本的漏洞或者某些跳过脚本验证的方法,从而造成网站的健壮性出现问题,这就对客户端代码的客户端脚本编程能力提出了挑战。另外客户端验证可能会使我们写得非常优秀的代码在短短几天流传整个网络,不能进行版权控制。
在服务器端检查是指将表单提交到服务器后在服务器上用服务器端代码进行验证(如用C#或者VB.NET等),服务器端验证的优点是我们的验证规则对用户来说是一个黑匣子,比较难找出我们验证代码的漏洞,并且服务器端验证的代码编写起来相对客户端脚本要容易得多,但是服务器端验证也有缺点:那就是大量的复杂验证会降低服务器的性能。
因此一般验证办法都是上面两种样式结合,利用客户端验证建立验证的第一道关卡,这个关卡将大量无意中填写的不符合要求的数据阻止在客户端,然后在服务器端建立第二道关卡,将那些利用了我们的客户端脚本漏洞的数据阻止在保存之前。
客户端脚本验证
下面是一个利用客户端脚本在客户端进行验证的例子。我们对Button服务器控件的OnClientClick加上一个客户端验证方法,只有当这个客户端方法返回true的时候表单才会向服务器提交,如果用户填写的数据不符合要求就返回false值。
下面是前台代码(后台没有编写任何代码):
<%@PageLanguage="C#"AutoEventWireup="true"CodeFile="ClientValidate.aspx.cs"Inherits="ClientValidate"%>
<!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<htmlxmlns="http://www.w3.org/1999/xhtml">
<headrunat="server">
<title>纯客户端脚本验证的例子</title>
<scriptlanguage="javascript"type="text/javascript">
//当这个方法返回false的情况下就不会向服务器提交数据
functioncheckForm()
{
//如果没有填写任何数据
if(document.form1.txtUserName.value=="")
{
alert("用户名不能为空!");
returnfalse;
}
varlength=document.form1.txtUserName.value.length;
//如果填写内容长度不在6到10字符之间
if(length<6||length>10)
{
alert("用户名必须是6到10个字符!");
returnfalse;
}
else
{
returntrue;
}
}
</script>
</head>
<body>
<formid="form1"runat="server">
<div>
<tableborder="0">
<tr><td>用户名</td><td><asp:TextBoxID="txtUserName"runat="server"></asp:TextBox></td></tr>
<tr><td><asp:ButtonID="btnOK"runat="server"Text="提交"OnClientClick="javascript:returncheckForm();"OnClick="btnOK_Click"/></td><td><inputtype="reset"value="清空"/></td></tr>
</table>
</div>
</form>
</body>
</html>
运行效果如下:
如果用户没有填写任何数据就提交表单会得到如下提示:
如果我们填写的字符个数不是6到10个之间提交表单会看到如下效果:
通过上面的例子展示了如何在asp.net中如何利用客户端脚本对表单进行验证,经过上面的大家也能感觉得到用客户端脚本对表单进行验证的编码特点:可以灵活控制验证方法,但是编写客户端脚本比较麻烦,调试起来也不太容易,在目前还没有一款比较好的javascript脚本编写和调试的软件。为了提高开发asp.net网站的速度,微软提供了一套asp.net的验证控件。
asp.net验证控件概述
所有的asp.net验证控件都直接或者间接派生自BaseValidator这个抽象类,BaseValidator类定义了验证控件的一些共有属性和方法。验证控件用于验证与其关联的输入控件的值,当用户的输入不能通过验证时,将会显示预定义的错误提示信息。验证控件的位置并没有规定,可以在页面的任意位置放置验证控件,但是一般为了直观起见,尽量将验证控件靠近要验证的控件的位置。asp.net验证控件可以对以下类型的asp.net控件的值进行验证:
控件名 | 要验证的属性 | 备注 |
DropDownList | SelectedValue | 验证选中项的值 |
FileUpload | FileName | 验证要上传的文件名 |
ListBox | SelectedItem.Value | 验证选中的第一项的值 |
RadioButtonList | SelectedItem.Value | 验证选中项的值 |
TextBox | Text | 验证文本框的值 |
HtmlInputFile | Value | 验证HTML服务器上传控件中的文件名 |
HtmlInputPassword | Value | 验证HTML服务器文本控件的值 |
HtmlInputText | Value | 验证HTML服务器文本控件的值 |
HtmlSelect | Value | 验证HTML服务器下拉控件选中的值 |
HtmlTextArea | Value | 验证HTML服务器多行文本控件的值 |
从上表中我们可以看出验证控件验证的控件类型只能是asp.net服务器控件和HTML服务器控件,而不能验证普通HTML控件,如果要普通HTML控件进行验证,只能像笔者在上一个例子中演示的那样自己编写客户端脚本代码进行验证。
在默认情况下,asp.net服务器控件将首先在客户端进行验证,然后再发送到服务器端进行验证,当然也可以设置它的EnableClientScript属性来指定是否需要在客户端进行验证。BaseValidator类有如下常见属性:
属性名 | 说明 |
ControlToValidate | 待验证的控件的ID |
Display | 错误信息的显示方式,有None、Static和Dynamic,默认为Static |
EnableClientScript | 是否启用客户端验证 |
Enabled | 是否启用验证控件 |
ErrorMessage | 验证失败时显示的信息 |
IsValid | 关联的控件是否通过验证 |
SetFocusOnError | 当验证失败时是否将焦点移动到关联的控件上 |
Text | 验证失败时在验证控件中要显示的信息 |
ValidationGroup | 验证控件所在的分组名 |
(1)Display属性是决定如何显示错误消息的,默认是Static,即始终为错误信息分配显示空间,Dynamic方式是只在需要的时候才为错误信息分配显示空间,而None方式是将错误信息集中到ValidationSummary控件中显示。
(2)ErrorMessage属性是待验证控件不能通过验证的时候在ValidationSummary控件中显示要显示的信息,Text属性是待验证控件不能通过验证是在验证控件中显示的信息,如果只设置了ErrorMessage属性而没有设置Text属性并且Display方式不为None时将会显示ErrorMessage属性的值。
(3)ControlToValidate是必须指定的,否则在运行的时候将会报错。
RequiredFieldValidator控件
RequiredFieldValidator控件也被称之为必填验证控件,顾名思义,也就是与RequiredFieldValidator控件关联的控件的值在默认设置下必须填写。笔者在这里用了个限定词“在默认设置下”,是因为RequiredFieldValidator控件除了BaseValidator中定义的属性之外,还有一个比较重要的属性:InitialValue。默认情况下这个属性的值是String.Empty,如果控件的值与它的默认值一致就不能通过验证,即如果关联的控件没有填写的话就不能通过验证,在验证DropDownList控件的时候我们也可以使用RequiredFieldValidator控件,不过需要设置RequiredFieldValidator控件的InitialValue属性。
下面我们通过一个例子来演示RequiredFieldValidator控件如何验证TextBox控件和DropDownList控件。在程序中我们给DropDownList控件添加了一个默认选项“请选择”,一旦用户没有改变DropDownList控件的选中值就不能通过验证。
在设置验证控件的关联控件时,验证控件会自动找出当前页面中哪些控件是可以进行验证的,如下图:
注意:在上图中控件ID不是TextBox1或者DropDownList这种默认形式,是因为我更改了其默认ID。在实际开发中我一般会更改控件的默认ID,用一个比较直观的ID,这样便于我们在代码中操作。我对服务器控件的ID命名一般遵循控件类型前缀加控件用户的办法,下面举例说明:
控件类型 | 前缀 | 举例 |
TextBox | txt | txtUserName |
Label | lb | lbServerTime |
DropDownList | ddl | ddlState |
Literal | l | lTitle |
Button | btn | btnOK |
RadioButton | rb | rbMale |
CheckBox | cb | cbApply |
因为只是演示验证控件的验证效果,所以没有什么后台代码,采用了单页模式。下面是实例代码:
<%@PageLanguage="C#"%>
<!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<scriptrunat="server">
</script>
<htmlxmlns="http://www.w3.org/1999/xhtml">
<headrunat="server">
<title>RequiredFieldValidator控件用法的例子</title>
</head>
<body>
<formid="form1"runat="server">
<div>
<tableborder="1"width="400">
<tr><td>用户名</td><td>
<asp:TextBoxID="txtUserName"runat="server"></asp:TextBox>
<asp:RequiredFieldValidatorID="RequiredFieldValidator1"runat="server"ControlToValidate="txtUserName"
ErrorMessage="用户名必须填写"></asp:RequiredFieldValidator></td></tr>
<tr><td>省份</td><td>
<asp:DropDownListID="ddlState"runat="server">
<asp:ListItemSelected="True">请选择</asp:ListItem>
<asp:ListItemValue="1">湖北</asp:ListItem>
<asp:ListItemValue="2">湖南</asp:ListItem>
<asp:ListItemValue="3">山东</asp:ListItem>
<asp:ListItemValue="4">山西</asp:ListItem>
<asp:ListItemValue="5">河南</asp:ListItem>
<asp:ListItemValue="6">河北</asp:ListItem>
</asp:DropDownList>
<asp:RequiredFieldValidatorID="RequiredFieldValidator2"runat="server"ControlToValidate="ddlState"
ErrorMessage="请选择省或者直辖市"InitialValue="请选择"></asp:RequiredFieldValidator></td></tr>
<tr><td>
<asp:ButtonID="btnOK"runat="server"Text="提交"/>
</td><td>
<inputid="Reset1"type="reset"value="reset"/></td></tr>
</table>
</div>
</form>
</body>
</html>
下面是运行效果:
当我们直接点击“提交”之后的效果:
一旦我们填写了用户名,并且选择一个省份而不是让“请选择”处于选中状态,那么这个表单就能提交到服务器进行处理了。在这个例子里我们没有写一行客户端脚本代码。
CompareValidator控件
CompareValidator控件也被称之为比较验证控件,它是用来验证两个控件的值或者控件与某个值之间的关系,除了在BaseValidator中定义的属性之外,CompareValidator控件还定义了如下属性:
属性名 | 说明 |
ControlToCompare | 要与所验证的输入控件进行比较的输入控件的ID |
Operator | 要执行的比较操作 |
Type | 对控件的值按照哪种方式进行比较,默认String |
ValueToCompare | 设置要与所验证的控件的值进行比较的值 |
类型 | 说明 |
Currency | 按货币类型比较,小数点后最多两位数字 |
Date | 按日期类型比较(不带时分秒) |
Double | 按浮点数类型比较 |
Integer | 按整数类型比较 |
String | 按字符串类型比较 |
在进行验证的时候还可以指定两个值之间满足什么关系不能通过验证,这个关系可以通过设置Operator属性来指示,分别有<(LessThan)、<=(LessThanEqual)、!= (NotEqual)、=(Equal)、>(GreaterThan)及>=(GreaterThanEqual)。
另外有时候我们可能不是将两个控件的值进行比较,而是将所验证的控件的值与某个指定的值进行比较,那么可以不设置ControlToCompare属性的值而设置ValueToCompare属性的值,验证的时候将用ValueToCompare属性的值与所验证的控件的值按照Type属性指定的类型和Operator属性定义的比较操作来进行验证。
注意:请不要同时设置ControlToCompare属性和ValueToCompare属性,如果同时指定了这两个属性,则ValueToCompare属性优先。
CompareValidator控件用得比较多的场合就是用于确保用户在注册时两次输入的密码一致,还有在某些场合下有一定先后顺序的日期数据,比如某个事件的开始日期和结束日期。
经常看香港警匪片的朋友一定会对警察抓捕嫌疑犯时经常说的那句“你有权保持沉默,但是你所说的将来会成为呈堂证供”不陌生,在asp.net中除了RequiredFieldValidator控件之外,CompareValidator控件、RangeValidator控件和RegularExpressionValidator控件对待所验证的控件也是持这种态度:所验证的控件如果没有任何输入也是能通过验证的,但是如果输入的数据不符合验证规则就不能通过验证!要是要求用户必须输入并且还要符合一定规则,上述的控件就需要结合RequiredFieldValidator控件共同验证。
在下面的例子中要用户填写一个旅游申请,要填写的数据有旅游出发时间、旅游人数、旅游经费及旅游结束时间。根据业务规则,在这个表单中有如下要求:
(1)出发时间一定早于结束时间。
(2)旅游人数一定要大于0(一个人都不参加这个旅游就没有意义了)。
(3)旅游经费可以不填写(难以估算),但一旦填写就必须填写大于0.00的金额。
在这里所有的验证都是用CompareValidator控件结合RequiredFieldValidator控件来进行验证,RequiredFieldValidator控件验证所验证的控件是否填写了数据,CompareValidator控件负责进行比较验证,代码如下:
<%@PageLanguage="C#"%>
<!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<scriptrunat="server">
</script>
<htmlxmlns="http://www.w3.org/1999/xhtml">
<headrunat="server">
<title>CompareValidator灵活使用的例子</title>
</head>
<body>
<formid="form1"runat="server">
<div>
<tableborder="1"width="600">
<tr><tdcolspan="2"align="center">旅游活动申请表</td></tr>
<tr><td>
开始时间</td><td>
<asp:TextBoxID="txtStartDate"runat="server"></asp:TextBox>
<asp:RequiredFieldValidatorID="RequiredFieldValidator1"runat="server"ControlToValidate="txtStartDate"
ErrorMessage="用户名必须填写"></asp:RequiredFieldValidator>
<asp:CompareValidatorID="CompareValidator1"runat="server"ErrorMessage="开始日期必须早于结束日期"ControlToCompare="txtStartDate"ControlToValidate="txtEndDate"Operator="GreaterThanEqual"Type="Date"></asp:CompareValidator></td></tr>
<tr><td>
结束时间</td><td>
<asp:TextBoxID="txtEndDate"runat="server"></asp:TextBox>
<asp:RequiredFieldValidatorID="RequiredFieldValidator2"runat="server"ControlToValidate="txtEndDate"
ErrorMessage="请填写结束时间"></asp:RequiredFieldValidator>
</td></tr>
<tr><td>
参加人数</td><td>
<asp:TextBoxID="txtNumber"runat="server"></asp:TextBox>
<asp:RequiredFieldValidatorID="RequiredFieldValidator3"runat="server"ControlToValidate="txtNumber"
ErrorMessage="必须填写人数"></asp:RequiredFieldValidator>
<asp:CompareValidatorID="CompareValidator2"runat="server"ControlToValidate="txtNumber"
ErrorMessage="人数必须大于0"Operator="GreaterThan"Type="Integer"ValueToCompare="0"></asp:CompareValidator></td></tr>
<tr><td>
经费预算</td><td>
<asp:TextBoxID="txtMoney"runat="server"></asp:TextBox>
<asp:CompareValidatorID="CompareValidator3"runat="server"ControlToValidate="txtMoney"
ErrorMessage="经费必须是大于0的数字"Type="Currency"ValueToCompare="0" Operator="GreaterThan"></asp:CompareValidator></td></tr>
<tr><td>
<asp:ButtonID="Button2"runat="server"Text="提交"/>
</td><td>
<inputid="Reset3"type="reset"value="重置"/></td></tr>
</table>
</div>
</form>
</body>
</html>
下面不填写任何信息提交表单的效果:
从上图我们可以得出一个结论:因为经费预算只使用了CompareValidator控件,所以如果用户不填写任何信息是能够通过验证的。
现在我们填写表单,这里故意将结束时间设置得比开始时间早,并且在参加人数中填写了一个“q”,下面是提交表单的效果:
从上面的效果我们可以得出下面的结论:
(1)如果填写数据不能按照期望的数据类型进行转换时是不能通过验证的,因为我们期望用户在参加人数一栏填写大于0的数字,用户填写了英文字母所以不能通过验证。同理,如果用户在经费预算一栏中填写了不能转换成货币的数字(即小数点后最多两位数字的浮点数)、在开始时间或者结束时间填写了不能转换成日期的数据都是不能通过验证的。
(2)验证控件的Display属性默认为Static,在这种情况下即使所验证的控件通过了验证,但是页面仍然为其分配了显示控件,比如用于验证开始时间、结束时间和参加人数的RequiredFieldValidator控件,虽然满足了必须填写的要求,可是因为它们的属性都是static的,所以当不能通过CompareValidator控件的验证时,CompareValidator控件的错误提示信息仍然与文本框保持了一段距离。
现在我们把页面上所有验证的Display的属性设置为Dynamic,也就是仅在必要的时候页面才为其分配显示空间,因为Display属性是所有验证控件所共有的属性,所以我们可以按住Ctrl键的同时用鼠标选取所有的验证控件,然后集中设置所有控件的Display属性,如下图:
我们重新运行页面,填写和上次一样的信息,然后提交表单,这次的错误提示信息与文本框之间的距离就没有刚才那么明显了,效果如下:
这是如果我们将开始时间和结束时间的值互换,并且在参加人数一栏填写大于0的整数时就能提交表单到服务器进行处理。
提示:其实所有的错误信息都是通过<span></span>方式输出的,当验证控件的Display属性为Static时输出的span格式是“<span style="color:Red; visibility:hidden;"></span>”这样的形式,当Display属性为Dynamic时输出的span格式是“<span style="color:Red; display:none;"></span>”这样的形式。
RangeValidator控件
RangeValidator控件也称之为范围验证控件,也就是只有当用户填写的非空数据不在指定的范围之间时就不能通过验证。除了具有BaseValidator所有的属性之外,它还具有如下常见属性:
属性名 | 说明 |
MaximumValue | 允许的最大值 |
MinimumValue | 允许的最小值 |
Operator | 要执行的比较操作 |
Type | 对控件的值按照哪种方式进行比较,默认String |
<%@PageLanguage="C#"%>
<!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<scriptrunat="server">
protectedvoidPage_Load(objectsender,EventArgse)
{
//注意因为是需要根据填写表单的日期动态判断
//所以在这里动态给RangeValidator赋最大值和最小值
DateTimeminimumValue=DateTime.Now.AddYears(-100);
DateTimemaximumValue=DateTime.Now.AddYears(-18);
RangeValidator1.MinimumValue=minimumValue.ToString("yyyy-MM-dd");
RangeValidator1.MaximumValue=maximumValue.ToString("yyyy-MM-dd");
}
</script>
<htmlxmlns="http://www.w3.org/1999/xhtml">
<headrunat="server">
<title>RangeValidator控件验证的例子</title>
</head>
<body>
<formid="form1"runat="server">
<div>
<tableborder="1"width="600">
<tr><tdcolspan="2"align="center">
周公婚恋交友网</td></tr>
<tr><td>
生日</td><td>
<asp:TextBoxID="txtBirthday"runat="server"></asp:TextBox>
<asp:RequiredFieldValidatorID="RequiredFieldValidator1"runat="server"ControlToValidate="txtBirthday"
ErrorMessage="生日必须填写"Display="Dynamic"></asp:RequiredFieldValidator>
<asp:RangeValidatorID="RangeValidator1"runat="server"Display="Dynamic"ErrorMessage="你的年龄不能注册"
MaximumValue=""MinimumValue=""Type="Date"ControlToValidate="txtBirthday"></asp:RangeValidator></td></tr>
<tr><td>
<asp:ButtonID="Button2"runat="server"Text="提交"/>
</td><td>
<inputid="Reset3"type="reset"value="重置"/></td></tr>
</table>
</div>
</form>
</body>
</html>
下面是运行结果:
正则表达式
正则表达式提供了功能强大、灵活而又高效的方法来处理文本。正则表达式的全面模式匹配表示法使您可以快速分析大量文本以找到特定的字符模式;提取、编辑、替换或删除文本子字符串;或将提取的字符串添加到集合以生成报告。对于处理字符串(例如 HTML 处理、日志文件分析和 HTTP 标头分析)的许多应用程序而言,正则表达式是不可缺少的工具。正则表达式是一个非常有用的技术,有人曾称之为能让程序员不至于丢掉饭碗的十大技术之一,可见它的重要性。完全详细讲述正则表达式的用法可能需要厚厚一本书(我也曾经见过一本厚厚的讲述正则表达式的英文书),但是在本系列课程里限于篇幅只能做一个简单的介绍,有兴趣的朋友可以参考其它书籍。
在“dir *doc”中,*就是表示任何字符的意思。
元字符 | 说明 |
. | 匹配除 n 以外的任何字符。 |
[abcde] | 匹配abcde之中的任意一个字符 |
[a-h] | 匹配a到h之间的任意一个字符 |
[^fgh] | 不与fgh之中的任意一个字符匹配 |
w | 匹配大小写英文字符及数字0到9之间的任意一个,相当于[a-zA-Z0-9] |
W | 不匹配大小写英文字符及数字0到9之间的任意一个,相当于[^a-zA-Z0-9] |
s | 匹配任何空白字符,相当于[ fnrtv] |
S | 匹配任何非空白字符,相当于[^s] |
d | 匹配任何0到9之间的单个数字,相当于[0-9] |
D | 不匹配任何0到9之间的单个数字,相当于[^0-9] |
上面的元字符都是针对单个字符匹配的,要想同时匹配多个字符的话,还需要借助限定符。下面是一些常见的限定符(下表中n和m都是表示整数):
限定浮 | 说明 |
* | 匹配0到多个元字符,相当于{0,} |
? | 匹配0到1个元字符,相当于{0,1} |
{n} | 匹配n个元字符 |
{n,} | 匹配至少n个元字符 |
{n,m} | 匹配n到m个元字符 |
+ | 匹配至少1个元字符,相当于{1,} |
^ | 字符串必须以指定的字符开始 |
$ | 字符串必须以指定的字符结束 |
说明:
(2)可以将多个元字符或者原义文本字符用括号括起来形成一个新的元字符,比如^(13)[0-9]d{8}$表示任意以13开头的手机号码。
(3)另外对于中文字符的匹配是采用其对应的Unicode编码来匹配的,对于单个Unicode字符,如u4e00表示汉字“一”, u9fa5表示汉字“龥”,在Unicode编码中这分别是所能表示的汉字的第一个和最后一个的Unicode编码,在Unicode编码中能表示20901个汉字。
不要认为我记性好,我是从来不记这个的,每次用的时候我都会写一个小程序,查看其运行结果就行了。下面是我这个程序的代码:
usingSystem;
usingSystem.IO;
publicclassUnicodeDemo
{
publicstaticvoidMain()
{
using(StreamWriterwriter=newStreamWriter(newFileStream("Unicode.txt",FileMode.Create)))
{
intvalue=0;
//从字符的所能表示的最小值到最大值进行遍历
for(charc=char.MinValue;c<=char.MaxValue;c++)
{
value=(int)c;
//按照数值=Unicode值=字符的方式写入到Unicode.txt文件中
//19968=u4e00=一即第一个汉字
//40869=u9fa5=龥即最后一个汉字
writer.WriteLine("{0}=u{1}={2}",value,value.ToString("x"),c);
}
}
}
}
将代码编译生成Windows下的控制台程序,运行会在上面会抛出异常,因为有些字符在笔者所使用的编码范围中无法表示,不过这不影响我们查看汉字的范围。最后生成的文件内容如下:
因为汉族的人名最少两个汉字(比如张三),最多四个汉字(比如东方不败),所以匹配汉族的人名可以用这样的形式:[u4e00-u9fa5]{2,4}。