正则表达式入门经典
分類: 图书,计算机/网络,程序设计,其他,
作者: (美)瓦特著,李松峰,李丽译
出 版 社: 清华大学出版社
出版时间: 2008-10-1字数: 998000版次: 1页数: 642印刷时间: 2008/10/01开本: 16开印次: 1纸张: 胶版纸I S B N : 9787302183822包装: 平装编辑推荐
本书主要内容:
正则表达式的基本概念以及如何编写正则表达式;
如何分解文本操作问题并构建符合逻辑的正则表达式模式;
如何在不同的脚本或编程语言以及软件包中使用正则表达式;
当前各种正则表达式实现之间存在的差别;
可以解决日常问题的、可重用的正则表达式示例代码。
本书读者对象:
本书适用于那些需要解决文本操作问题,但还不了解正则表达式的开发人员。虽然一些基本的编程或脚本编写经验是有用的,但并不是必需的。
本书技术支持:
从Web站点www.wrox.com和www.tupwkcom.cn/downpage上可以获取本书的源代码和Wrox技术支持。
内容简介
正则表达式能够帮助用户和开发人员更加有效地查找和操纵文本内容。而且,正则表达式已经得到了许多脚本语言、编程语言和数据库的良好支持。这本示例丰富的教程将打破所谓正则表达式难以掌握的传统神话。本书详细解释了正则表达式的各个组成部分、这些组成部分的含义、如何使用它们,以及在编写正则表达式时如何避免常见的错误。
通过逐章地讲解如何在流行的Windows平台的软件——包括数据库、跨平台的脚本语言和编程语言中使用正则表达式,你将学习到如何有效地驾驭正则表达式所提供的强大功能,并且全面理解正则表达式的高度灵活性和无限潜能。
目录
第1章 正则表达式概述
第2章 正则表达式工具和使用方法
第3章 简单的正则表达式
第4章 元字符和修饰符
第5章 字符类
第6章 字符串、行和词边界
第7章 正则表达式中的圆括号
第8章 向前查找和向后查找
第9章 正则表达式的灵敏度和特殊性
第10章 说明和调试正则表达式
第11章 在Microsoft Word中使用正则表达式
第12章 在StarOffice/OpenOffice.org Writer中使用正则表达式
第13章 通过findstr使用正则表达式
第14章 PowerGREP
第15章 Microsoft Excel中的通配符
第16章 SQL Server 2000中的正则表达式功能
第17章 在MySQL中使用正则表达式
第18章 正则表达式与Microsoft Access
第19章 JScdpt和JavaScript中的正则表达式
第20章 正则表达式与VBS
第21章 Visual Basic.NET与正则表达式
第22章 C#和正则表达式
第23章 PHP和正则表达式
第24章 W3C XML Schema中的正则表达式
第25章 Java中的正则表达式
第26章 Peri中的正则表达式
附录 练习答案
书摘插图
第1章正则表达式概述
文本是很多人在使用计算机时要面对的重要内容。无论是编写文档还是编辑代码,文本几乎无处不在。网页通常就是由大量文本组成的,其中一部分是由超文本标记语言(Hypertext Markup Language,HTML)或可扩展超文本标记语言(Extensible Hypertext Markuo Language,XHTML)标记的,其他则是常规性文本。而所有这些文本组合到一起就构成了可以通过正则表达式进行匹配的字符序列。Web页面中的表单可以接受文本作为输入,这些文本需要根据输入条件进行匹配。商业文档是由文本组成的,对其中特殊文本序列的搜索同样可以通过正则表达式实现。电子邮件内容和开发人员编写的代码是由文本组成的。而正则表达式对很多要处理文本的情况都是适用的。
文本不仅随处可见、数量庞大,而且还必须保证对文本内容及时更新或整合。在创建了大量的文本内容后,随着存取频率的增加,需要一种有效而且高效的手段去查找特别关注的文本,或者修改特定的文本块。
在长度只有一两页的单个文档中查找和替换个别文本块一般都很简单。但是如果要处理的文档很多,而每个文档都长达数百页或者都有数以千计的相关短文档,那么同样的查找和替换就会变成一件可怕的任务,而且极有可能导致人为错误。对于此类任务,就可以用正则表达式来处理,因为正则表达式可以实现多种有用的文本处理形式的自动化。
比如说,对一个Web表单中的信用卡号码进行验证以保证结构正确,或保证邮政编码的格式正确。在一份冗长的文档中,想找到一个重要信息源的链接,但却记不清URL地址了。你可能希望转换HTML代码,以便使其符合可扩展标记语言(eXtensible Markup Language,XML)的语法规则并遵守公司使用XHTML代码的制度。你还可能希望对用户在Windows应用程序中的输入进行检查,以保证输入满足必需的条件进而得以正确地处理。
……