| 導購 | 订阅 | 在线投稿
分享
 
 
 

适合初学者的Perl的文件操作(2)

2008-05-19 06:25:50  編輯來源:互聯網  简体版  手機版  評論  字體: ||
 
 
  读入多个记录

  如果你调用,返回文件中剩余的记录。如果你处于文件尾,则返回空表:

  @records = ;

  if (@records) {

  print "There were ", scalar(@records), " records read.n";

  }

  在下面的一步中,进行赋值和测试两项工作:

  if (@records = ) {

  print "There were ", scalar(@records), " records read.n";

  }

  chomp() 也可适用对数组操作:

  @records = ;

  chomp(@records);

  对于任何表达式,都可以进行chomp操作,故你可以在下面的一步中这样写:

  chomp(@records = );

  什么是记录?

  记录的缺省定义为:“行”。

  记录的定义由$/ 变量控制的,该变量存放所输入的记录的分隔符,因为换行符字符(根据定义!)是用来分隔行的,故其缺省值为串“n”。

  例如,你可以用任何你想要替换的符号来代替“n”。

  $/ = ";";

  $record = ; # 读入下一个用分号分隔的记录

  $/可以取其它两个有趣的值:空串("") 和undef。

  读入段落

  $/ =""的写法是用来指示Perl读入段落的,段落是由两个或两个以上的换行符构成的文本块。这不同于设置为"nn",后者仅读入由两行组成的文本块。在这种情况下,将出现这样一个问题:如果有连续的空行存在,例如“textnnnn”,你既可以把它解释为一个段落 ("text"),也可以解释为两个段落 ("text", 后面跟两个换行符,以及一个空段落,后面跟两个空行。)

  在读入文本时,第二个解释用途不大。如果你正在读的段落出现上述情况,你不必过滤出“空”段落。

  $/ = "nn";

  while () {

  chomp;

  next unless length; # 跳过空段

  # ...

  }

  你可以把 $/设置为undef,它用于读入后面跟着两个或多个换行符组成的段落: undef $/;

  while () {

  chomp;

  # ...

  }

  读入整个文件

  $/ 的其它有趣的值为undef。如果设置为该值,就将告诉Perl,读命令将把文件的剩余部分作为一个串返回:

  undef $/;

  $file = ;

  因为改变了 $/的值,将会影响以后的每次读操作,而不仅是下一个读操作。通常,你需要将该操作限制在局部。通过下面的例子,可以把文件句柄的内容读入到一个串中:

  {

  local $/ = undef;

  $file = ;

  }

  记住:Perl变量可读入很长的串。尽管你的文件大小不可以超出你的虚拟内存容量的限度,你仍可以读入尽可能多的数据。

  用正则表达式对文件进行操作

  一旦你有个包含了整个串的变量,你可以使用正则表达式,对整个文件进行操作,而不是对文件中的某个块进行操作。有两个有用的正则表达式标记/s和/m。一般,Perl的正则表达式对行进行处理,你可以这样写:

  undef $/;

  $line = ;

  if ($line =~ /(b.*grass)$/) {

  print "found $1n";

  }

  如果把我们的文件填入如下内容:

  browngrass

  bluegrass

  则输出为:

  found bluegrass

  它没有找到“browngrass”,这是因为$ 仅在串尾寻找其匹配, (或者在串结束前的一行)。如果在包含很多行的串中,用"^" 和"$" 来匹配,, 我们可以使用 /m ("multiline") 选项:

  if ($line =~ /(b.*grass)$/m) {}

  现在程序会把如下的信息输出:

  found browngrass

  类似地,句点可以匹配除了换行符之外的所有字符:

  while () {

  if (/19(.*)$/) {

  if ($1 < 20) {

  $year = 2000+$1;

  } else {

  $year = 1900+$1;

  }

  }

  }

  如果我们从文件中读入“1981”,$_ 将包含“1981n”。正则表达式中的句点匹配“8”和“1”, 而不匹配“n”。这里正需要这样做,因为换行符不是日期的组成部分。

  对于一个包含很多行的串,我们也许要提取其中的大的块,这些块可能会跨越行分隔符。在这种情况下,我们可以使用 /s 选项,并用句点来匹配除了换行符以外的所有字符。

  if (m{(.*?)}s) {

  print "Found bold text: $1n";

  }

  此处,我用了{}来表示正则表达式的起始和结束,而不用斜杠,所以,我就可以告诉 Perl我正在匹配,起始字符为"m",结束字符为"s"。你可以把/s 和/m 选项组合使用:

  if (m{^(.*?)}sm) {

  # ...

  }

  总结

  有两种方法打开文件:open()函数的特点是快速简捷,而sysopen()函数功能强大而复杂。通过 操作符,可以读入一个记录,$/ 变量可以让你控制记录是什么。如果你打算把很多行的内容读入到一个串中,不要使用忘记/s和/m 这两个正则表达式标记。

  
 
 
 
  读入多个记录   如果你调用,返回文件中剩余的记录。如果你处于文件尾,则返回空表:   @records = ;   if (@records) {   print "There were ", scalar(@records), " records read.n";   }   在下面的一步中,进行赋值和测试两项工作:   if (@records = ) {   print "There were ", scalar(@records), " records read.n";   }   chomp() 也可适用对数组操作:   @records = ;   chomp(@records);   对于任何表达式,都可以进行chomp操作,故你可以在下面的一步中这样写:   chomp(@records = );   什么是记录?   记录的缺省定义为:“行”。   记录的定义由$/ 变量控制的,该变量存放所输入的记录的分隔符,因为换行符字符(根据定义!)是用来分隔行的,故其缺省值为串“n”。   例如,你可以用任何你想要替换的符号来代替“n”。   $/ = ";";   $record = ; # 读入下一个用分号分隔的记录   $/可以取其它两个有趣的值:空串("") 和undef。   读入段落   $/ =""的写法是用来指示Perl读入段落的,段落是由两个或两个以上的换行符构成的文本块。这不同于设置为"nn",后者仅读入由两行组成的文本块。在这种情况下,将出现这样一个问题:如果有连续的空行存在,例如“textnnnn”,你既可以把它解释为一个段落 ("text"),也可以解释为两个段落 ("text", 后面跟两个换行符,以及一个空段落,后面跟两个空行。)   在读入文本时,第二个解释用途不大。如果你正在读的段落出现上述情况,你不必过滤出“空”段落。   $/ = "nn";   while () {   chomp;   next unless length; # 跳过空段   # ...   }   你可以把 $/设置为undef,它用于读入后面跟着两个或多个换行符组成的段落: undef $/;   while () {   chomp;   # ...   }   读入整个文件   $/ 的其它有趣的值为undef。如果设置为该值,就将告诉Perl,读命令将把文件的剩余部分作为一个串返回:   undef $/;   $file = ;   因为改变了 $/的值,将会影响以后的每次读操作,而不仅是下一个读操作。通常,你需要将该操作限制在局部。通过下面的例子,可以把文件句柄的内容读入到一个串中:   {   local $/ = undef;   $file = ;   }   记住:Perl变量可读入很长的串。尽管你的文件大小不可以超出你的虚拟内存容量的限度,你仍可以读入尽可能多的数据。   用正则表达式对文件进行操作   一旦你有个包含了整个串的变量,你可以使用正则表达式,对整个文件进行操作,而不是对文件中的某个块进行操作。有两个有用的正则表达式标记/s和/m。一般,Perl的正则表达式对行进行处理,你可以这样写:   undef $/;   $line = ;   if ($line =~ /(b.*grass)$/) {   print "found $1n";   }   如果把我们的文件填入如下内容:   browngrass   bluegrass   则输出为:   found bluegrass   它没有找到“browngrass”,这是因为$ 仅在串尾寻找其匹配, (或者在串结束前的一行)。如果在包含很多行的串中,用"^" 和"$" 来匹配,, 我们可以使用 /m ("multiline") 选项:   if ($line =~ /(b.*grass)$/m) {}   现在程序会把如下的信息输出:   found browngrass   类似地,句点可以匹配除了换行符之外的所有字符:   while () {   if (/19(.*)$/) {   if ($1 < 20) {   $year = 2000+$1;   } else {   $year = 1900+$1;   }   }   }   如果我们从文件中读入“1981”,$_ 将包含“1981n”。正则表达式中的句点匹配“8”和“1”, 而不匹配“n”。这里正需要这样做,因为换行符不是日期的组成部分。   对于一个包含很多行的串,我们也许要提取其中的大的块,这些块可能会跨越行分隔符。在这种情况下,我们可以使用 /s 选项,并用句点来匹配除了换行符以外的所有字符。   if (m{(.*?)}s) {   print "Found bold text: $1n";   }   此处,我用了{}来表示正则表达式的起始和结束,而不用斜杠,所以,我就可以告诉 Perl我正在匹配,起始字符为"m",结束字符为"s"。你可以把/s 和/m 选项组合使用:   if (m{^(.*?)}sm) {   # ...   }   总结   有两种方法打开文件:open()函数的特点是快速简捷,而sysopen()函数功能强大而复杂。通过 操作符,可以读入一个记录,$/ 变量可以让你控制记录是什么。如果你打算把很多行的内容读入到一个串中,不要使用忘记/s和/m 这两个正则表达式标记。   
󰈣󰈤
日版宠物情人插曲《Winding Road》歌词

日版宠物情人2017的插曲,很带节奏感,日语的,女生唱的。 最后听见是在第8集的时候女主手割伤了,然后男主用嘴帮她吸了一下,插曲就出来了。 歌手:Def...

兄弟共妻,我成了他们夜里的美食

老钟家的两个儿子很特别,就是跟其他的人不太一样,魔一般的执着。兄弟俩都到了要结婚的年龄了,不管自家老爹怎么磨破嘴皮子,兄弟俩说不娶就不娶,老父母为兄弟两操碎了心...

 
 
>>返回首頁<<
 
 
 
 
 熱帖排行
 
 
王朝网络微信公众号
微信扫码关注本站公众号 wangchaonetcn
 
  免责声明:本文仅代表作者个人观点,与王朝网络无关。王朝网络登载此文出于传递更多信息之目的,并不意味著赞同其观点或证实其描述,其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
© 2005- 王朝網路 版權所有