| 導購 | 订阅 | 在线投稿
分享
 
 
 

適合初學者的Perl的文件操作(2)

2008-05-19 06:25:50  編輯來源:互聯網  简体版  手機版  移動版  評論  字體: ||

讀入多個記錄

如果你調用,返回文件中剩余的記錄。如果你處于文件尾,則返回空表:

@records = ;

if (@records) {

print "There were ", scalar(@records), " records read.n";

}

在下面的一步中,進行賦值和測試兩項工作:

if (@records = ) {

print "There were ", scalar(@records), " records read.n";

}

chomp() 也可適用對數組操作:

@records = ;

chomp(@records);

對于任何表達式,都可以進行chomp操作,故你可以在下面的一步中這樣寫:

chomp(@records = );

什麽是記錄?

記錄的缺省定義爲:「行」。

記錄的定義由$/ 變量控制的,該變量存放所輸入的記錄的分隔符,因爲換行符字符(根據定義!)是用來分隔行的,故其缺省值爲串「n」。

例如,你可以用任何你想要替換的符號來代替「n」。

$/ = ";";

$record = ; # 讀入下一個用分號分隔的記錄

$/可以取其它兩個有趣的值:空串("") 和undef。

讀入段落

$/ =""的寫法是用來指示Perl讀入段落的,段落是由兩個或兩個以上的換行符構成的文本塊。這不同于設置爲"nn",後者僅讀入由兩行組成的文本塊。在這種情況下,將出現這樣一個問題:如果有連續的空行存在,例如「textnnnn」,你既可以把它解釋爲一個段落 ("text"),也可以解釋爲兩個段落 ("text", 後面跟兩個換行符,以及一個空段落,後面跟兩個空行。)

在讀入文本時,第二個解釋用途不大。如果你正在讀的段落出現上述情況,你不必過濾出「空」段落。

$/ = "nn";

while () {

chomp;

next unless length; # 跳過空段

# ...

}

你可以把 $/設置爲undef,它用于讀入後面跟著兩個或多個換行符組成的段落: undef $/;

while () {

chomp;

# ...

}

讀入整個文件

$/ 的其它有趣的值爲undef。如果設置爲該值,就將告訴Perl,讀命令將把文件的剩余部分作爲一個串返回:

undef $/;

$file = ;

因爲改變了 $/的值,將會影響以後的每次讀操作,而不僅是下一個讀操作。通常,你需要將該操作限制在局部。通過下面的例子,可以把文件句柄的內容讀入到一個串中:

{

local $/ = undef;

$file = ;

}

記住:Perl變量可讀入很長的串。盡管你的文件大小不可以超出你的虛擬內存容量的限度,你仍可以讀入盡可能多的數據。

用正則表達式對文件進行操作

一旦你有個包含了整個串的變量,你可以使用正則表達式,對整個文件進行操作,而不是對文件中的某個塊進行操作。有兩個有用的正則表達式標記/s和/m。一般,Perl的正則表達式對行進行處理,你可以這樣寫:

undef $/;

$line = ;

if ($line =~ /(b.*grass)$/) {

print "found $1n";

}

如果把我們的文件填入如下內容:

browngrass

bluegrass

則輸出爲:

found bluegrass

它沒有找到「browngrass」,這是因爲$ 僅在串尾尋找其匹配, (或者在串結束前的一行)。如果在包含很多行的串中,用"^" 和"$" 來匹配,, 我們可以使用 /m ("multiline") 選項:

if ($line =~ /(b.*grass)$/m) {}

現在程序會把如下的信息輸出:

found browngrass

類似地,句點可以匹配除了換行符之外的所有字符:

while () {

if (/19(.*)$/) {

if ($1 < 20) {

$year = 2000+$1;

} else {

$year = 1900+$1;

}

}

}

如果我們從文件中讀入「1981」,$_ 將包含「1981n」。正則表達式中的句點匹配「8」和「1」, 而不匹配「n」。這裏正需要這樣做,因爲換行符不是日期的組成部分。

對于一個包含很多行的串,我們也許要提取其中的大的塊,這些塊可能會跨越行分隔符。在這種情況下,我們可以使用 /s 選項,並用句點來匹配除了換行符以外的所有字符。

if (m{(.*?)}s) {

print "Found bold text: $1n";

}

此處,我用了{}來表示正則表達式的起始和結束,而不用斜杠,所以,我就可以告訴 Perl我正在匹配,起始字符爲"m",結束字符爲"s"。你可以把/s 和/m 選項組合使用:

if (m{^(.*?)}sm) {

# ...

}

總結

有兩種方法打開文件:open()函數的特點是快速簡捷,而sysopen()函數功能強大而複雜。通過 操作符,可以讀入一個記錄,$/ 變量可以讓你控制記錄是什麽。如果你打算把很多行的內容讀入到一個串中,不要使用忘記/s和/m 這兩個正則表達式標記。

  讀入多個記錄   如果你調用,返回文件中剩余的記錄。如果你處于文件尾,則返回空表:   @records = ;   if (@records) {   print "There were ", scalar(@records), " records read.n";   }   在下面的一步中,進行賦值和測試兩項工作:   if (@records = ) {   print "There were ", scalar(@records), " records read.n";   }   chomp() 也可適用對數組操作:   @records = ;   chomp(@records);   對于任何表達式,都可以進行chomp操作,故你可以在下面的一步中這樣寫:   chomp(@records = );   什麽是記錄?   記錄的缺省定義爲:「行」。   記錄的定義由$/ 變量控制的,該變量存放所輸入的記錄的分隔符,因爲換行符字符(根據定義!)是用來分隔行的,故其缺省值爲串「n」。   例如,你可以用任何你想要替換的符號來代替「n」。   $/ = ";";   $record = ; # 讀入下一個用分號分隔的記錄   $/可以取其它兩個有趣的值:空串("") 和undef。   讀入段落   $/ =""的寫法是用來指示Perl讀入段落的,段落是由兩個或兩個以上的換行符構成的文本塊。這不同于設置爲"nn",後者僅讀入由兩行組成的文本塊。在這種情況下,將出現這樣一個問題:如果有連續的空行存在,例如「textnnnn」,你既可以把它解釋爲一個段落 ("text"),也可以解釋爲兩個段落 ("text", 後面跟兩個換行符,以及一個空段落,後面跟兩個空行。)   在讀入文本時,第二個解釋用途不大。如果你正在讀的段落出現上述情況,你不必過濾出「空」段落。   $/ = "nn";   while () {   chomp;   next unless length; # 跳過空段   # ...   }   你可以把 $/設置爲undef,它用于讀入後面跟著兩個或多個換行符組成的段落: undef $/;   while () {   chomp;   # ...   }   讀入整個文件   $/ 的其它有趣的值爲undef。如果設置爲該值,就將告訴Perl,讀命令將把文件的剩余部分作爲一個串返回:   undef $/;   $file = ;   因爲改變了 $/的值,將會影響以後的每次讀操作,而不僅是下一個讀操作。通常,你需要將該操作限制在局部。通過下面的例子,可以把文件句柄的內容讀入到一個串中:   {   local $/ = undef;   $file = ;   }   記住:Perl變量可讀入很長的串。盡管你的文件大小不可以超出你的虛擬內存容量的限度,你仍可以讀入盡可能多的數據。   用正則表達式對文件進行操作   一旦你有個包含了整個串的變量,你可以使用正則表達式,對整個文件進行操作,而不是對文件中的某個塊進行操作。有兩個有用的正則表達式標記/s和/m。一般,Perl的正則表達式對行進行處理,你可以這樣寫:   undef $/;   $line = ;   if ($line =~ /(b.*grass)$/) {   print "found $1n";   }   如果把我們的文件填入如下內容:   browngrass   bluegrass   則輸出爲:   found bluegrass   它沒有找到「browngrass」,這是因爲$ 僅在串尾尋找其匹配, (或者在串結束前的一行)。如果在包含很多行的串中,用"^" 和"$" 來匹配,, 我們可以使用 /m ("multiline") 選項:   if ($line =~ /(b.*grass)$/m) {}   現在程序會把如下的信息輸出:   found browngrass   類似地,句點可以匹配除了換行符之外的所有字符:   while () {   if (/19(.*)$/) {   if ($1 < 20) {   $year = 2000+$1;   } else {   $year = 1900+$1;   }   }   }   如果我們從文件中讀入「1981」,$_ 將包含「1981n」。正則表達式中的句點匹配「8」和「1」, 而不匹配「n」。這裏正需要這樣做,因爲換行符不是日期的組成部分。   對于一個包含很多行的串,我們也許要提取其中的大的塊,這些塊可能會跨越行分隔符。在這種情況下,我們可以使用 /s 選項,並用句點來匹配除了換行符以外的所有字符。   if (m{(.*?)}s) {   print "Found bold text: $1n";   }   此處,我用了{}來表示正則表達式的起始和結束,而不用斜杠,所以,我就可以告訴 Perl我正在匹配,起始字符爲"m",結束字符爲"s"。你可以把/s 和/m 選項組合使用:   if (m{^(.*?)}sm) {   # ...   }   總結   有兩種方法打開文件:open()函數的特點是快速簡捷,而sysopen()函數功能強大而複雜。通過 操作符,可以讀入一個記錄,$/ 變量可以讓你控制記錄是什麽。如果你打算把很多行的內容讀入到一個串中,不要使用忘記/s和/m 這兩個正則表達式標記。   
󰈣󰈤
王朝萬家燈火計劃
期待原創作者加盟
 
 
 
>>返回首頁<<
 
 
 
 
 熱帖排行
 
王朝網路微信公眾號
微信掃碼關註本站公眾號 wangchaonetcn
 
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有