面向搜索引擎的URL优化

王朝other·作者佚名  2006-01-10
窄屏简体版  字體: |||超大  

我在写晋远信息网(www.geofuture.net)时没有考虑到URL如何面向搜索引擎优化,完成了以后才开始优化的。这时要考虑一方面要静态的URL,一方面要尽量保持原有的程序不变以便于以后维护,所以就采用url_rewrite的方法。下面是httpd.conf中相应的部分

<VirtualHost *:80>

DocumentRoot /home/geofuture

ServerName www.geofuture.net

ServerAlias *.geofuture.net geofuture.net *.cic123.com

DirectoryIndex index.files index.html index.php

RewriteEngine On

#RewriteLog logs/rewrite.log

#RewriteLogLevel 9

#RewriteRule / http://geofuture.vicp.net/ [L]

RewriteCond %{REQUEST_FILENAME} index.files [OR]

RewriteCond %{REQUEST_FILENAME} error.files [OR]

RewriteCond %{REQUEST_FILENAME} cat.files [OR]

RewriteCond %{REQUEST_FILENAME} area.files [OR]

RewriteCond %{REQUEST_FILENAME} info.files [OR]

RewriteCond %{REQUEST_FILENAME} topic.files [OR]

RewriteCond %{REQUEST_FILENAME} post.files [OR]

RewriteCond %{REQUEST_FILENAME} profile.files [OR]

RewriteCond %{REQUEST_FILENAME} userinfo.files [OR]

RewriteCond %{REQUEST_FILENAME} cert.files [OR]

RewriteCond %{REQUEST_FILENAME} revise.files [OR]

RewriteCond %{REQUEST_FILENAME} review.files [OR]

RewriteCond %{REQUEST_FILENAME} feedback.files [OR]

RewriteCond %{REQUEST_FILENAME} keyrank.files [OR]

RewriteCond %{REQUEST_FILENAME} rss.files

RewriteRule ^(.+?)\Q(.*)$ $1=$2 [N]

RewriteRule ^(.+?)ZZ(.+)$ $1&$2 [N]

RewriteRule ^(.+?)\.files(.*)$ $1.php$2 [N]

RewriteRule ^(.+?)\.php(/|&)(.+).html$ $1.php?$3 [L]

ErrorDocument 400 /error.php?status=400

ErrorDocument 401 /error.php?status=401

ErrorDocument 403 /error.php?status=403

ErrorDocument 404 /error.php?status=404

ErrorDocument 405 /error.php?status=405

ErrorDocument 408 /error.php?status=408

ErrorDocument 410 /error.php?status=410

ErrorDocument 411 /error.php?status=411

ErrorDocument 412 /error.php?status=412

ErrorDocument 413 /error.php?status=413

ErrorDocument 414 /error.php?status=414

ErrorDocument 415 /error.php?status=415

ErrorDocument 500 /error.php?status=500

ErrorDocument 501 /error.php?status=501

ErrorDocument 502 /error.php?status=502

ErrorDocument 503 /error.php?status=503

ErrorDocument 506 /error.php?status=506

</VirtualHost>

我只把以内容为主的栏目优化了,至于登录和搜索等部分保持不变,因为这些部分也是搜索引擎不关心的。同时,一些常见的状态码(HTTP Status)也有相应的静态页面。上面只修改了外来请求的URL,而程序生成的URL通过下面的代码实现:

<?php

//-------------- SECTION NAME -----------------------------------

// 动态URL改写成静态

function url_rewrite($buffer)

{

//return $buffer;

$search = array(

'.php',

'?',

'&',

'filesZZ',

'=',

'hrefQ',

);

$replace = array(

'.files',

'/',

'ZZ',

'files/ZZ',

'Q',

'href=',

);

preg_match_all('/href="\/(index|error|cat|area|info|topic| post|profile|userinfo|cert| revise|review|feeback|keyrank|rss) \.php(.*?)"/', $buffer, $match);

$url = str_replace($search, $replace, $match[0]);

$url = preg_replace('/\.files(.+?)(#.+?)?"$/', '.files\\1.html\\2"', $url);

return str_replace($match[0], $url, $buffer);

}

?>

上面的函数定义放在公共头文件里面。然后,在需要优化的页面开始处加入以下代码:

ob_start("url_rewrite");

这也是原来的程序唯一需要修改的地方。这样做还有一个问题。 例如我写的分页函数等代码, 都要求原来动态的URL, 而优化了以后通过 $_SERVER['PHP_SELF'].'?'.$_SERVER['QUERY_STRING'] 就只能得到优化以后的静态URL, 所有依赖于动态URL的代码都得修改一下, 以能够处理原来的URL和优化的。这样得改写公共头文件的许多代码。所以我就想了一个迂回的办法:

<?php

//-------------- SECTION NAME -----------------------------------

// 恢复成动态URL

function url_resume($url)

{

$search = array(

'.files',

'.php/',

'ZZ',

'/ZZ',

'Q',

'.html',

);

$replace = array(

'.php',

'.php?',

'&',

'?&',

'=',

'',

);

$url = str_replace($search, $replace, $url);

return $url;

}

?>

有了上面的函数,在需要动态URL的地方只要调用一下就可以了,而不需重写各个核心函数。需要注意的是,url_rewrite和url_resume虽然是相反的过程,但是它们的参数是不同的。前者的参数是整个缓冲区,后者只是一个单个的URL,因为恢复的情况毕竟很少,而全局处理重写可以提高速度。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航