搜索引擎已成为我们网络生活中的一个重要组成部分,而网页快照不仅使我们能更快地访问到搜索出来的网页,而且当我们碰到搜索出来的网页是一些已经删除的网页(如显示“HTTP 404”错误的网页),或是碰到一些暂时关闭的网站,还可以利用网页快照找到所需要的内容。甚至对于我们检索密码和入口都有意想不到的好处,例如在Google中检索“杂志名+passWord”的时候,经常有一些页面假如直接点连接,提示“404 Not found”之类的错误信息,这时查看Google快照(Cache)往往就能看到该网页原来的内容,甚至会发现许多密码。
掀起你的盖头来—网页快照的原理
简单地讲,“网页快照”就是搜索引擎在收录网页时,都会做一个备份来保存这个网页的主要文字内容,大多是文本的,这个备份是存在搜索引擎的服务器缓存里的,当我们打开网页快照访问时,实际上访问的就是搜索引擎里的这个缓存。所以当这个网页被删除或连接失效时,用户可以使用网页快照来查看这个网页的主要内容,而且又由于这个快照以文本内容为主,因此访问速度比访问一般网页更快。
提示:怎样使用网页快照?
单击搜索结果页面后面的“网页快照”就可以看见该网页的快照内容,对于随时更新的网站(如新闻网站)来说,快照内容不可能跟得上其更新速度,但是对于其他类型或者已经不存在的网站来说,网页快照却是非常有用的,而且网页快照中还有标题信息说明其存档时间日期,并提醒用户这只是存档资料。
天生我材必有用—网页快照的用途
网页快照的用途主要有四个方面:
1.查看无法打开的网页:当你要访问的网页不存在或链接失效或者打开速度极慢时,你可以通过使用网页快照来访问这个网页;
2.查找文字资料:由于网页快照显示的速度比较快,因此假如你要查找一些更新不是很快的文字,比如技术文档、资料等,可以直接通过网页快照来查看,会节省很多时间;
3.快速定位要害字:要害字会单独在网页快照中显示其他的颜色(如红色或者黄色,见下图),因此通过网页快照可以很快找到网页中要害词的位置;
4.查看网页老版本:有时候搜索到的网页可能已经更新了,而你需要的信息是在原来的网页上,这时可以使用快照。
打不开网页快照的解决方案
1.快照打不开的原因
知道了网页快照的原理,我们经常利用它来查找需要的资料,但是使用网页快照时经常会出现打不开的情况,甚至同一时刻有的用户可以打开,而另一个用户却不能使用,这是什么原因呢?一般是由以下三种原因引起的:
①网页文本下载假如排在图片和一些动态文件后,而这些需要先下载的图片或者动态文件却刚好无法下载,则快照可能无法打开;
②若图片或动态文件下载速度慢,会因为超时而打不开快照;
③有些快照中涉及了不良内容,被ISP(如电信)屏蔽了,所以你看不到。
2.解决思路
对于网页快照打不开的前两个原因,是网页本身设计原因造成的,这里我们主要解决第三种情况。ISP出于安全性考虑经常会屏蔽一些字眼和网址,而Google缓存中的一些正常的内容也因此被ISP过滤掉了,导致无法正常打开网页快照。解决问题的根本思路是突破封锁,而ISP采用的方法一般都是对URL地址进行过滤,所以将URL地址修改成符合Google语法格式就可以避开封锁正常浏览了。
3.解决方案
①巧用插件,简单实用
◆GreenBrower/Maxthon两种浏览器的插件。
将解压后的所有文件复制到C:\PRogram\Green Borwer\plugin\ GoogleCache目录下面,启动Green Browser,单击菜单栏中“工具/扩展工具栏”,选择“设置扩展工具栏”,单击“命令” 后的“...”按钮中选择该插件(见下图),再单击“插入”按钮增加该插件,选中该插件前的复选框。假如需要自动运行此插件,则勾选“工具”菜单的“扩展工具栏”的“自动运行所选插件”。
插件安装完成后,假如设定了自动运行,那么插件将在后台开始自动工作了。假如是设定的手动运行,在需要打开快照的页面上和已经打开失败的快照页面上单击工具栏中的“G”按钮后,打开Google搜索结果页面,单击“网页快照”链接查看即可。有时,我们在刷新页面后,会发现安装的插件没起作用,这时在单击“网页快照”链接前,将鼠标悬停在“网页快照”链接上,看浏览器的状态栏显示的链接地址中是否包含有“search?&q=cache:”,尤其是“&”,假如没有则需要再次手动运行插件。
提示:假如是使用Maxthon浏览器,将文件解压至Maxthon程序目录下的plugin\GoogleCache目录,退出并重新启动Maxthon,程序自动提示有新的插件,单击“确认”即可。
非凡需要注重的是:在打开的页面快照上面的Google框架中有一个“缓存文本”或“cached text”,不要单击,否则可能会出现页面加载完毕后链接地址被错误修正,无法显示的情况;或者在页面没有加载完毕前点击或刷新后单击,此时链接地址没有修正,导致ip屏蔽,而无法访问页面快照。
提示:其实Google搜索提供了一个最简单的命令,可以完成快照的搜索。当网址不能打开时,可以在Google首页的搜索框中输入“cache:www.pcdigest.com”,回车后就可以打开该页面的快照了。
◆Firefox浏览器的插件。
工具谱
软件名称:GoogleCache(GreenBrower/Maxthon下用)
软件版本:N/A
授权方式:免费软件
软件大小:2.33KB
下载地址:http://searchsmallbizit.techtarget.com.cn/imagelist/05/08/t4ifn0l2q0oh.rar
下载相关插件,解压后是googlecache.XPi文件。
启动Firefox,单击菜单栏上“工具/扩展”打开扩展窗口,把googlecache.xpi文件用鼠标拖入到扩展窗口中,会自动弹出一个安装对话框(下图),单击“立即安装”,插件即开始安装,然后重启Firefox。
工具谱
软件名称:GoogleCache(Firefox)
软件版本:N/A
授权方式:免费软件
软件大小:2.85KB
下载地址:http://mygoogle.kmip.net/gznm/050901/firefoxcache.rar
在Firefox地址栏输入“about:config”,这时工具栏上会多一个过滤器(英文版是Filter)。在其中输入“search”,网页页面中会自动出现“browser.search.defaulturl”,后面的值是“http://www.google.com/search?lr=...”(见下图),右键单击选择Modify(修改),把http://www.google.com/改为下面的Google的其他数据中心的地址即可,如http://64.233.167.104/,以后在搜索时查看Google网页快照就不需要使用代理了。
②有效代理,突破封锁
寻找代理服务器是突破ISP封锁的最简单方法,下载一个代理服务器搜索工具(如“代理猎手”ProxyHunter等),根据工具再找一个有效的代理,通过代理访问快照网页,突破ISP的封锁。
③修改域名,转向访问
使用www.google.com访问快照经常会被过滤,这时我们可以将搜索的域名地址进行修改,例如改为http://www.google.com/u/berkeley或http://www.google.com/custom。这样就能有效地解决快照访问的问题了。Google的网址还可修改为:http://google.7766.org、http://64.233.167.104/等。
提示:Google的其他数据中心的地址还有:http://66.249.81.99/、http://66.102.7.104/、http://64.233.161.104/、http://64.233.161.104/。
附录:关于网页快照的其他一些说明
1 哪些网页是看不到快照的?
答:未编入索引的网页是没有快照的,或者应网页主人要求,删除了快照,这样也是没有快照的;
2 网页快照多久更新一次?
答:多久更新一次可不好说,这要根据各搜索引擎程序的爬行程序来定,但我想不会也没必要太频繁;
3 为什么有些快照会无法打开?
答:快照只保存了网页的Html部分,并不保存网页的全部内容。打不开快照可分为三种情况:
1)网页文本下载假如规定在图片和一些动态文件后,而这些需要先下载的文件刚好无法下载,则快照可能无法打开。
2)若图片或动态文件下载速度慢,会因为超时而打不开快照。
3)有些快照中涉及了违法内容,所以不会让你看到。
4 为什么有些快照打开了却看不到内容?
答:快照会对网页内容进行过滤,可能不会显示音乐,图片文件,也许你碰到了图片比较多的网站哦,假如网页本身就只是由一个动态文件(或一些java特效)或FRAME构成,则快照即使打开,也有可能什么都看不到。
5 为什么有时候点了一个快照却连到了其他的网页?
答:假如网页的源代码中有重定向命令,则快照可能会直接连到指定的网页。
6 为什么快照中会出现乱码?
答:这个分为五种情况:
1)网页指定了错误的编码。
2)浏览器不支持该网页使用的语言。
3)浏览器错认了该网页的语言编码。
4)搜索引擎对文字编码错误。
5)搜索引擎未能正确识别和显示字符。
文:朱莉/整编:残残