分享
 
 
 

人肉搜索时代的隐私保护

王朝互联网·作者佚名  2011-12-19
窄屏简体版  字體: |||超大  

愈演愈烈的人肉搜索是近几年网络上的热门话题,从早几年的"虐猫人事件","铜须门事件"到不久前的"劲舞团脑残辽宁女"、"菊花香香儿1986",人肉搜索的每次出击都能在互联网上掀起轩然大波。那么人肉搜索引擎是如何运作的呢?

这里简单举一个理想化的例子,来简要介绍下人肉搜索引擎的运作过程,譬如你在某个论坛,看到了某个id,由于某种目的,想了解这个id在现实生活中的一切,于是,你通过在那个论坛注册,通过查看那个id的资料,获得这个网友的一些基本资料,如qq号码,或者email。于是,你通过在互联网搜索qq号码,或则email,获得这个id的更多资料。譬如留在某个租售房网站的电话号码,譬如留在某个人才网站的个人简历。通过继续搜索电话号码,个人简历上的内容,你又可以获得更多的,有关这个id在现实生活中的各种资料,包括真实姓名,家庭住址,身份证号码,单位的电话号码,至此,就完成了一次人肉搜索。现实中的人肉搜索,可能不像我刚才所描述的那么容易——事先已经说明,这是一个理想化的例子——但多数时候也并不困难,特别是对于一些老网民而言。

而在见识到人肉搜索强大到可以称之为"可怕"的力量之后——试想,自己的姓名住址电话甚至身份证亲人朋友资料都赤裸裸地出现在网上,足以令人战栗——一个很重要的问题摆到公众的视线中,如何保障个人隐私不受到人肉搜索引擎的侵害?特别是对于提供了互联网大多数内容的网站管理者而言,如何切实地保护用户的隐私?由于人肉搜索依赖的主要工具就是搜索引擎,因此,要做好隐私保护,关键就是最好反搜索引擎收录工作。目前主流的隐私保护技术有以下

1、 设定权限保护隐私内容

在我们上面的例子中,如果最开始的那个论坛做好权限管理,不允许刚注册的会员查看其他会员的资料,那么我们就无法获得qq号码或者email,同样的道理,对于租售房网站而言,只允许注册会员查看电话号码,人才网站只对企业用户开放个人简历浏览权限,就可以有效地阻止搜索引擎的收录,例如(校内网) (开心网)这些sns都是使用这样的方式。但是,现在一个很关键的问题是,面对越来越挑剔的网名,必要要注册才能获得更多服务的网站越来越不受欢迎的,打个比方,就像(口碑网)的租房频道,我要租房子,想看房东的电话居然还要花时间注册,真是令人讨厌!因此基于用户体验方面的考虑,通过权限设定来实行隐私保护的方案并不是那么完美。既然我们的思路是阻止搜索引擎收录,那么还有其他的方法,譬如通过脚本输出隐私内容

2、 通过脚本输出隐私内容

从iis日志来看,目前除了google会抓取javascript脚本文件以外,其他的搜索引擎的爬虫并不能抓取js文件——何况,google对js文件是完全解析执行获得最终结果,还是只是为了排查恶意网站不解析执行只进行特征码判断还是个未知数——在这种情况下,我们可以对一些敏感的内容,不直接用html代码输出,而是使用javascript脚本来输出内容,以避免被搜索引擎收录,通过js脚本操作dom输出内容的网站,其实大家都很熟悉 ,(腾讯qzone)早期的腾讯qq空间,就是通过js脚本输出内容的,因此,在早些时候,腾讯的qq空间是无法被搜索引擎收录的,直到去年年末这一情况才发生了改变。然而,通过脚本方式输出隐私内容也有一个不好的地方。虽然现在绝大部分搜索引擎无法解析js,但是随着搜索引擎技术的发展,加之ajax等互动技术的大量应用,相信未来的搜索引擎解析js应该是很正常的事情,那个时候,这个方法就失效了。不过,还是有替代的办法,例如使用图片输出隐私内容

3、 使用图片输出隐私内容

我们经常在注册的时候所看到的验证码,就是临时在线生成的图片文件,而非实现存储在服务器上,理论上,我们可以临时生成并显示任意字符的图片,可以将不希望被搜索引擎收录的内容,如电话号码,用图片的形式表现出来,最常见的例子是房产租售网站,例如(搜房网), (焦点房网)的二手房信息,联系人电话都是使用图片形式显示的,倘若搜索引擎能抓取识别图片——那基本上应该是几十年或者更晚的事情了。然而这种做法也有一个不利的地方,如果是大量的内容都用图片生成,那么无论是对服务器的负载也好,用户浏览器的下载速度,都会产生较大的负担。如果是大量内容,需要不显示在搜索引擎的结果页,建议使用robots协议限制搜索引擎抓取。

4、 使用robots协议限制搜索引擎抓取

搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件。如果你创建了一个robots.txt,在文件中声明该网站中不想被robot访问的部分或者指定搜索引擎只收录特定的部分,搜索引擎将会如你所愿地收录特定部分,忽略无法访问的部分。例如提供在线个人简历服务的一些网站(简历无忧)和 (个人简历网),他们的robots.txt协议中,就有如下句子Disallow:/resume/ 禁止访问用户简历存放的文件夹。而对于单个页面而言,也可以在meta标签处设置禁止搜索引擎索引该页面,写法如下: meta name="robots" content="noindex,nofollow" ,noindex意为不索引,nofollow意为不追踪本页面的所有文件。同时。百度还提供了一个很贴心的功能,百度快照可以缓存某个页面,有时候,百度快照也是泄露个人隐私的一种途径,百度支持通过设置网页的meta,防止搜索引擎显示网站的快照。方法如下:

要防止所有搜索引擎显示网站的快照,将此元标记置入网页的 部分:

<meta name="robots" content="noarchive">

要允许其他搜索引擎显示快照,但仅防止百度显示,使用以下标记:

<meta name="baiduspider" content="noarchive">

注:此标记只是禁止百度显示该网页的快照,百度会继续为网页建索引,并在搜索结果中显示网页摘要。

应用以上几种手段,我们基本上能做到尽最大的可能保护客户的隐私。如果各位读者有其他更好的办法,欢迎到笔者的博客搜索引擎优化(seo)及网站优化杂谈 http://www.001pp.com/ 与笔者交流,或联系qq:65499273,以上版权内容为本文不可分割之部分,转载须保留。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有