曾经试过只是更新几篇旧文章,将发布时间给重新更新,第二天site下网站,发觉多了一千多篇,证明过去的文章是被收录了不少,但我也试过如果是更新了那些被收录了的文章,第二天再site网站,数量变少了!
这些能给你带来点什么启发吗?
我通过这个屡试不爽,但却要我一篇篇的找有那些文章没有被百度收录真的很艰难,而且也不怎么可靠,有时还可能会中招,也就是将某个搜索引擎例如百度已经收录了的文章再次更新发布时间,这个结果被百度蜘蛛证实为欺骗行为(抓取不到可更新的内容,反而适得其反,把从前已收录的文章给删除掉不少,这个我可是有经验的)
当然了,可能我的网站只是新站,百度收录文章不稳定也是可能的,不知你们的情况如何,反正我的站内的文章是时而收录多了,时而却少了,呵呵!昨天2010年6月23日site:120center.com 还是15200,今天再次site却变成了13600,这个我真的是很纳闷的事情,不过我昨晚发布的1400多篇的文章几乎是完全被百度收录了的
好了,现在进入主题,以上的都是铺垫来的,由以上的经验使我有了一个开发一个小插件的冲动,这个插件的主要作用是:批量查询网站后台文章(没被百度等收录)从而批量更新发布时间
也就是批量查询后台文章是否被百度收录
插件加入批量更新发布文章,批量删除功能,可选具体栏目
可行性:例如查询:甲状腺瘤 site:120center.com
其中具体的一篇文章是(截图示:)
CMS类的文章生成的静态页面都有个具体的地址:而以上图显示的地址后存在:86920这文章特有的标识
通过查找得出以下结果:
[/url]
再查 869001
结果是这样的,以上二图表明如果没收录,得出的结果就是抱歉,没有找到与“869001 site:120center.com”相关的网页。这个就是这小插件的可行性的先决条件了
插件可以批量查询得到了结果,然后就批量更新这些文章(发布时间,录入时间等)当然还可以批量删除,支持单条结果操作,也可一键全站操作等
利用这个插件的作,将你站内的闲置文章(也就是没有被收录的意思)给再次发布(蜘蛛会来爬你的站,而且不会被认为是欺骗行为,因为根本不存在蜘蛛数据库内),当然这个值“86920”是不用变的
利用这个插件让可以使你的站天天保持更新,真正不会浪费你站内的每一篇文章,蜘蛛总会收录的,这样你就用不着天天去发文章了,省力省空间(这个很关键呀,我的站才5G空间,存在6万文章,却只收录1万多篇,其中有5万篇文章几乎是永远不会被网民所发现的,死文章
当然还有更多好的思路,让大家开发去咯,这些是我的点子,无尚奉献出来给大家研究了,这个多少也算是个发明创新思想吧,申请个专利可不为过哦,呵呵
适合所有网站系统,如果你有能力开发就行 专利我就不要啦,欢迎大家转载此文章,但求保留个链接就行:www.120center.com 谢谢 我的邮箱是sjbooks@163.com 欢迎大家交流
好消息:本人已经找人开发此插件,只开发二个小方面:批量查询(没被收录)及更新发布时间 其它的有待日后更新,希望有此兴趣的人士都加入到这个插件开发去,对你对他人都有很大好处的