| 導購 | 订阅 | 在线投稿
分享
 
 
 

GOOGLE判断广告点击作弊的几个技术分析

2011-12-06 03:22:17  編輯來源:互聯網  简体版  手機版  評論  字體: ||
 
  在自己的网站通过投放GOOGLE广告获取收益,是多数站长所选择的盈利模式。经常在网上看到一些朋友发帖,说自己网站又被GOOGLE K掉了,或者牢骚,或者无奈,或者大骂。我想,网站被K掉,绝不是偶然的,肯定存在着多方面的原因,尽管某些网站主信誓旦旦地保证他没有任何作弊行为。当然,仍有一少部分精英网站主,频频采取作弊行为大赚GOOGLE广告费却不被K安然无事。下面从技术的角度来讲解一下Google Adsense系统是如何防止点击欺骗,希望对朋友们有一定的帮助和指导作用:)。

  1] 点击率 = 点击次数/共浏览的次数。

  点击率是一个判断是否有无fraud clicks的关键的方法,可以想像一个网站上的广告的点击率超过10%将意味这什么。

  2] 点击覆盖率/独立IP ,这个分布里如果有;单个IP 的(点击/浏览)=点击覆盖率超出了3倍的系统误差范围内将有作弊的嫌疑。

  例子,例如来自 129.119.200.1 的用户浏览了 16个网页,点击了4个广告,而整个广告的点击率「从[1]里计算的到」是5%,那么计算得到:%5 X 16 =~ 1,方差为Sqrt(1) = 1,点击覆盖率=4/1 = 4 ,根据数学上高斯分布,这种概率小于万分之一。

  3] 点击率『点击覆盖率』/IP/时间

  根据时间序列对点击率进行分析,如果在某一个时间段上有明显的峰值,那么这将以为着有潜在的欺骗点击的可能。

  4] 网页load的时间和 广告点击时间差的分析,以及每两次click之间时间差序列的分析

  [网页load的时间和 广告点击时间差] 应该是一个泊松分布 possion distribution,而每两次click之间的时间差也应该是一个Possion distribution,如果这个时间用秒记,大于25秒的话基本上呈现高斯分布的形状。

  5] 针对Proxy点击的分析

  改变IP进行点击可以说在以往是最难以解决最难以发现作弊方式,大概国人进行Alexa的Boost时就多半采用了Proxy进行虚假点击的方法,可是这里只要通过反向监查IP的来源是否是带有Proxy功能的服务器就可以知道了。

  6] 针对 http_agent的分析

  Http_agent/时间 的时间序列的分析,峰值超过3方差需要审查

  7] 针对 http_referral 的分析

  referral/时间 的时间序列的分析 ,峰值超过3方差需要审查

  8] 整体效果上还有一个非常有用的量:

  所有用户的有效的每千次展示费用的均值/独立IP

  这个将能更加直接找到spam clicking 的运行计算机并且予以封杀。

  从以上几个判断依据和公式,我们不难看出,GOOGLE反作弊系统是很容易判断网站是否作弊的,以其想方设法去作弊,还不如多花点世间去做网站建设和网站推广,只有用户体验好了,访问量大了,收入自然增多。如我的新站,赛文加工贸易网 www.dgsaiwen.net ,一个为广大加工贸易企业及从事加工贸易行业朋友服务的行业网站,今年春节才开始正式建站,到现在建站一个月,BAIDU和GOOGLE都有收录,收录的页面达到70%,都算正常.

  虽然也有在页面上投放GOOGLE广告,但我还未想过从中获取收益,更多的世间仍然花在优化网站、增加内容和推广上。当然,优化广告体验是必要的,但个人建议,在日IP访问量未达到2000以前,没必要考虑太多的网站收入问题,等到达了一定的访问量,再开始考虑如何优化页面上的GOOGLE广告。记得有一句话:邪恶的人永远比正义的人来的多,来的猛烈,所以,作弊仍然是存在的,如果你仔细研究理解了上述公式和算法,相信你也能“作弊”而不被GOOGLE发觉,当然,这必须是网站有大流量的前提下的,因为在大的访问量的下,上面几个作弊判断依据才有可能被冲淡和模糊掉。
 
 
 
  在自己的网站通过投放GOOGLE广告获取收益,是多数站长所选择的盈利模式。经常在网上看到一些朋友发帖,说自己网站又被GOOGLE K掉了,或者牢骚,或者无奈,或者大骂。我想,网站被K掉,绝不是偶然的,肯定存在着多方面的原因,尽管某些网站主信誓旦旦地保证他没有任何作弊行为。当然,仍有一少部分精英网站主,频频采取作弊行为大赚GOOGLE广告费却不被K安然无事。下面从技术的角度来讲解一下Google Adsense系统是如何防止点击欺骗,希望对朋友们有一定的帮助和指导作用:)。   1] 点击率 = 点击次数/共浏览的次数。   点击率是一个判断是否有无fraud clicks的关键的方法,可以想像一个网站上的广告的点击率超过10%将意味这什么。   2] 点击覆盖率/独立IP ,这个分布里如果有;单个IP 的(点击/浏览)=点击覆盖率超出了3倍的系统误差范围内将有作弊的嫌疑。   例子,例如来自 129.119.200.1 的用户浏览了 16个网页,点击了4个广告,而整个广告的点击率「从[1]里计算的到」是5%,那么计算得到:%5 X 16 =~ 1,方差为Sqrt(1) = 1,点击覆盖率=4/1 = 4 ,根据数学上高斯分布,这种概率小于万分之一。   3] 点击率『点击覆盖率』/IP/时间   根据时间序列对点击率进行分析,如果在某一个时间段上有明显的峰值,那么这将以为着有潜在的欺骗点击的可能。   4] 网页load的时间和 广告点击时间差的分析,以及每两次click之间时间差序列的分析   [网页load的时间和 广告点击时间差] 应该是一个泊松分布 possion distribution,而每两次click之间的时间差也应该是一个Possion distribution,如果这个时间用秒记,大于25秒的话基本上呈现高斯分布的形状。   5] 针对Proxy点击的分析   改变IP进行点击可以说在以往是最难以解决最难以发现作弊方式,大概国人进行Alexa的Boost时就多半采用了Proxy进行虚假点击的方法,可是这里只要通过反向监查IP的来源是否是带有Proxy功能的服务器就可以知道了。   6] 针对 http_agent的分析   Http_agent/时间 的时间序列的分析,峰值超过3方差需要审查   7] 针对 http_referral 的分析   referral/时间 的时间序列的分析 ,峰值超过3方差需要审查   8] 整体效果上还有一个非常有用的量:   所有用户的有效的每千次展示费用的均值/独立IP   这个将能更加直接找到spam clicking 的运行计算机并且予以封杀。   从以上几个判断依据和公式,我们不难看出,GOOGLE反作弊系统是很容易判断网站是否作弊的,以其想方设法去作弊,还不如多花点世间去做网站建设和网站推广,只有用户体验好了,访问量大了,收入自然增多。如我的新站,赛文加工贸易网 www.dgsaiwen.net ,一个为广大加工贸易企业及从事加工贸易行业朋友服务的行业网站,今年春节才开始正式建站,到现在建站一个月,BAIDU和GOOGLE都有收录,收录的页面达到70%,都算正常.   虽然也有在页面上投放GOOGLE广告,但我还未想过从中获取收益,更多的世间仍然花在优化网站、增加内容和推广上。当然,优化广告体验是必要的,但个人建议,在日IP访问量未达到2000以前,没必要考虑太多的网站收入问题,等到达了一定的访问量,再开始考虑如何优化页面上的GOOGLE广告。记得有一句话:邪恶的人永远比正义的人来的多,来的猛烈,所以,作弊仍然是存在的,如果你仔细研究理解了上述公式和算法,相信你也能“作弊”而不被GOOGLE发觉,当然,这必须是网站有大流量的前提下的,因为在大的访问量的下,上面几个作弊判断依据才有可能被冲淡和模糊掉。
󰈣󰈤
 
 
 
>>返回首頁<<
 
 
 
 
 
 熱帖排行
 
 
王朝网络微信公众号
微信扫码关注本站公众号 wangchaonetcn
 
  免责声明:本文仅代表作者个人观点,与王朝网络无关。王朝网络登载此文出于传递更多信息之目的,并不意味著赞同其观点或证实其描述,其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
© 2005- 王朝網路 版權所有