在自己的網站通過投放GOOGLE廣告獲取收益,是多數站長所選擇的盈利模式。經常在網上看到一些朋友發帖,說自己網站又被GOOGLE K掉了,或者牢騷,或者無奈,或者大罵。我想,網站被K掉,絕不是偶然的,肯定存在著多方面的原因,盡管某些網站主信誓旦旦地保證他沒有任何作弊行為。當然,仍有一少部分精英網站主,頻頻采取作弊行為大賺GOOGLE廣告費卻不被K安然無事。下面從技術的角度來講解一下Google Adsense系統是如何防止點擊欺騙,希望對朋友們有一定的幫助和指導作用:)。
1] 點擊率 = 點擊次數/共瀏覽的次數。
點擊率是一個判斷是否有無fraud clicks的關鍵的方法,可以想像一個網站上的廣告的點擊率超過10%將意味這什麽。
2] 點擊覆蓋率/獨立IP ,這個分布裏如果有;單個IP 的(點擊/瀏覽)=點擊覆蓋率超出了3倍的系統誤差範圍內將有作弊的嫌疑。
例子,例如來自 129.119.200.1 的用戶瀏覽了 16個網頁,點擊了4個廣告,而整個廣告的點擊率「從[1]裏計算的到」是5%,那麽計算得到:%5 X 16 =~ 1,方差為Sqrt(1) = 1,點擊覆蓋率=4/1 = 4 ,根據數學上高斯分布,這種概率小於萬分之一。
3] 點擊率『點擊覆蓋率』/IP/時間
根據時間序列對點擊率進行分析,如果在某一個時間段上有明顯的峰值,那麽這將以為著有潛在的欺騙點擊的可能。
4] 網頁load的時間和 廣告點擊時間差的分析,以及每兩次click之間時間差序列的分析
[網頁load的時間和 廣告點擊時間差] 應該是一個泊松分布 possion distribution,而每兩次click之間的時間差也應該是一個Possion distribution,如果這個時間用秒記,大於25秒的話基本上呈現高斯分布的形狀。
5] 針對Proxy點擊的分析
改變IP進行點擊可以說在以往是最難以解決最難以發現作弊方式,大概國人進行Alexa的Boost時就多半采用了Proxy進行虛假點擊的方法,可是這裏只要通過反向監查IP的來源是否是帶有Proxy功能的服務器就可以知道了。
6] 針對 http_agent的分析
Http_agent/時間 的時間序列的分析,峰值超過3方差需要審查
7] 針對 http_referral 的分析
referral/時間 的時間序列的分析 ,峰值超過3方差需要審查
8] 整體效果上還有一個非常有用的量:
所有用戶的有效的每千次展示費用的均值/獨立IP
這個將能更加直接找到spam clicking 的運行計算機並且予以封殺。
從以上幾個判斷依據和公式,我們不難看出,GOOGLE反作弊系統是很容易判斷網站是否作弊的,以其想方設法去作弊,還不如多花點世間去做網站建設和網站推廣,只有用戶體驗好了,訪問量大了,收入自然增多。如我的新站,賽文加工貿易網 www.dgsaiwen.net ,一個為廣大加工貿易企業及從事加工貿易行業朋友服務的行業網站,今年春節才開始正式建站,到現在建站一個月,BAIDU和GOOGLE都有收錄,收錄的頁面達到70%,都算正常.
雖然也有在頁面上投放GOOGLE廣告,但我還未想過從中獲取收益,更多的世間仍然花在優化網站、增加內容和推廣上。當然,優化廣告體驗是必要的,但個人建議,在日IP訪問量未達到2000以前,沒必要考慮太多的網站收入問題,等到達了一定的訪問量,再開始考慮如何優化頁面上的GOOGLE廣告。記得有一句話:邪惡的人永遠比正義的人來的多,來的猛烈,所以,作弊仍然是存在的,如果你仔細研究理解了上述公式和算法,相信你也能“作弊”而不被GOOGLE發覺,當然,這必須是網站有大流量的前提下的,因為在大的訪問量的下,上面幾個作弊判斷依據才有可能被衝淡和模糊掉。