| 導購 | 订阅 | 在线投稿
分享
 
 
 

GOOGLE判斷廣告點擊作弊的幾個技術分析

來源:互聯網  2011-12-06 03:22:17  評論

在自己的網站通過投放GOOGLE廣告獲取收益,是多數站長所選擇的盈利模式。經常在網上看到一些朋友發帖,說自己網站又被GOOGLE K掉了,或者牢騷,或者無奈,或者大罵。我想,網站被K掉,絕不是偶然的,肯定存在著多方面的原因,盡管某些網站主信誓旦旦地保證他沒有任何作弊行爲。當然,仍有一少部分精英網站主,頻頻采取作弊行爲大賺GOOGLE廣告費卻不被K安然無事。下面從技術的角度來講解一下Google Adsense系統是如何防止點擊欺騙,希望對朋友們有一定的幫助和指導作用:)。

1] 點擊率 = 點擊次數/共浏覽的次數。

點擊率是一個判斷是否有無fraud clicks的關鍵的方法,可以想像一個網站上的廣告的點擊率超過10%將意味這什麽。

2] 點擊覆蓋率/獨立IP ,這個分布裏如果有;單個IP 的(點擊/浏覽)=點擊覆蓋率超出了3倍的系統誤差範圍內將有作弊的嫌疑。

例子,例如來自 129.119.200.1 的用戶浏覽了 16個網頁,點擊了4個廣告,而整個廣告的點擊率「從[1]裏計算的到」是5%,那麽計算得到:%5 X 16 =~ 1,方差爲Sqrt(1) = 1,點擊覆蓋率=4/1 = 4 ,根據數學上高斯分布,這種概率小于萬分之一。

3] 點擊率『點擊覆蓋率』/IP/時間

根據時間序列對點擊率進行分析,如果在某一個時間段上有明顯的峰值,那麽這將以爲著有潛在的欺騙點擊的可能。

4] 網頁load的時間和 廣告點擊時間差的分析,以及每兩次click之間時間差序列的分析

[網頁load的時間和 廣告點擊時間差] 應該是一個泊松分布 possion distribution,而每兩次click之間的時間差也應該是一個Possion distribution,如果這個時間用秒記,大于25秒的話基本上呈現高斯分布的形狀。

5] 針對Proxy點擊的分析

改變IP進行點擊可以說在以往是最難以解決最難以發現作弊方式,大概國人進行Alexa的Boost時就多半采用了Proxy進行虛假點擊的方法,可是這裏只要通過反向監查IP的來源是否是帶有Proxy功能的服務器就可以知道了。

6] 針對 http_agent的分析

Http_agent/時間 的時間序列的分析,峰值超過3方差需要審查

7] 針對 http_referral 的分析

referral/時間 的時間序列的分析 ,峰值超過3方差需要審查

8] 整體效果上還有一個非常有用的量:

所有用戶的有效的每千次展示費用的均值/獨立IP

這個將能更加直接找到spam clicking 的運行計算機並且予以封殺。

從以上幾個判斷依據和公式,我們不難看出,GOOGLE反作弊系統是很容易判斷網站是否作弊的,以其想方設法去作弊,還不如多花點世間去做網站建設和網站推廣,只有用戶體驗好了,訪問量大了,收入自然增多。如我的新站,賽文加工貿易網 www.dgsaiwen.net ,一個爲廣大加工貿易企業及從事加工貿易行業朋友服務的行業網站,今年春節才開始正式建站,到現在建站一個月,BAIDU和GOOGLE都有收錄,收錄的頁面達到70%,都算正常.

雖然也有在頁面上投放GOOGLE廣告,但我還未想過從中獲取收益,更多的世間仍然花在優化網站、增加內容和推廣上。當然,優化廣告體驗是必要的,但個人建議,在日IP訪問量未達到2000以前,沒必要考慮太多的網站收入問題,等到達了一定的訪問量,再開始考慮如何優化頁面上的GOOGLE廣告。記得有一句話:邪惡的人永遠比正義的人來的多,來的猛烈,所以,作弊仍然是存在的,如果你仔細研究理解了上述公式和算法,相信你也能“作弊”而不被GOOGLE發覺,當然,這必須是網站有大流量的前提下的,因爲在大的訪問量的下,上面幾個作弊判斷依據才有可能被沖淡和模糊掉。

  在自己的網站通過投放GOOGLE廣告獲取收益,是多數站長所選擇的盈利模式。經常在網上看到一些朋友發帖,說自己網站又被GOOGLE K掉了,或者牢騷,或者無奈,或者大罵。我想,網站被K掉,絕不是偶然的,肯定存在著多方面的原因,盡管某些網站主信誓旦旦地保證他沒有任何作弊行爲。當然,仍有一少部分精英網站主,頻頻采取作弊行爲大賺GOOGLE廣告費卻不被K安然無事。下面從技術的角度來講解一下Google Adsense系統是如何防止點擊欺騙,希望對朋友們有一定的幫助和指導作用:)。   1] 點擊率 = 點擊次數/共浏覽的次數。   點擊率是一個判斷是否有無fraud clicks的關鍵的方法,可以想像一個網站上的廣告的點擊率超過10%將意味這什麽。   2] 點擊覆蓋率/獨立IP ,這個分布裏如果有;單個IP 的(點擊/浏覽)=點擊覆蓋率超出了3倍的系統誤差範圍內將有作弊的嫌疑。   例子,例如來自 129.119.200.1 的用戶浏覽了 16個網頁,點擊了4個廣告,而整個廣告的點擊率「從[1]裏計算的到」是5%,那麽計算得到:%5 X 16 =~ 1,方差爲Sqrt(1) = 1,點擊覆蓋率=4/1 = 4 ,根據數學上高斯分布,這種概率小于萬分之一。   3] 點擊率『點擊覆蓋率』/IP/時間   根據時間序列對點擊率進行分析,如果在某一個時間段上有明顯的峰值,那麽這將以爲著有潛在的欺騙點擊的可能。   4] 網頁load的時間和 廣告點擊時間差的分析,以及每兩次click之間時間差序列的分析   [網頁load的時間和 廣告點擊時間差] 應該是一個泊松分布 possion distribution,而每兩次click之間的時間差也應該是一個Possion distribution,如果這個時間用秒記,大于25秒的話基本上呈現高斯分布的形狀。   5] 針對Proxy點擊的分析   改變IP進行點擊可以說在以往是最難以解決最難以發現作弊方式,大概國人進行Alexa的Boost時就多半采用了Proxy進行虛假點擊的方法,可是這裏只要通過反向監查IP的來源是否是帶有Proxy功能的服務器就可以知道了。   6] 針對 http_agent的分析   Http_agent/時間 的時間序列的分析,峰值超過3方差需要審查   7] 針對 http_referral 的分析   referral/時間 的時間序列的分析 ,峰值超過3方差需要審查   8] 整體效果上還有一個非常有用的量:   所有用戶的有效的每千次展示費用的均值/獨立IP   這個將能更加直接找到spam clicking 的運行計算機並且予以封殺。   從以上幾個判斷依據和公式,我們不難看出,GOOGLE反作弊系統是很容易判斷網站是否作弊的,以其想方設法去作弊,還不如多花點世間去做網站建設和網站推廣,只有用戶體驗好了,訪問量大了,收入自然增多。如我的新站,賽文加工貿易網 www.dgsaiwen.net ,一個爲廣大加工貿易企業及從事加工貿易行業朋友服務的行業網站,今年春節才開始正式建站,到現在建站一個月,BAIDU和GOOGLE都有收錄,收錄的頁面達到70%,都算正常.   雖然也有在頁面上投放GOOGLE廣告,但我還未想過從中獲取收益,更多的世間仍然花在優化網站、增加內容和推廣上。當然,優化廣告體驗是必要的,但個人建議,在日IP訪問量未達到2000以前,沒必要考慮太多的網站收入問題,等到達了一定的訪問量,再開始考慮如何優化頁面上的GOOGLE廣告。記得有一句話:邪惡的人永遠比正義的人來的多,來的猛烈,所以,作弊仍然是存在的,如果你仔細研究理解了上述公式和算法,相信你也能“作弊”而不被GOOGLE發覺,當然,這必須是網站有大流量的前提下的,因爲在大的訪問量的下,上面幾個作弊判斷依據才有可能被沖淡和模糊掉。
󰈣󰈤
王朝萬家燈火計劃
期待原創作者加盟
 
 
 
>>返回首頁<<
 
 
 
 
 熱帖排行
 
 
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有