每天都有大量广告主的营销项目上线,有数以亿计的网民看到广告、点击广告或者访问营销网站。当广告主们定期查看自己所谓的项目报告上完美数据表现时,是否会怀疑这样一个问题:这些流量是真实的吗?
这个问题其实没有人能够准确的回答。但是通过一些监测与分析手段总能够辨析一二。谷歌与百度这样的大公司有专业的反作弊团队;网络营销市场上,也有许多第三方的监测技术解决方案;在美国还有专门的公司发布流量作弊的报告……
俗话说,道高一尺,魔高一丈。流量造假总是与这些反作弊团队与技术工具持续斗争与前进,事实上已寄生于网络营销的整个过程。
本文将“陈列”常见的流量造假方式与基本原理,争取让读者有个清晰的认识。
初级阶段:
在 Cookie 与 IP 不变的情况下,反复地点广告。 作弊水平:★
造成广告的点击增加,如果造假者愿意(等点击后的页面打开),还能造成登陆页(Landing Page)的页面浏览量(PV)增加。
在 Cookie 与 IP 不变的情况下,反复地刷新页面。作弊水平:★
从广告的角度,会造成曝光(Impression)增加;从推广网站的角度,会造成页面的PV增加。
总结
在这个阶段的流量造假,是非常简单粗暴的,基本上所有的专业监测工具都能发现这种愚昧的行为。尽管如此低级,这种流量造假的组织或者个人还是乐此不疲。因为这种方式效率高且技术含量低,编程容易实现。有时连自然人也会参与,他们与流量有着直接的利益关系。
危险提示:请勿对自己 Google Adsense / 百度联盟 广告进行尝试,否则保证一周内收到协议中止邮件。
中级阶段:
一定频率地清除 Cookie 或者不支持 Cookie。作弊水平:★★
反复地清除 Cookie,对于程序来说非常容易实现。很多监测工具的监测是基于 Cookie 的。Cookie 的清除,意味着每一次的访问都是一个新的独立访问者(Visitors)。
召唤肉鸡,或者购买流量。 作弊水平:★★★
互联网有大量的电脑是中了病毒,成为了黑客轻易控制的肉鸡。黑客们会经常像将军般指挥成千上万的电脑工作,最简单的工作就是打开某些网站,或者点击某些广告。有些组织或者个人,会花10块钱购买流量进来,这些流量其中一部份就是黑客们提供的,然后卖出的广告资源却能赚100块。如果没有分析师去监控网络营销的效果,可能许多线上营销的钱容易打水漂。
总结
这是时下最普及的造假方式,造假者不仅追求流量的增涨,还开始了海量化,并且具有基本的反侦查能力。然而这种造假还是较容易被发现。前提是你必须使用第三方监测!这里有两条建议:
选择专业的第三方监测工具,这是获取数据分析的前提
一个专业的监测工具,能帮助收集足够的信息,而这些信息是打击造假的重要证据。比如广告监测工具,可以监测到广告点击者的 IP 与 Cookie。那么在监测工具中生成的报告中,就很清楚地看得出:前面提到的情况一中同一个 IP 的人在变化 Cookie 在进行点击。
关注曝光与点击频次,以及点击前曝光频次
大部分广告点击是在头几次曝光时发生的,而且一般点击频次与曝光频次都是有固定的值,作弊的流量会发现各种奇怪的现象。
关注点击的来源
从技术上,点击发生后到达指定网站是可以获取点击来源的,这能够帮助做更深入的分析。如下图中就有各种相关属性供监测工具获取,如提到的 Referer。
从互动层面去逻辑分析。
不要仅仅停留在曝光、点击、访问、页面浏览量这种“数量”式的度量上,更多的还需要考虑二跳率(即 1 - Bounce Rate),转化情况这种“互动”式的度量上。买来的流量,或者不相关的流量,自然地互动参与程度就会很低。
高级阶段:
一定频率地更换IP,甚至连Cookie也一起清除。作弊水平:★★★★
这种方法能让一台PC造成上成千上万个独立访问。不过变化IP地址实现起来较为复杂,变化IP地址段更为难实现。最简单的更换IP方法就是通过不固定IP的宽带拨号上网,但IP段一般不会有大的变化。所以如果有组织能采取这种方式作弊,说明已具体较强的技术实力与网络资源,基本上广告端的监测工具就开始捉襟见肘了。
剥离监测代码,到处乱放,或者软件虚拟执行。作弊水平:★★★
广告的监测代码不是绑定的也不是加密的,可以随意的剥离,到处使用。比如广告主A 的广告代码可以加到广告主B 的广告素材中。这样广告主B 的广告显示了,广告主A 也被统计了。这种作弊,是屡见不鲜了。
另外还有是软件虚拟执行,只需要一台服务器,一个程序即可。
引入流量,程序控制并点击指定广告链接、指定推广页面的链接。 作弊水平:★★★★★
前面谈过从“互动层面”进行分析可以很大程度上发现流量造假。可是如果流量访问后,再进行点击怎么办呢?这时“互动层面”的分析方法就开始受到挑战了,可能会行不通。厉害的作弊者能够模拟海量访问者的行为分布,通过建立算法模型,控制程序点击网页上的各种特定链接,以及更深层页面的各种链接。
这是非常高级的流量造假,这种情况下,二跳率的数值可以优化得看似非常的完美,甚至是极度不可思议的高。专业的“造假师”,可以让访问者分散地点击页面中的关键内容,并控制二跳率在合理的范围内。这样,你会发现,自己的登陆页数据表现惊人的好,而且用户的点击分布也非常的合理。
总结
这个层次的流量造假已经开始兴起,并且呈整合之势(即情况一、二、三相互结合)。这时候普通的监测工具已经是完全失效了,这时需要的是专业的第三方监测工具与有经验的分析师。分析师可以配合工具的各种图表从数据结构、流量漏斗(Traffic Flow)、自定义监测、创新度量多个角度来结合分析。就像破案,再悬疑的奇案,好侦探也能破案。
总的来说,流量造假离不开四个元素:IP、Cookie、Browser、Click,通过对四个元素的控制与变化,让监测工具表现上难分虚实。
流量造假已经是互联网的一个产业,是一个潜规则,是许多网站赖以生存并持续发展的兴奋剂。本文只不过是皇帝的新衣中的小男孩,说几句话实话而已。不管在中国乃至世界流量造假现象如何猖獗,假的始终是假的!它们都有蛛丝马迹能被分析师发现他们的虚假性。当然不排除有组织或者个人能够制造中与正常流量几乎一致的假流量。但相信与其制造这种高质量的假流量,还不如真真实实地把自己的网站做好,吸引网友来得划算。
最后对于网站所有者,希望踏踏实实地建站;对于广告主,希望小心翼翼地花钱。最后引用饭否最近的一篇热文来结束本文:钱,不是这样赚的。