昨天,Stephen留在中国的Google Search Appliance 服务器到了。这次Google Search Appliance(简称 GSA)和去年用的那个google mini不一样,这个GSA基本上可以看做是google mini的升级版本吧。
Google推出GSA的目的是让那些信息量暴增的企业和机构能用它建立自己的搜索引擎。它支持的格式有220多种,你可以用它来抓取和收录自己的博客、网站、数据库和网络文件夹等等。它是机器和软件全部打包在一起的。
Google官方网站介绍:http://www.google.com/enterprise/search/gsa.html
Google Search Appliance 正面
主要特点有以下这些,随意看看就好:
- 有一个连接器管理工具,可以让你收录和那些非WEB格式的文档。如:word,pdf,flash 等等
- 如果使用 Feed API 和元数据搜索功能,可以为自己的论坛建立搜索功能。
- 还提供了强大的 Onebox 编程接口,可以让你在搜索结果中展现一些定制的信息。
- 强大的安全搜索功能支持多种身份认证方式,使用户在搜索结果中只见到自己有权限访问的文档。
- 为小规模文档设计了专门的网页排序算法。
- 用户可以定制搜索结果界面,甚至以 XML 格式的形式,来整合到您自己的应用中去。
这个对SEO也是非常有用的。为什么这么说呢?
你可以把这个GSA看做是google 的微缩版,它有爬虫,有索引库,有排序算法。它的的硬件和软件都是现在google.com这个网站正在用的东西。所以两者之间相似程度非常的高。我在过去操作google mini的时候已经证实:至少它的抓取机制和现在的google.com几乎是一摸一样的。
它的排序算法,我觉得也会有很大的相似度。当然不会一摸一样的,因为现有的GSA好像是依据06年的搜索技术改变而来,而以google每年450次的算法调整频率,到现在也相差比较多了。但是至少和现在的排序算法会有相当大的相似度。
还有一些有意思的东西,大家看上面提到的两个特点:“Onebox 编程接口”和“在搜索结果中只见到自己有权限访问的文档”。这其实就是现在google的一些应用。
Onebox在搜索引擎现有的排序算法中享有优先级,它的数据来源就是Google Base或其他google产品。这次GSA也提供了这种Onebox的编程接口,现在自己亲手给自己的GSA添加Onebox,一定会对你如何利用Onebox拿到更多流量有帮助的。
“在搜索结果中只见到自己有权限访问的文档”,这个就类似igoogle 。还有google其他一些产品,在搜索结果页面,你登陆了gmail看到的和不登陆看到的是不一样的。
还有更多的细节,会在以后详细讲述,会把GSA后台的操作也讲述一下。到时候你会对google webmaster tool这个工具有更深一层的理解。
下面直接上图,机器顶部:
GSA 机箱上印有大大的LOGO
机箱非常的重,可能有40多公斤。
为了保护里面的数据和硬件,机箱要用专用的螺丝刀才能打开。Google在服务器硬件上有很多专利的。
GSA 正面
Google Search Appliance 背面1
背面和一般的服务器没太大差别,但是注意它有一进一出两个网线口。设置它的时候需要用另一台电脑辅助。
Google Search Appliance 背面2
来一张google机柜里的图:
机柜
google mini (只有GSA一半大小)
利用GSA服务器做SEO测试,可以做出完美的SEO网页。
gsa侧面