四、认识RSS
以下内容是为了让大家更加了解RSS,如果你对其不感兴趣,完全可以不看,它不会对你使用RSS阅读产生多大的影响。
1.Feed(提要)
博客以RSS文档形式为其内容提供一个提要,该RSS文档可以通过众所周知的URL获得。RSS文档是一个XML文件,它包含大量离散的新闻项,如某个博客中的入口项。由于RSS是XML格式文件,所以它很容易被其它程序所使用。
RSS聚合器是一个读取RSS文档并显示新闻项的程序。大多数聚合器只要输入RSS的URL,使得预定提要成为可能。
RSS使阅读博客便得容易。大多数经常阅读博客的开发人员都使用某种类型的聚合器来帮助他们有效地筛选提要内容。聚合器使得阅读博客的感觉就象是在阅读电子邮件,因为它们突出新闻项并将新闻项进行缓冲处理以便离线阅读。
还有一些在线RSS聚合器将RSS提要捆绑到某个单独的网站。其优点是易于设置并且可以从任何计算机存取你的提要内容。当然,其缺点也是显而易见的,那就是在阅读时必须始终保持连接。
RSS是博客成为一种强大的新型信息交流形式之根本所在。在网志出现之前,大多数开发人员为了要查找到需要的内容,通常要花大量时间来筛选掉那些令人讨厌的无关的信息。
博客通过让读者选择所要阅读的提要,将控制权交给读者,从而有效地构建自己的个性化内容流。
2.RSS版本
RSS的版本有很多个,0.90、0.91、0.92、0.93、0.94、1.0 和 2.0。要理解它们需要了解一些有关它们的历史背景。最初Netscape创建了RSS的最初版本0.90,起初的名字是“RDF Site Summary”或者“Rich Site Summary”(规范中说前者是正式名称)。Netscape创建RSS0.90用于其Web门户,这个时候,其他人看到了RSS的使用潜力。Userland Software是第一个开始将 RSS 用于其网志商业产品者之一。
版本 0.90 在很大程度上基于 W3C 的 Resource Description Framework (RDF)。许多人都认为 RDF 过于复杂,因此都建议出一个免费的简化版本 0.91。这个任务恰好就给了 Userland Software。Userland Software 便继续发展 RSS 的简化版本,随后出台的版本包括:0.92、0.93 和 0.94。为了强调其所做的简化工作,他们将 RSS 的全称定为“Really Simple Syndication”。
正当Userland Software继续专注于其简化工作时,另外一组开发人员在复兴最初的RDF版本(0.90),因为RSS号称自己更灵活。他们最终发布了一个RSS 1.0的版本,其正式名称还是“RDF Site Summary”。由于使用RDF,这个版本完全不同于 Userland Software所控制的版本。Userland Software当然不太愿意看到RSS 1.0似乎要取代其0.94版本的事实,于是出了一个新版本,并将版本号一下子跳到了2.0。
这就是今天的这种局面,形成了两个主要的竞争版本:一个基于RDF1.0,而另一个则是由Userland Software所开发的2.0,由于它们两个都共用相同的名字。就成为一种可怕的混乱,因为版本号导致人们误认为2.0是1.0的改进版本,而实际上它们是两个目标完全不同的规范。现在,另一组开发人员已经下狠心着手解决这种混乱问题,通过定义新的摘要(syndication)规范来与 RSS名字的随意性决裂。这个解决方案称为 Atom(原子)项目。
3.Atom(原子)
Atom是一个项目的名字,主要是开发一个新的博客摘要格式以解决目前RSS存在的问题(混乱的版本号,不是一个真正的开放标准,表示方法的不一致,定义贫乏等等)。Atom 希望提供一个清晰的版本以解决每个人的需要,其设计完全不依赖于供货商,任何人都可以对之进行自由扩展,完整详细说明。
除了定义新的摘要格式之外,Atom还希望定义一个标准的档案文件格式和一个标准的博客编辑API(Atom API)。
其实RSS1.0和2.0格式所包含的核心信息是相同的,只是其结构不一样罢了,这里我们不再继续深入的讨论这个问题,有兴趣的朋友可以去博客中国里了解相关知识!
4.blogroll
blogroll是博客页面提要的集合,大多数博客在其个人页面上都提供blogroll。这就允许读者连接到其他趣味和写作风格相投的人的网页上。Blogroll方便了网络上的沟通。通过使用Outline Processor Markup Language(OPML),人们可以用XML 格式文件交换blogroll。
大多数网志引擎都自己管理blogroll,每当读者请求blogroll时都自己产生相应的XML格式。同样,大多数聚合器(RSS阅读器)都能导入blogroll并自动预定所包含的摘要。