大型的专利组织都抱有双重目标:一方面简化电子专利编档,另一方面保持这种档案在部门之间的兼容性。这方面努力的背后,XML 技术发挥着领导作用,围绕着专利编档的 XML 格式进行了很多思考和工作。本栏目中,Uche Ogbuji 分析了 XML 专利电子编档的背景,并和专利专家 Carl Oppedahl 讨论了 XML 编档的实际情况。
United States Patent and Trademark Office (USPTO)一直努力将电子编档付诸实践。对于一个主要职责就是和关注未来的客户打交道的部门而言,这并不奇怪。况且大型专利部门要处理海量的数据,他们需要能得到的一切帮助来保持数据流的清晰。从 1998 到 2000 年,USPTO 为专利文档开发了 SGML DTD,2000 年该机构开始把目光投向 XML,启动了一项新的计划,准备到 2002 年开发出 XML DTD。这项研究还扩展到了和商标有关的文档。
这一努力中 USPTO 并不孤单,还有其他两家大型专利机构: European Patent Office (EPO)和 Japan Patent Office (JPO)。后者是电子编档的先驱,可以追溯到 1990 年。其中作为协调专利机构的国际权威, World Intellectual Property Organization (WIPO) 正致力于关于专利编档和处理的数据交换的标准化。WIPO 标准称为 Electronic Patent Cooperation Treaty (E-PCT)或 Annex F。它包括一组 XML DTD,类似但不同于大型专利机构开发的那些 DTD。本文简要讨论标准电子专利编档的 WIPO XML 格式,并就 XML 有关的专利编档与一位专家进行探讨。
E-PCT DTD
从 WIPO 网站上查找真正的 XML DTD 碰了几次壁后,我终于在 OASIS Cover Pages(请参阅 参考资料)上找到了 2001 年 6 月的专利申请主体的 E-PCT DTD 工作草案。该模式显然是由理解 XML 并了解信息体系结构的人设计的。非常清晰,任何熟悉 XML 的人即使不了解专利编档也可以使用。
我发现该 DTD 中主要的毛病是一些完全不必要的缩写。多数元素都涉及散文体的内容,遵循类似 XHTML 和 Docbook 的惯例(尽管名称和那些标准不一定相同)。表格模型基于人所共知的 CALS 标准,其中包括用于个人以及组织名称、地址、文献引用和专利交叉索引的设计好的内容模型。它还包括 MathML DTD 以处理公式(化学和数学公式也可以作为特殊类型的图片包含进来),并提供了生物学数据参考。元数据元素提供了专利专用的元数据,但多数和编档有关的法律细节似乎要留待其他 DTD 完成。
专利电子编档还具有互操作性吗?
USPTO 所支持的电子编档方法需要使用一个名为 PASAT 的应用程序编辑专利申请,还有一个应用程序 ePave 用于提交和其他任务。对 PASAT 的不满可以看作是电子编档没有推广的原因之一,但因为其输出是 DTD 已公开的 XML,应该能够使用任何适当的工具编辑,这种能力被称为 跨平台的编档。可以选择的一种工具称为 PatXML,来自 EPO。另外一种是 PCT-SAFE Editor (PSE),WIPO 提供的 E-PCT 编档工具。这两种工具都支持导出到 USPTO XML 编档格式。开发 Annex-F 的最终目标之一是使所有编档人员能够选用喜欢的任何编辑工具——无论是专利机构开发的还是商业软件厂商提供的——并且所有主要专利机构都能够电子化地归档所生成的申请。人们期望 XML 在所有这类系统中的应用能够加速整合的进程。
与 Carl Oppedahl 的对话
Oppedahl & Larson LLP 法律服务公司提供专利、版权、商标和其他知识产权服务。他们以紧跟技术前进的步伐而自豪,事实上他们很早就出现在 Internet 上并获得了域名“patents.com”。他们也是基于 XML 的电子编档方式的最早采用者之一,发表了一些有用的文章指导此类系统的应用。这些文章在有关 XML 驱动的系统之间的互操作性问题方面提供了有趣的经验。
我就跨平台编档的实际问题采访了Oppedahl & Larson LLP 的合伙人 Carl Oppedahl,从他的文章中我得知他在技术(包括 XML)和法律方面都有渊博的知识。
Uche Ogbuji:业界对 PASAT 抱怨什么,为什么一些用户喜欢用 PatXML 和 PCT-SAFE?Carl Oppedahl:PASAT 是十多年前开发的,人们发现这个程序不太稳定——有时候会突然崩溃,所做的工作也丢失了。其他的编辑工具如 PatXML 和 PCT-SAFE Editor 是最近开发的,更加稳定。 还有一个区别可能对某些用户很重要,PCT-SAFE Editor 是一种有效的 XML 编辑器,其用户界面符合人们对标签式(如 HTML、SGML 或 XML)编辑器的期望。使用 PCT-SAFE Editor 创建和编辑——也需跨越好几天——的文件是一个 XML 文件。 也许最好把 PASAT 和 PatXML 称作 XML“编辑工具”。这些程序创建的文件都采用某种非 XML 的私有格式。作为用户,您可以单击一个按钮“导出 XML”,这时候程序将创建一个新的文件,这个文件是一个 XML 文件。 因此对一些用户而言——比如在使用电子编档专利申请之前已经熟悉 HTML 编码的用户,PCT-SAFE Editor 可能提供了一种更加熟悉的用户界面。
UO:您用过专利申请不是 XML 格式的电子编档工具吗?如果是这样,XML 的应用对用户的体验有很大的影响吗?