IBM ® 高级技术支持
IBM Dallas
2003 年 9 月
与 Carol Rigdon 见面,她谈到了客户如何实现信息集成、信息集成如何运作以及它对于企业意味着什么。
Carol Rigdon 是 IBM 高级技术支持部门的顾问级 IT 专家。自 1994 年以来,她在不同的 IBM 部门里为跨平台和跨供应商数据库产品提供支持,并在目前支持 DB2® Connect™、DB2 DataJoiner®、DB2 复制和 DB2 Information Integrator™。Carol 在 DB2 大家庭中是声名卓著并且广受尊敬的,在很长一段时间里,她是许多 IBM 员工和客户在 DataJoiner 方面“要请教的人”。
DB2DD:Carol,您在高级技术支持部门中从事何种工作?
Carol:高级技术支持部门的成员为 IBM 销售部门在全美洲(北部、中部和南部)范围内提供技术支持。我们每天都和销售人员以及客户打交道。我们百分之百参与了我们所支持的产品的整个过程,从在需求阶段和开发人员合作,到和销售人员合作以了解如何使产品满足客户需要(中间经过对客户的战略规划阶段和实现阶段)。我们还参与关键客户的现场支持,并在问题确定和解决方面有很强的技能。我们经常为缺陷支持提供辅助。我们开发课程资料,指导专题学术讨论会,直接和参与 beta 测试项目的客户一起工作,并当客户考虑使用 IBM 产品时开发概念验证。
DB2DD:这种与客户的合作会使您有一个独特的视角吗?
Carol:是的,的确如此。与大多数 IBM 员工相比,我们有着更广泛和更深刻的了解。我们知道它在现场是什么样的!我们的观点是实际的而不是理论上的。如果您现在就想知道怎样使用它,请告诉我们。
DB2DD:Carol,我知道您的专长是信息集成、联邦(federation)和复制。您已经在 DataJoiner 和 DataPropagator™ 方面与客户合作多年了,并且您现在正在用 DB2 Information Integrator 把那些技能提升到一个新的高度。您的客户告诉您他们将使用 DB2 Information Integrator 做些什么呢?
Carol:DB2 Information Integrator 可以用来解决客户的许多许多问题。在过去,异类复制(即从 DB2 数据库复制到非 DB2 数据库)曾经引起人们的兴趣。现在人们经常问我有关联邦(即通过一个单一接口直接访问各种类型的数据)的问题。通过使用联邦,客户应用程序可以通过单一接口访问以多种形式存储的数据。几乎每个与我交谈的客户都有数据存储在至少两个关系数据库中的情况。通常,数据种类的多样性是惊人的。每种类型的数据都有其自身的访问方法、其自身的安全性要求和特定于使用它的应用程序的一个数据模型。需要从每个数据“岛屿”获取信息的应用程序必须编写其自己的“桥”。DB2 Information Integrator 则提供这座“桥”。
DB2DD:我们提到了“联邦”这个词。什么是联邦,它能解决什么问题?
Carol:联邦是一个中间件,它提供一种方法来访问您的各种不同的数据源,就像它们在同一位置一样。联邦在数据库级别集成数据,而不是分别访问每个数据源,然后尝试您自己或者通过您的应用程序结合并集成数据源。
它的强大之处在于它使您能够访问企业中所有的数据。无论您的数据是在多个平台、多个供应商数据库、XML 文档、平面文件、Excel 电子表格还是 ODBC 数据源中,您都可以访问它,就像它在 DB2 中的一个数据库中一样。不仅如此,您可以使用 DB2 的所有功能来操作该表。您可以进行分布式连接、为分布式数据创建视图、使用查询工具来分析分布式数据并将数据复制到其它地方。由于应用程序是使用 DB2 接口写成的,因此程序员只需知道一种数据访问方法。
DB2DD:这是否意味着联邦对应用程序开发有正面的影响?
Carol:一点不错。我们的开发者进行了若干练习/测试来确定使用联邦缩短应用程序开发周期的好处。发布于 DB2 开发者园地的 Cindy Saracco 所著的系列文章中谈到了他们的非常有积极意义的发现。
DB2DD:听起来不错。刚刚您提到,如果现在就想使用它,我找您就可以了。您能用非常简单的术语解释一下它是如何工作的吗?
Carol:首先请安装 DB2 Information Integrator。您会有一个 DB2 关系引擎。您还有包装程序,它们是向远程数据源(可能是 DB2 UDB、Informix、Microsoft SQL Server、Oracle、Sybase、Teradata、一个结构化平面文件、一个 XML 文档、一个 Excel 电子表格、一个 ODBC 数据源、来自文档库的非结构化数据的主机、电子邮件系统或 Web 甚至是来自 Life Sciences 应用程序的数据)发出请求的 DB2 II 程序。您可以使用连通性功能,它们也提供对 Web 服务、WebSphere MQ 和 OLE DB 源的访问。
如果您想要访问关系数据源,请安装并配置用于该数据源的客户机程序。例如,如果您想要访问 Oracle 数据库,请在您的 DB2 II 服务器上安装并配置 Oracle Net8。
对于每个您要访问的数据源,定义一个包含该数据源的位置和名称的服务器,然后定义用户映射来把 DB2 II 用户标识映射为远程用户标识。然后您定义一个昵称。每个昵称都是 DB2 II 目录中的项,它指向远程数据源中的一个表或视图。当您为一个关系数据源创建昵称时,远程表或视图的信息会从数据源目录中抽取出来,并存储在 DB2 II 目录中。该信息包括列名和数据类型映射、索引信息和统计信息。所有这些工作都使用 DB2 控制中心(Control Center)来完成。
DB2DD:如果数据源不是关系数据库怎么办?
Carol:DB2 II 昵称可指向结构化平面文件、XML 文档或者一些其它的非关系对象。如果没有与非关系数据源相关联的目录或字典,那么在定义昵称的时候,您必须提供字段/列信息。
DB2DD:当我发出引用了一个昵称的 DB2 SQL 时,会发生什么状况?
Carol:DB2 引擎根据目录中的信息和从包装程序接收的信息对语句进行优化。这些信息包含远程表的统计信息、索引和数据类型映射。全部或部分语句被发送至远程数据源。我们称之为“叠加(pushdown)”。如果 DB2 SQL 包含一个远程数据源中所没有的 DB2 功能,那么 DB2 II 将检索该数据并在本地应用该功能。我们称之为“补偿”。如果 DB2 SQL 包含比较或需要排序,并且数据源的排序序列与 DB2 II 排序序列不同,则 DB2 II 将在本地检索数据并将其排序。可以设置服务器选项来改变 DB2 II 处理针对不同数据源类型的 SQL 的方法。基本上,DB2 II 试图分解查询以便在确保正确响应的同时把流过网络的数据量降到最低。
DB2DD:结果会怎样?
Carol:DB2 SQL 语句的结果以标准的 DB2 格式(也可以选择以 XML 文档提供结果)发回给用户。
DB2DD:据我所知,您参与了 DB2 Information Integrator 的 beta 测试项目。您看到哪些类型的客户在使用这些联邦功能?
Carol:相当多的来自不同行业的客户在使用联邦。我所看到的一些联邦的应用程序有:
通过联邦跨数据仓库和实时生产映象的访问来增强商业智能平台
提供一个统一的跨部门或分部的报告工具的视图
从各种数据源构建一个合并的视图以分析过去的业务历史记录和活动
当要从不同位置查找库存数据时,实时地管理库存以降低成本
通过提供包含所有客户资产和交易(不管它们存储在何处)的客户视图来改进客户关系管理
支持在迁移周期中旧数据库和新数据库的共存。
我们的 beta 测试客户来自许多不同的行业,包括金融服务业、制造业、保险业、零售业、生命科学卫生保健行业、电信业、教育行业、运输业和政府部门。
DB2DD:Carol,我知道您在复制方面以及联邦方面都有许多经验。为什么有的客户会选择复制而不是联邦呢?
Carol:联邦为您提供实时访问功能,并且现有的系统/应用程序无需更改。这对需要当前数据的应用程序来说,无疑是最佳的解决方案。
然而,不管其使用什么工具,在低速率的网络上的远程用户可能无法及时并直接地访问数据。对于那些用户,访问本地存储的数据将更高效。复制可以使本地数据保持最新。您可以将您的各部分企业数据分配到多个地方来提供本地访问以得到改善的性能和可用性。您可以将多个地方的数据合并到一个中心运营的数据商店或数据仓库中。但是,应该始终牢记复制是一个异步过程,因此会有等待时间。在任何特定的时刻,都可能有未完成的更改,虽然更改已在源服务器端发生,但还没有复制。复制的数据始终保持一致,但它可能不是当前的数据。
DB2DD:复制如何与 DB2 Information Integrator 一起使用?
Carol:复制实际上是两个过程,一个是捕获数据库更改的过程,另一个是在目标上应用这些更改的过程。如果您正在从 DB2 数据库中复制数据,那么捕获过程是基于日志记录的。如果您想要从非 DB2 关系数据库中捕获更改,那么捕获过程被实现为一组触发器。因为 DB2 II 使关系数据源看上去很像 DB2,所以复制应用程序可以将更改应用到昵称上,就像这些昵称是 DB2 表一样。复制中心(Replication Center)用来在 DB2 和非 DB2 数据库之间定义复制。
事实上,复制是一个很好的 DB2 应用程序的范例,它利用联邦来扩展到 DB2 数据以外的数据。您可以从 DB2、Oracle、Informix、Sybase 或者 Microsoft SQL Server 的表中复制数据。您可以向 DB2、Oracle、Informix、Sybase、Microsoft SQL Server 或 Teradata 表复制数据。
DB2DD:您提到过您与客户的交流给了您一个独特的视角。那么,您认为这种新的联邦功能将怎样改变业务呢?
Carol:当我们说这将给您透明地访问企业中的所有信息的能力时,这是一个令人兴奋的想法。我们以前从未能够以如此大的规模做到这一点。您可以用一种以前从未尝试过的方法分析和管理您的数据。很多时候,应用程序设计和体系结构一直受在正确的位置或采用正确格式的数据的可用性的制约,而与企业需求无关。DB2 Information Integrator 除去了这种制约。IT 机构正在寻找降低成本的方法。管理冗余数据被视为集成信息所必须遭受的一种“不幸”,因为它引入了巨大的硬件和管理成本。联邦使他们能够集成数据,而不会增加应用程序类方面的成本,客户们对这一点非常感兴趣。
DB2DD:非常感谢您,Carol。我们谢谢您提供的精辟的见解。
Carol:不必客气。
声明
所有关于 IBM 未来方向或意向的声明都可以随时更改,而不另行通知,它们仅仅表示了目标和意愿而已。