Office2003添加了许多实用而有趣的新功能,使用信息检索服务就是其中的一个,我在上个星期进“博客堂”中闲逛的时候发现开心就好发布了博客堂的全文检索服务,觉得这是一个很不错的功能,因此也下载了office2003的sdk,依葫芦画瓢自己开发了一个信息检索服务的范例,特此共享给大家。
信息检索服务可以让office中的所有工具使用网络上所有的信息检索功能(一种定制的web服务),作为用户,也可以开发或者添加其他的信息检索功能。
第一部分:安装和使用信息检索服务:
信息检索服务的截图:(这里我使用的是英文版的截图,与后面的截图稍有不同:p)
1. 使用信息检索服务的系统要求:
安装了office2003(beta版本也可)的各种windows操作系统。
此功能适用于office2003的各个部件,包括在word,excel,access等工具中使用,在安装了office2003以后,IE也可以使用这个功能。
2. 安装信息检索服务的步骤:
以微软中国mvp的博客网站为例,步骤如下:
打开word2003,点击工具->信息检索,此时word的右边会出现一个停靠栏,点击停靠栏下方的“信息检索选项”,将出现一个标题为“信息检索选项”的对话框,点击其左下的“添加服务”按钮,在地址栏内输入“http://blog.joycode.com/research.asmx”,点击“添加”按钮,并依次安装完就可以使用博客堂专用的信息检索服务了。
IE中的位置是主菜单->"查看"->"浏览器栏"->"信息检索".
二.开发信息检索服务:
1.开发一般的信息检索服务的系统要求:
微软office2003;
.NET框架1.0或后续版本;
.NET框架SDK1.0或后续版本;
MS VS.NET2002或后续版本;
IIS5.0或后续版本。
Office2003信息检索sdk(作为参考).
2.建立web服务:
在VS.NET中建立一个C#的web服务应用程序,添加两个服务方法:
[WebMethod]
public string Registration(string registrationXml)
{
}
[WebMethod]
public string Query(string queryXml)
{
}
注意:1)此服务类必须使用“urn:Microsoft.Search”的命名空间。
2)Registration方法和Query方法是必须的,其参数也必须按照上面的格式。
读取注册请求(Registration方法的参数registrationXml):
注册请求为一个字符串,此字符串为调用信息检索服务的工具(如word)发出,它实际上为一个xml文本,我们可以读取此字符串,也可以装载一个xml模板文件来实现。具体的格式可以参考office2003信息检索服务sdk。
写注册响应(Registration方法的返回值)
有3种方式可供选择用来写注册响应,一种是使用XmlTextWriter等Xml处理对象写,第二种是使用StringBuilder对象写响应,第三种是装载一个Xml模板文件并适当的修改它作为注册响应。
简便起见,我使用的是第三种方法:
XmlDocument registrationResponse = new XmlDocument();
//装载模板文件
registrationResponse.Load("e:\\test\\2ndResearch\\regResponse.xml");
XmlNamespaceManager nsm=new XmlNamespaceManager(registrationResponse.NameTable);
nsm.AddNamespace("ns", "urn:Microsoft.Search.Registration.Response");
//返回注册响应
return registrationResponse.InnerXml.ToString();
注意:在注册响应中,服务提供者(Provider)必须有唯一的ID,也就是说在返回给客户机的注册响应中服务提供者的ID不能与其他信息检索服务提供者的ID相同,否则此服务将注册失败。
读取检索请求(Query方法中的参数queryXml)。
类似的,检索请求也是一个可格式化为xml的字符串,其中包括了客户端检索工具的检索信息。我们仍然可以利用直接读取和装载模板文档这两种方式进行。
在这里我使用的是直接读取请求这种方法:
XmlDocument myDoc=new XmlDocument();
myDoc.Load(queryXml);
在已经格式化的Xml文档myDoc中,有几个节点值得注意,它们是:
QueryId节点,OriginatorId节点,QueryText节点以及Keyword节点的内容。
QueryId节点和OriginatorId节点的内容表示客户机信息检索请求的ID,而QueryText节点和Keyword节点的内容表示需检索的关键字信息。
下面用了一段代码来取出QueryText节点的内容(其他节点的处理方法类似):
XmlNamespaceManager xnm=new XmlNamespaceManager(myDoc.NameTable);
xnm.AddNamespace("urn","urn:Microsoft.Search.Query");
string searchWord=myDoc.SelectSingleNode("//urn:QueryText",xnm).InnerText;
写检索响应(Query方法的返回值)
读取了检索请求之后便可以根据其信息写检索结果了,书写检索响应仍然可以按照类似于书写注册响应的三种方法进行,在这里我是混用了几种方法。
先装载模板文档:
XmlDocument queryResponse=new XmlDocument(); queryResponse.Load("e:\\test\\2ndResearch\\queryResult.xml");
然后添加一些内容使它变得完整:
在检索响应中将显示在客户机界面上的信息由Range节点的内容决定,因此我对SQL Server中的Northwind数据库作了一个简单的查询,此查询的功能是返回在customer表中客户名包含检索关键字的记录:
private DataSet FindInfo(string searchText)
{
SqlConnection conn=new SqlConnection("workstation id=localhost;packet size=4096;user id=sa;data source=localhost;persist security info=False;initial catalog=NorthWind");
SqlDataAdapter da=new SqlDataAdapter("select * from Customers where CompanyName like '%"+searchText+"%'",conn);
DataSet ds=new DataSet();
da.Fill(ds);
return ds;
}
生成检索结果的Xml文档:
public string CreateResult(DataSet ds)
{
StringWriter resultWriter=new StringWriter();
XmlTextWriter xmlCreator=new XmlTextWriter(resultWriter);
if(ds.Tables[0].Rows.Count>0)
{
for(int i=0;i<ds.Tables[0].Rows.Count;i++)
{
xmlCreator.WriteStartElement("Results");
//中间略去…….
xmlCreator.WriteEndElement();
}
}
else
{
xmlCreator.WriteStartElement("Results");
//中间略去
xmlCreator.WriteEndElement();
}
return resultWriter.ToString();
}
然后将检索结果文档填入到响应文档(queryResponse)中:
XmlNamespaceManager nsmResponse=new XmlNamespaceManager(queryResponse.NameTable);
nsmResponse.AddNamespace("ns", "urn:Microsoft.Search.Response"); queryResponse.SelectSingleNode("//ns:Range",nsmResponse).InnerXml=this.CreateResult(ds);
最后返回响应文档:
return queryResponse.InnerXml.ToString();
注意:检索响应文档中必须有结果(查不到自己写一个“找不到内容”的结果吧),否则客户机将会报告异常。另外检索响应文档中的检索信息ID必须与检索请求信息的ID一致,否则将显示无法找到结果的错误。
3.编译,调试,和生成信息检索服务:
在调试环境下,可以顺便使用显示的IE来调试信息检索服务J.
4.下面是最终的结果:
第三部分.小结和参考:
信息检索是一种强大而有效的功能,此处仅实现了一个极为简单的例子。基于office信息检索sdk的参考,可以实现更复杂的检索服务。
信息检索服务的xml格式文档在office信息检索sdk中可以方便的找到,用户可以使用sdk作为参考进行开发,其中包括了Helloworld,google等几个例子。
注解:1.博客堂:微软中国MVP的博客网站,地址是:http://blog.joycode.com
2.开心就好:博客堂的版主,微软MVP.
3.office信息检索sdk(英文版)的下载地址:http://download.microsoft.com/download/0/1/8/018ec82d-a764-
4471-ac0f-6a08cca4cfcc/rssdk.msi
。