Internet Explorer 编程简述（十）响应来自HTML Element的事件通知——几个好用的类

关键字：HTML Element, Sink

1、概述

实现了对Webbrowser的resuing之后我们便会发现有时候我们还需要处理浏览器中的元素（HTML Element）。这种处理包括主动和被动两个方面，像《FAQ：如何访问WebBrowser的滚动条》、《FAQ：操纵下拉列表》、《FAQ：两种方法访问多层嵌套的frame》等文章所演示的就是主动的处理。通常我们从Webbrowser获得一个Web文档接口（IHTMLDocumentx），从它出发便可访问到浏览器所包含的一切HTML元素。而被动的处理则是在COM技术中称为Sink的技术，我更喜欢的说法是事件通知。当文档的下载进度发生变化时，我们可以获得ProgressChange通知，当Webbrowser下载完HTML文档时，我们可以获得DocumentComplete的通知，而当链接被点击，或图片被拖动时，我们如何获得通知呢？本文希望能够给出部分的答案。

2、HtmlObj Template

如何Sink一个HTML Element并不是本文的重点，其理论我不是太了解，也懒得去搞透彻，所以使用现成的库来实现。CodeProject上的一篇文章《CHtmlObj Template》给出的一个模板类CHtmlObj就非常好用。下面的例子是针对Html Anchor Element的一个实例化。

#include "HtmlObj.h"

class CHtmlAnchorElement : public CHtmlObj<IHTMLAnchorElement,

&DIID_HTMLAnchorEvents>

{

public:

CHtmlAnchorElement(CHtmlDocument2* pParentDoc2);

virtual ~CHtmlAnchorElement();

virtual HRESULT OnInvoke(DISPID dispidMember,REFIID riid,

LCID lcid, WORD wFlags,

DISPPARAMS * pdispparams, VARIANT * pvarResult,

EXCEPINFO * pexcepinfo,

UINT * puArgErr);

};

HRESULT CHtmlAnchorElement::OnInvoke(DISPID dispidMember,

REFIID riid, LCID lcid, WORD wFlags,

DISPPARAMS * pdispparams, VARIANT * pvarResult,

EXCEPINFO * pexcepinfo,

UINT * puArgErr)

{

HRESULT hr = E_NOTIMPL;

switch(dispidMember)

{

case DISPID_HTMLELEMENTEVENTS_ONMOUSEOVER :

{//当鼠标经过链接时，我们在这里获得通知

hr = S_OK;

// TODO: add code to handle on mouse over events

break;

}

case DISPID_HTMLELEMENTEVENTS_ONMOUSEOUT :

{//当鼠标从链接上移开时，我们在这里获得通知，其它的Dispatch ID可根据需要添加

hr = S_OK;

// TODO: add code to handle on mouse out events

break;

}

default:

{

break;

}

return hr;

}

当我们得到某个链接的HTML接口指针，便可调用CHtmlAnchorElement继承自CHtmlObj的SetSite(IUnknown *pUnkSite)成员函数传入该接口指针。在CHtmlObj类内部用一个智能指针m_spHtmlObj来保存相应的HTML Element接口指针，所以当上面的ONMOUSEHOVER和ONMOUSEOUT两个事件通知到达时，从m_spHtmlObj就可以访问IHTMLAnchorElement的所有成员，如从href获得链接的Url等，此处不再赘述。

3、CHtmlElements类

有了CHtmlObj之后我们又会发现实践中常常会需要多个相同类型的CHtmlObj。比如包含Frame的网页中每个Frame的HTML Document都需要一个CHtmlObj来Sink其事件。所以我们还需要有效地管理这些相同类型的CHtmlObj。下面是我写的一个简单的模板类CHtmlElements，它通过CMap来管理多个CHtmlObj对象。

template<class THtmlElement> class CHtmlElements

{

typedef CMap<LPDISPATCH, LPDISPATCH, THtmlElement*, THtmlElement*> CMapDispToHtmlElement;

CMapDispToHtmlElement m_htmlElements;

BOOL IsSiteConnected( LPDISPATCH pDisp )

{

THtmlElement *pElement;

return m_htmlElements.Lookup( pDisp, pElement );

}

public:

CHtmlElements(void)

{

}

~CHtmlElements(void)

{//m_htmlElements会自动释放所管理的内存

}

public:

void SetSite( LPDISPATCH pDisp )

{

if ( IsSiteConnected( pDisp ) ) //检查以避免多余的Sink

{

return;

}

THtmlElement *pElement = new THtmlElement; //通过模板类型创建相应的类的实例进行连接

pElement->SetSite( pDisp );

m_htmlElements.SetAt( pDisp, pElement );

}

};

假设我们有一个象CHtmlAnchorElement那样派生自CHtmlObj的类CHtmlDocument2，使用CHtmlElements时这样声明：

typedef CHtmlElements<CHtmlDocument2> CHtmlDocuments;

typedef CHtmlElements<CHtmlAnchorElement> CHtmlAnchors;

class CMyView : public CHtmlView

{

private:

CHtmlDocuments m_htmlDocs;

CHtmlAnchors m_htmlAnchors;

}

在DocumentComplete时就可以这样连接到浏览器的文档对象：

void CMyView ::OnDocumentComplete(LPDISPATCH pDisp, LPCTSTR lpszURL)

{

m_htmlDocs.SetSite(pDisp);

}

如果想一次性连接上文档中所有的Anchor Element，可以通过IHTMLDocument2::get_anchors获得包含所有IHTMLAnchorElement接口指针的IHTMLElementCollection，再遍历其中的每个元素，分别调用m_htmlAnchors.SetSite即可。当然，一次性的Sink全部链接可能并不是个好注意，我更愿意在CHtmlDocument2中响应事件再通过其它手段来访问当前位置的HTML Element。

4、结论

响应HTML Element的事件通知对于浏览器编程来说是一个非常强大的手段，它可以更深入细化地控制浏览器中的文档及其HTML元素，实现更为高级的功能，比如所谓的“超级拖放”（许多多窗口浏览器都提供了该功能，但实际上没有哪个浏览器完美地实现了对URL、文字及图片的拖放）。

5、参考资料

Codeproject: HtmlObj Template

引用地址：《Internet Explorer 编程简述（十）响应来自HTML Element的事件通知——几个好用的类》