分享
 
 
 

具有自动查找Web页面上所有链接的网络浏览器

王朝delphi·作者佚名  2006-01-08
窄屏简体版  字體: |||超大  

具有自动查找Web页面上所有链接的网络浏览器

1. 概述

WEB的应用已经深入到现在社会的方方面面,作为一个软件开发人员或其他技术人员,都有可能遇见在Internet上查询大量的资料和信息的情况,一般来说用的最多的就是WEB的搜索Engine。当我们使用它查出大量的资料链接后,还有可能遇到更多的链接,但要自己去看他们是否是链接,那确实是一件很麻烦的事情。这篇文章就是来讲,如何用Delphi的MSHTML_TLB.pas来开发一个具有自动查找Web页面上所有链接的简单网络浏览器。我是在IE5的环境下写的这个程序,当然它可以向下兼容,如IE4。

2.关于MSHTML_TLB.pas

MSHTML_TLB.pas是Deliphi里面自带的一个类。它的含义是Microsoft HTML对象库。它不能够包含在所有的工程或程序中,原因是它实在是太大了,整个文件的代码共有241,899l行,那么长。大小约有12M。下面我们来看看它是如何加入到程序中的。

1. 首先,我们打开Delphi,建立一个新的application。我把form1保存为MainFrm.pas,把application保存为FindLinks.dpr.

2. 要想实现IE 的功能我们就必须要使用Microsoft HTML对象库(MSHTML type library.)如何实现呢?如图1, Project->Import Type Library:

然后你会看到关于"Microsoft HTML Object Library (Version 4.0)"的列表,如图2。

接下来可能会遇到一些问题。比如,在列表里面没有出现"Microsoft HTML Object Library (Version 4.0)"。这是为什么呢?那是IE的问题,由于IE版本的不同(我用的是IE5)。我建议最好是先查询你的计算机里面有没有mshtml.tlb这个文件。

在9x里面它是存在与C:\WINDOWS\SYSTEM目录里面,在2000里面它在\WINNT\system32目录里面。如果找到了这个文件,就可以用图2的click on the "Add..." button,然后选择mshtml.tlb,就可以了,如果没有找到它,那说明你没有安装IE或你的IE版本太低,请升级IE。

最后,当我们选择了倒入的库后,会等待一段时间,因为它实在是太长了,不过请千万不要因为是死机了。它会给自动查找提供很多帮助。

3. 工程实现。

界面设计如下图:

使用以下组件:

控件 命名 TEXT

TLabel lblURL 资料网址

TEdit edtURL http://www.huihu.com

TButton btnFindLinks 查询连接

TListBox lstbxLinks null

4. 程序设计

1. 在Form1的interface部分,在uses后面加入,OleCtrls, SHDocVw, and OleServer.这些所应用的类,都是基于我们所要创建的TinternetExplorer的,它是IE的ActiveX的对象。但是这里还有其它的方式(TinternetExplorer)进行,我们采用TwebBrowser 控制在我们的form1。

2. 我们在private里面加入如下代码:

FInternetExplorer: TInternetExplorer;

procedure WebBrowserDocumentComplete(Sender: TObject; var pDisp: OleVariant;

var URL: OleVariant);

最后用Ctrl-Shift-C完成类的声明。

3. 在impelmentation后面加入如下声明:

uses MSHTML_TLB, ComObj;

要使用的类。

4. 在form1的OnCreate事件中加入如下:

FInternetExplorer := TInternetExplorer.Create(Self);

FInternetExplorer.OnDocumentComplete := WebBrowserDocumentComplete;

5. 最后在form1的TForm1.WebBrowserDocumentComplete里面加入如下代码:

1. procedure TForm1.WebBrowserDocumentComplete(Sender: TObject;

2. var pDisp: OleVariant; var URL: OleVariant);

3. var

4. Doc: IHTMLDocument2;

5. ElementCollection: IHTMLElementCollection;

6. HtmlElement: IHTMLElement;

7. I: Integer;

8. AnchorString: string;

9. begin

10. lstbxLinks.Clear;

11. // 在处理网页的时候发现它没有完全下载,将不会进行处理连接

12. Doc := FInternetExplorer.Document as IHTMLDocument2;

13. if Doc = nil then

14. raise Exception.Create('Couldn''t convert the ' +

15. 'FInternetExplorer.Document to an IHTMLDocument2');

16. // 夺取web上的所有元素。

17. ElementCollection := Doc.all;

18. for I := 0 to ElementCollection.length - 1 do

19. begin

20. file://得到当前的元素

21. HtmlElement := ElementCollection.item(I, '') as IHTMLElement;

22. // 查找网页原代码中的LINK标记。

23. // 发现其它的html标记 (例如: TABLE, FONT, etc.)

24. if HTMLElement.tagName = 'A' then

25. begin

26. // 在详细的link里面抓取innerText,innertext就是标记中<href=后面的东西>例如:

27. // 我们在web里面看见"西南民族学院"

28. // <a href="http://www.swun.edu.cn"><b>西南民族学院</b></a>.

29. AnchorString := HtmlElement.innerText;

30. if AnchorString = '' then

31. AnchorString := '(Empty Name)';

32. AnchorString := AnchorString + ' - ' +

33. (HtmlElement as IHTMLAnchorElement).href;

34. lstbxLinks.Items.Add(AnchorString);

35. end;

36. end;

37. end;

最后我们在button(btnFindLinks)加入Onclick 事件:

1. // 在被浏览的web里面进行查询连接。

2. FInternetExplorer.Navigate(edtURL.Text, EmptyParam, EmptyParam,

EmptyParam, EmptyParam);

从以上的程序里面我们可以看出它的原理了,实际上是很简单的,看过html原代码的人都知道,使网页产生连接的代码就是:<a href="http://www.swun.edu.cn"><b>西南民族学院</b></a>.

我程序的原理就是通过截取href后面的字符串,并在"""号后面截止。

然后把它保存为另外的字符串。然后通过TwebBrowser显示出来。

最后让我们来编译这个程序,的却,编译它很费时间,因为编译多达241,899l行的MSHTML_TLB.pas,是一件很麻烦的事情。其中还包括多达20多个的warning错误,但请放心这是MSHTML_TLB.pas的问题,与其它程序无关。这样一个小型的查找Web页面上所有链接的简单网络浏览器就出现在我们面前。本程序在IE5.0和Delphi6下编译通过。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有