分享
 
 
 

闲着,发个C#抓取alexa排名的代码

王朝网站推广·作者佚名  2011-12-04
窄屏简体版  字體: |||超大  

找遍了百度和GG,英文雅虎也找过了,没找到现成的.

只好自己写了一个,抓取很准确.^_^.需要的朋友随便拿.

(不晓得这有几位搞技术的朋友撒?)

在写一个seo的小工具,模拟蜘蛛爬取链接的,而且是检测蜘蛛认可的有效链接!!

(起因是有几个GG群的朋友遭遇到,恶意假链接欺骗,表面看谁也 看不出来,可实际蜘蛛一爬就漏馅了,用我的软件一检测,也可以原形毕露...)

废话不说了,代码在下面,附上截图一个..是我用朋友的环保网站检测的效果图,大概看下.

private string getAlexa(int idx, string url)

{

//SourceCode By http://77521.cn

string css = "";

string result = "无排名";

string html = Func.GetHttpPage("http://www.alexa.com/search?q=" + url.Replace("http://",""), "utf-8");

string patt = "<link href=\"([^\"'\\s]*?)\" _fcksavedurl="\"([^\"'\\s]*?)\"" _fcksavedurl="\"([^\"'\\s]*?)\"" _fcksavedurl="\"([^\"'\\s]*?)\"" type=\"text/css\" rel=\"stylesheet\">";

Regex reg = new Regex(patt, RegexOptions.IgnoreCase);

MatchCollection mc = reg.Matches(html);

if (mc.Count <= 0)

{//出错了

dgEdit(idx, 7, "无排名");

}

else

{//找到CSS了

css = Func.GetHttpPage(mc[0].Result("$1"), "utf-8");

reg = new Regex("Rank:([\\s\\S]*?)</a>", RegexOptions.IgnoreCase);

mc = reg.Matches(html);

if (mc.Count <= 0)

{

dgEdit(idx, 7, "无排名");

}

else

{

string mao = mc[0].Result("$1");

string mao2 = mao.Replace("\"", "").Replace("'", "").Replace(" ", "");

mao2 = Regex.Replace(mao2,"<\\!--.+?-->", "");

reg = new Regex("<span[\\s\\S]*?class=[\"']?(.+?)[\"']?>(.+?)</span>", RegexOptions.IgnoreCase);

mc = reg.Matches(mao2);

if (mc.Count <= 0)

{

dgEdit(idx, 7, "无排名");

}

else

{

//textBox1.Text = mao2;

for (int n = 0; n < mc.Count; n++)

{

if (css.IndexOf(mc[n].Result("$1")) != -1)

{

mao2 = Regex.Replace(mao2, "<span[^>]*?class=" + mc[n].Result("$1") + ">.+?</span>",

//textBox1.Text = textBox1.Text + "\r\n\r\n------------------------------------------

}

}

mao2 = Regex.Replace(mao2, "<[\\s\\S]+?>", "");

mao2 = Regex.Replace(mao2, " ", "");

mao2 = Regex.Replace(mao2, " ", "");

mao2 = Regex.Replace(mao2, "|", "");

mao2 = mao2.Replace("\r", "").Replace("\n", "");

dgEdit(idx, 7, mao2);

return mao2;

}

}

}

return result;

}

再废话点,这样代码可能普通站长是没用的,发在休闲区,也是个小原创,百度GG雅虎都没相关的代码哈.

有教程类的网站的朋友,别错过啊.^_^

尽管有点不太可能,还是希望大家转载的时候能保留一个链接.

------------------------------------------------------------------------------------------------

代码里, getHttpPage 是抓取网页代码的函数.这样简单的大家应该自己就备有的.不说了.

dgEdit 是一个delegate而已.

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有