分享
 
 
 

拓尔思(TRS)绿色节能搜索解决方案 信息化解决方案/案例资料中心

王朝数码·作者佚名  2008-10-14
窄屏简体版  字體: |||超大  

一、TRS绿色节能搜索

TRS网络信息雷达系统(TRS InfoRadar)实时监控和采集Internet网站内容,对采集到的信息自动进行过滤、分类和排重等智能化处理,最终将最新内容及时发布出来,实现统一的信息导航,同时提供包括全文、日期等在内的全方位信息查询。

双模服务1+12

TRS InfoRadar不仅支持独立产品模式,而且支持SaaS模式。

独立模式:按照用户的需求设置采集网站,定制分类模板,建立本地数据库,用户完全拥有软件产品。

SaaS模式:数据采集、加工的繁琐工作由厂商完成,用户只需定制需要的信息即可。

绿色节能搜索冲击波

TRS InfoRadar倡导绿色环保节能搜索。

绿色环保:TRS InfoRadar按需过滤掉互联网的电子垃圾信息,准确获取目标。

节能先锋:TRS InfoRadar是节约能源先锋,通过自动化、智能化、多样化、个性化的雷达信息采集和监控,避免了人力、物力等资源的浪费。第一波:超群的信息采集

采集全面,采全率高

各类元数据准确采集

定位元数据:支持利用mata和html标签实现各项元数据信息的精准采集与智能抽取,能够采集结构化数据。

与CKM整合,实现丰富的信息抽取:包括人名、电话等详细信息,供人们分析和利用。

多种个性化设置:在需要的情况下人工配置,实现部分元数据的准确解析。

高效采集,性能超群

采集的效率:在10M网络带宽环境下,每小时可以采集5万个网页。

高效的更新:已经采集过的信息不会重复采集,更新时只获取前次采集后更新的网页。数据索引更新时间平均小于0.02s/记录。

大规模集群应用:单个采集工具能支持千万数量级的网页采集。通过集群应用,就可以实现更大规模的海量搜索。第二波:智能的信息处理

自动分类:采集的网页可以基于内容的自动分类,不需人工干预,自动分类达到85%以上准确率。同时,提供智能分类训练工具,允许用户自行根据自己的分类需求和数据特点设定分类结构和生成特征模板。

自动排重:采用TRS相似性检索技术实现,可根据文档内容的匹配程度确定是否重复,比利用网页标题和大小等规则判断具有更强的准确性、实用性以及运行效率。

垃圾过滤:自动过滤网页中新闻的正文内容,剔除广告、版权等垃圾信息。

其它:自动生成网页摘要以及自动抽取网页中的关键词等。

第三波:及时的信息发布

一键式发布:支持自动和人工发布两种方式。采集的信息可及时发布到提供服务的网站上。

可发布专题内容。

第四波:快捷的信息检索

支持多语言网页的采集和检索:支持中、英、日、韩、俄、法、西、德、阿拉伯语等语言。

支持大量并发用户的查询请求:采用基于成本优化的查询算法,多用户并发检索,每秒可响应60个以上查询。

支持对多种属性的检索:包括按日期、URL、标题等,同时提供排序功能。

快捷的检索速度:成功管理用户T级规模的数据,保证了检索速度和可靠性。现在,在G级数据集合上达到亚秒级检索速度。二、产品架构

网络信息雷达由三个逻辑模块组成:

网络信息智能采集工具:实时监控网站,并把最新的网页采集到本地,进行内容处理。

TRS全文数据库系统:根据应用的具体需求存储到不同的目标上。比如存储成TRS格式文件,或存储到TRS全文数据库中,或存储到关系数据库(SQL Server、Oracle)等。

Web发布模块:实现网页信息的统一发布,导航和检索功能。

另外,雷达的网页信息可方便地导入TRS WCM系统中,积累成网站发布的素材。

三、雷达的“长尾”应用

TRS InfoRadar在内容运营的垂直搜索应用、内容监管的网络舆情应用以及决策支持的竞争情报等方面的应用,将极大的提高组织对外部信息的获取效率,极大降低信息采集成本,全方位掌控环境脉动,并提高各个组织的快捷反应效能。TRS InfoRadar让各行业的所有人员受益:

内容运营的垂直搜索应用:现在,购物搜索、MP3搜索…几乎各行各业的信息都可细化成各类的垂直搜索。TRS InfoRadar站内搜索与网站群垂直搜索应用,实现对结构化信息的抽取,达到资源整合与提高流量的目标。内容监管的网络舆情应用:互联网信息既有大量进步、健康、有益的信息,也有很多垃圾信息。其虚拟性、隐蔽性、和随意性等特点,使越来越多的人们愿意透过这种渠道去表达自己的个人想法。加强互联网信息的监管和分析,对于预警、应对网络突发的公共事件和全面掌握社情民意具有现实意义。

决策支持的竞争情报:竞争情报帮助决策者正确决策早已成为不争的事实。

1、政府

政府网站运营工作人员

上传下达:有利于政府网站信息共享与上传下达。

政府网站群的垂直搜索应用:整合主站和子站资源,实现统一的搜索应用。

解决信息源问题:解决了政务外网、内网的信息量不足,更新不及时等问题。

互联网管理和新闻宣传部门

网络舆情监控:实时监控和采集互联网信息,全局观测网络舆论,发现社会热点问题。

公安机关监控:监控反动、黄色信息等。

行业监管部门

基于互联网的行业监管,如下图所示:

政府管理者

网络舆情的应对:通过网络舆情信息,政府管理者可体察市情民生,决策与应对突发事件。

竞争情报为决策护航:为决策者制定政策法规提供情报参考。

有利于政策和课题研究:提供大量有用信息。

2、科研机构

科研人员获取科研信息和学术进展,通过网络信息收集,高质量完成相关教研课题,提高教学质量,节约人们的宝贵时间与精力。

3、企业

市场销售部门

TRS InfoRadar可自动搜集产业情报、最新商机、竞争者动态、负面信息等用户所需要的信息。尤其关注以下信息:国家政策:国家政策对企业的影响很大,需要提前进行市场预警避险。

行业环境:获取行业趋势走向。如商贸业追踪国内外时尚网站,获取最新的潮流资讯。

宏观环境:关注国家的宏观经济政策及宏观调控的范围、力度和限度。

竞争对手:获取竞争对手的新品发布、动态、合同签署等内容。

研发部门

专注上下游产品的价格、设计情况,制定现阶段的产品研发计划。

通过专利预警信息获取,可以了解最新专利情况等方面应用。

售后部门

监控行业、企业论坛网站,获取产品使用反馈等信息。

管理者

提高市场竞争能力:通过获取竞争对手的竞争状况,管理者可获取企业现有潜在危机。

提高企业经济效益:通过竞争对手状况的对比,有利于把握商业机会,提高企业经济效益。

为领导的决策提供参考。

4、互联网应用

精确的行业服务模式:垂直搜索与通用搜索相比,可以满足专业领域的精准信息需求服务。

整合信息资源:垂直搜索的应用实现了垂直门户网站对产业上下游信息资源的整合。

提高网络流量:人们应用垂直搜索在关注的领域中搜索适合自己的有效应用的同时,垂直搜索也为信息源带去可观的流量和商业效益。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有