网络舆情监控系统是指通过对网络各类信息汇集、分类、整合、筛选等技术处理,再形成对网络热点、动态、网民意见等实时统计报表的软件工具。
随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网友言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过这种网络来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。
舆情监控系统通过对热点问题和重点领域比较集中的网站信息,如:网页、论坛、BBS等,进行24小时监控,随时下载最新的消息和意见。下载后完成对数据格式的转换及元数据的标引。对下载本地的信息,进行初步的过滤和预处理。对热点问题和重要领域实施监控,前提是必须通过人际交互建立舆情监控的知识库,用来指导智能分析的过程。对热点问题的智能分析,首先基于传统基于向量空间的特征分析技术上,对抓取的内容做分类、聚类和摘要分析,对信息完成初步的再组织。然后在监控知识库的指导下进行基于舆情的语义分析,使管理者看到的民情民意更有效,更符合现实。最后将监控的结果,分别推送到不同的职能部门,供制定对策使用。
网络舆情监控系统是利用搜索引擎技术和网络信息挖掘技术,通过网页内容的自动采集处理、敏感词过滤、智能聚类分类、主题检测、专题聚焦、统计分析,实现各单位对自己相关网络舆情监督管理的需要,最终形成舆情简报、舆情专报、分析报告、移动快报,为决策层全面掌握舆情动态,做出正确舆论引导,提供分析依据。
“网络舆情监测系统”是征对在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度于网络上表达出来意愿集合而进行的计算机监测的系统统称。
“网络舆情”是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。网络舆情形成迅速,对社会影响巨大,加强互联网信息监管的同时,组织力量开展信息汇集整理和分析,对于及时应对网络突发的公共事件和全面掌握社情民意很有意义。
一、它包括以下几个主要子系统:
1、舆情分析引擎系统
舆情分析引擎为系统的核心功能,其主要包括以下功能:热点识别能力、自动分类、聚类分析、倾向性分析与统计、主题跟踪、信息自动摘要功能、截取证据、趋势分析、突发事件分析、报警系统、统计报告。
2、互联网信息采集系统
采用元搜索与信息雷达技术。智能信息抽取技术主要是针对特殊客户进行特定领域的信息采集。
3、搜索引擎数据管理系统
搜索引擎数据管理功能主要包括以下功能:对收集到信息进行预处理;对搜索引擎数据集进行阶段性的数据维护;支持系统多用户分级管理系统,包括用户逐级进行审核功能;支持信息服务:最新报道、热点新闻、分类阅读、舆情简报、信息检索、RSS订阅等服务;信息文档转换技术:可以对信息进行传统文件格式转换。如:Doc、Excel、Access、Rss等文件生成。可生成报表。
二、功能简述
l热点识别能力
可以根据新闻出处权威度、 评论数量、发言时间密集程度等参数,识别出给定时间段内的热门话题。
l倾向性分析与统计
对信息的阐述的观点、主旨进行倾向性分析。以提供参考分析依据。分析的依据可根据信息的转载量、评论的回言信息时间密集度。来判别信息的发展倾向。
l主题跟踪
主题跟踪主要是指针对热点话题进行信息跟踪,并对其进行倾向性与趁势分析。跟踪的具体内容包括:信息来源、转载量、转载地址、地域分布、信息发布者等相关信息元素。其建立在倾向性与趁势分析的基础上。
l信息自动摘要功能
能够根据文档内容自动抽取文档摘要信息,这些摘要能够准确代表文章内容主题和中心思想。用户无需查看全部文章内容,通过该智能摘要即可快速了解文章大意与核心内容,提高用户信息利用效率。而且该智能摘要可以根据用户需求调整不同长度,满足不同的需求。主要包括文本信息摘要与网页信息摘要两个方面。
l趋势分析
通过图表展示监控词汇和时间的分布关系以及趋势分析,包括地域信息分布。以提供阶段性的分析。如:信息传播的区域分布,转载量与转载网站类型等。
l突发事件分析
突发事件不外乎有以下几种:自然灾害、社会灾难、战争、动乱和偶发事件等等。互联网信息监控分析系统主要是针对互联网信息进行突发事件监听与分析。对热点信息的倾向分析与趁势分析,以监听信息的突发性。
l报警系统
报警系统主要是针对舆情分析引擎系统的热点信息与突发事件进行监听分析,然后根据信息的语料库与报警监控信息库进行分析。以确保信息的舆论健康发展。
l统计报告
根据舆情分析引擎处理后的结果库生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。
三、实用目的
. 自定义监察范围,可按行业、按地域、按信息发布时间……等方式监察信息内容;
. 自定义监察信息级别;
. 自定义监察信息方式,手工与自动监察相结合;
. 自动预警、报警,追查信息来源与散布范围;
. 自定义规则实现对文字、图片、视频、论坛、博客、评论……等等信息的监察与监控;
. 自定义或自动扫瞄管辖段的网站;
. 自动重点跟踪异常内容变动频繁的网站或信息来源;
. 自动保留计算机无法判别的意识形态内容进行汇总反馈;
. 实现信息判别的自我学习和信息库自动升级。