短小文本分类是针对论坛/BBS、留言及回复、咨询、建议及意见反馈、手机短信/网络小纸条、即时聊天记录(MSN/QQ/POPO)等按照给定的分类体系进行分类,由于文本短小内容较少,短的只有几十字,多的也就是一百字左右,内容少,特征不明显。常用的基于统计与向量空间模型的方法处理效果不好,准确率只有70%左右。 针对这种情况,我们采用基于统计与规则相结合的方法,引入语义范式对短小文本进行分类处理,同时通过人工介入的方法,准确率可以达到90%以上,一般可以达到95%左右。
笑话军事旅游美容女性百态母婴家电游戏互联网财经美女干货家饰健康探索资源娱乐学院 数码美食景区养生手机购车首饰美妆装修情感篇厨房科普动物植物编程百科知道汽车珠宝 健康评测品位娱乐居家情感星座服饰美体奢侈品美容达人亲子图库折扣生活美食花嫁风景 | 首页 |
短小文本分类是针对论坛/BBS、留言及回复、咨询、建议及意见反馈、手机短信/网络小纸条、即时聊天记录(MSN/QQ/POPO)等按照给定的分类体系进行分类,由于文本短小内容较少,短的只有几十字,多的也就是一百字左右,内容少,特征不明显。常用的基于统计与向量空间模型的方法处理效果不好,准确率只有70%左右。 针对这种情况,我们采用基于统计与规则相结合的方法,引入语义范式对短小文本进行分类处理,同时通过人工介入的方法,准确率可以达到90%以上,一般可以达到95%左右。