ICTCLAS分词系统研究(五)--N最短路径

王朝other·作者佚名  2006-05-20
窄屏简体版  字體: |||超大  

ICTCLAS和别的分司系统不一样的地方就是于--N最短路径分词算法。所谓N最短路径其实就是最短路径和最大路径的折中,保留前N个最优路径。这样做的目的就是对这两种方法取长补短,既能达到一个比较理解的分词不达意效果,又能保证分词不达意速度。在此处,我们中国人的中庸思想被完美体现:)。

在源程序中,N最短路径是在CNShortPath类里里面实现的。

bool CSegment::BiSegment(char *sSentence, double dSmoothingPara, CDictionary &dictCore, CDictionary &dictBinary, unsigned int nResultCount)

{

......

//调用构造函数,生成一个二维链表,见下图一所示

CNShortPath sp(&aBiwordsNet,nResultCount);

//最短路径算法实现

sp.ShortPath();

//输出最短路径

sp.Output(nSegRoute,false,&m_nSegmentCount);

.....

}

图一

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航