An Online Data Cleaning Method(一种在线数据清洗方法)

王朝厨房·作者佚名  2007-01-04
窄屏简体版  字體: |||超大  

摘要:An Online Data Cleaning Method(一种在线数据清洗方法)

提出一种新的在线数据清洗方法:将确认为干净的参照表中的记录字符串映射成高维空间中的点后进行聚类划分,然后利用B+树对划分中的点进行索引从而将高维空间的查询转换成一维空间的范围查询。输入表中的元组利用索引采用分枝限界策略搜索KNN(K Nearest Neighbors)记录从而完成与其最匹配记录的识别。理论分析和实验表明这是一种解决在线数据清洗的有效途径。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航