分箱法定义:
通过考察“邻居”(周围的值)来平滑存储数据的值,用“箱的深度”表示不同的箱里有相同个数的数据,用“箱的宽度”来表示每个箱值的取值区间为常数。由于分箱方法考虑相邻的值,因此是一种局部平滑方法。
按照取值的不同可划分为按箱平均值平滑、按箱中值平滑以及按箱边界值平滑。
举例:
假设有8、24、15、41、7、10、18、67、25等9个数,分为3箱。
箱1: 8、24、15
箱2: 41、7、10
箱3: 18、67、25
分别用三种不同的分箱法求出平滑存储数据的值:
按箱平均值求得平滑数据值:箱1: 16,16,16
按箱中值求得平滑数据值:箱2: 7,7,7
按箱边界值求得平滑数据值: 箱3:18,18,18
通过不同分箱方法求解的平滑数据值,就是同一箱中3个数的存储数据的值。