通过将属性值域划分为区间,数 据离散化技术可以用来减少给定连续属性值的个数。区间的标记可以替代实际的数据值。用少数区间标记替换连续属性的数值,从而减少和简化了 原来的数据。这导致挖掘结果的简洁、易于使用的、知识层面的表示。离散化技术可以根据如何进行离散化加以分类,如根据是否使用类信息或根据进行方向分类。对于给定的数值属性,概念分层定义了该属性的一个离散化。通过收集较高层的概念并用它们替换较低层的概念,概念分层可以用来归约数据。通过这种数据泛化,尽管细节丢失了,但是泛化后的数据更有意义、更容易解释。
- 技术分类:软件
- 行业属性:通用行业
- 相关厂商:暂无机构
- 文档大小:N/A
- 文档类型:doc
- 分享人:user04
- 日期:2008-01-04 22:04:49
- 关键字:
- 下载文档
相关文档