Технологии интеллектуального анализа данных : учебное пособие
244 Результатом преобразования может быть: номер интервала, значе- ние нижней или верхней границы интервала разбиения, среднее значение интервала разбиения, метка интервала или автоматиче- ская метка. Квантование (или дискредитация) может быть осуществлено интервальным или квантильным алгоритмом. Интервальное кван- тование подразумевает разбиение диапазона значений на указанное количество значений равной длины. Например, если значения в поле попадают в диапазон от 0 до 10, то при интервальном кванто- вании на 10 интервалов получим отрезки от 0 до 1, от 1 до 2 и т.д. При этом 0 будет относиться к первому интервалу, 1 – ко второму, а 9 и 10 – к десятому. Квантильное квантование подразумевает раз- биение диапазона значений на равновероятные интервалы, т.е. на интервалы, содержащие равное (или, по крайней мере, примерно равное) количество значений. Нарушение равенства возможно только тогда, когда значения, попадающие на границу интервала, встречаются в наборе данных несколько раз. В этом случае все они относятся к одному определенному интервалу и могут вызвать «перевес» в его сторону. Допустим, имеется таблица с информацией о кредиторах и с суммой взятых кредитов. Нужно узнать активность разных воз- растных групп кредиторов (табл. 4.5). Таблица 4.5 Информация о кредиторах и суммах кредитов № п/п Возраст Сумма 1 37 7000 2 38 7500 3 60 14500 4 28 15000 5 59 32000 6 25 11500 7 57 5000 8 45 61500
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy