Технологии интеллектуального анализа данных : учебное пособие
153 тал известный статист Р.А. Фишер (эти данные часто называют ирисы Фишера). Он рассмотрел три класса ирисов – Iris setosa, Iris versicolor и Iris virginica. Для каждого из них было представлено по 50 экземпляров с разными значениями четырех параметров: длина и ширина чашелистника, длина и ширина лепестка. В табл. 3.14 представлены данные по пяти экземплярам для каждого класса. Таблица 3.14 Набор данных об ирисах Чашелистник Лепесток № п/п длина ширина длина ширина Класс 1 5,1 3,5 1,4 0,2 Iris setosa 2 4,9 3,0 1,4 0,2 Iris setosa 3 4,7 3,2 1,3 0,2 Iris setosa 4 4,6 3,1 1,5 0,2 Iris setosa 5 5,0 3,6 1,4 0,2 Iris setosa 51 7,0 3,2 4,7 1,4 Iris versicolor 52 6,4 3,2 4,5 1,5 Iris versicolor 53 6,9 3,1 4,9 1,5 Iris versicolor 54 5,5 2,3 4,0 1,3 Iris versicolor 55 6,5 2,8 4,6 1,5 Iris versicolor 101 6,3 3,3 6,0 2,5 Iris virginica 102 5,8 2,7 5,9 1,9 Iris virginica 103 7,1 3,0 5,9 2,1 Iris virginica 104 6,3 2,9 5,6 1,8 Iris virginica 105 6,5 3,0 5,8 2,2 Iris virginica Каждый из объектов характеризуется набором параметров: 1 2 , ,..., ,..., j h m i x x x x . В примере с ирисами, как уже отмечалось, такими парамет- рами являются длина и ширина чашелистника, длина и ширина ле- пестка. Переменная x h может принимать значения из некоторого множества: 1 2 , ,... h h h x v v .
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy