Технологии интеллектуального анализа данных : учебное пособие

204 пример, если данные описываются тысячей параметров, практиче- ски всегда гораздо быстрее сто раз решить задачу о нахождении зависимости от десяти из них, чем решить один раз найти зависи- мость от тысячи параметров. Причем обычно не просто быстрее, а на несколько порядков быстрее. Ограничивая размерность задачи длиной хромосомы и находя оптимальный набор генов в этих хро- мосомах (пусть даже в результате применения весьма сложной, многостадийной стратегии), все равно получаем выигрыш во вре- мени по сравнению с перебором всех параметров. Основной недостаток генетических алгоритмов состоит в за- висимости результата от выбора первоначальной популяции хро- мосом, т.е. в принципе не исключено, что при неудачном выборе первоначальной популяции и при отсутствии в ней удачной ком- бинации генов удачная комбинация генов никогда не будет най- дена. В этом случае единственный способ натолкнуться на такую комбинацию – это удачная мутация. Однако мутация – это слу- чайный процесс, и ее частота не может быть слишком большой – в противном случае будет сильно разрушаться популяция «хоро- ших» хромосом. 3.9. Гибридные методы анализа данных Каждый из методов и алгоритмов Data Mining обладает своими достоинствами и недостатками. Например, нейронные сети являются универсальными функциональными аппроксиматорами, обучаются на примерах, но совершенно не способны объяснять вы- ходной результат. С другой стороны, например, результат логиче- ского вывода в нечетких системах является легко интерпретируе- мым. Однако для создания нечеткой системы требуется большая предварительная аналитическая работа экспертов, что значительно усложняет процесс построения нечеткой системы.