Технологии интеллектуального анализа данных : учебное пособие
26 4) логически неверные значения – значения, не соответст- вующие логическому смыслу, вкладываемому в данное поле таб- лицы. Например, в поле «Город» находится значение «Россия» или в поле «температура больного» значение 10; 5) закодированные значения – сокращенная запись или коди- ровка реальных данных, используемая для уменьшения занимаемо- го места; 6) составные значения – значения, содержащие несколько ло- гических данных в одной ячейке таблицы. Такая ситуация возмож- на в полях произвольного формата (например, строковых или тек- стовых). Проблема усугубляется, если отсутствует строгий формат записи информации в такие поля. Уровень записи. На данном уровне возникает проблема про- тиворечивости значений в разных полях записи, описывающей один и тот же объект предметной области. Например: для человека возраст не соответствует году рождения: age = 22, bdate = 12.02.50. Уровень таблицы БД. На данном уровне возникают пробле- мы, связанные с несоответствием информации, хранящейся в таб- лице и относящейся к разным объектам. На этом уровне наиболее часто встречаются следующего проблемы: нарушение уникальности. Значения, соответствующие уни- кальным атрибутам разных объектов предметной области, являют- ся одинаковыми. отсутствие стандартов. Из-за отсутствия стандартов на формат записи значений могут возникать проблемы, связанные с дублированием данных или их противоречивостью: - дублирующиеся записи (один и тот же человек записан в таблицу два раза, хотя значения полей уникальны): empl= ( name="JohnSmith",... ), emp2= ( name=" J. Smith", . . . );
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy