Теория формальных грамматик и автоматов
13 рассмотрим подробнее использование системы синтаксических составляющих для моделирования синтаксической структуры предложения. 1.2.1.1. Системы синтаксических составляющих Пусть α – произвольная непустая последовательность символов в алфавите A . Вхождения символов в последовательность будем называть ее точками. Определим понятие отрезка последовательности как множество точек последовательности α , таких, что {x : a x b} , где a , b – фиксированные точки, a x означает «точка a расположена раньше по тексту или совпадает с x , x b понимаем аналогично. Множество C отрезков последовательности α называется системой составляющих этой последовательности, если: а) C содержит отрезок, состоящий из всех точек α , и все одноточечные отрезки α ; б) любые два отрезка из C либо не пересекаются, либо один из них содержится в другом. Элементы множества C , определенные в пункте а), называются тривиальными составляющими, а в пункте б) – нетривиальными составляющими. Если алфавит A интерпретируется как множество слов языка и α – как предложение, то при подходящем выборе системы составляющих для α нетривиальные составляющие представляют собой словосочетания, т.е. группы слов, которые интуитивно осознаются носителем языка как «синтаксически связные» части предложения. Для выделения в предложении системы составляющих каждую нетривиальную составляющую будем заключать в квадратные скобки. Например, в трех предложениях: « Каждый из нас должен научиться понимать труд как творчество »; « if a > b then a := b else a := b – a »; « x P(x) Q(x) P(x) Q(x) » можно естественно выделить составляющие следующим образом:
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy