Смекни!
smekni.com

Обобщенная грамматика непосредственных составляющих (стр. 2 из 4)

Ìíîãèå ñîâðåìåííûå ñèñòåìû èñïîëüçóþò ãðàììàòèêó íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ. Ñàìûé áîëüøîé êîììåð÷åñêèé ïðîåêò ñ èñïîëüçîâàíèåì àíàëèçàòîðà íà îñíîâå ãðàììàòèêè ÍÑ ïðèíàäëåæèò ôèðìå Hewlett Packard è íàçûâàåòñÿ “HPSG”.

Äåðåâî íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ

Äåðåâüÿ ÍÑ ïðåäñòàâëÿþò ñòðóêòóðíîå îïèñàíèå äëÿ ïðåäëîæåíèé. Â äàëüíåéøåì ñòðóêòóðíîå îïèñàíèå ïðåäëîæåíèÿ ìîæåò èñïîëüçîâàòüñÿ â ñèñòåìàõ, àíàëèçèðóþùèõ èëè ñèíòåçèðóþùèõ åñòåñòâåííûé ÿçûê.

Ïðèìåð äåðåâà ÍÑ äëÿ ïðåäëîæåíèÿ:

John wanted to publish the paper.

S

NP VP

VP

NPR V P V NP

DET N

John wanted to publish the paper

Ñîîòâåòñòâóþùàÿ ñòðóêòóðà ñêîáîê:

[S[NP[NPRJohn]][VP[Vwanted][VP[Pto][Vpublish][NP[DETthe][Npaper]]]]]

Äåðåâüÿ ÍÑ è ñòðóêòóðû ñî ñêîáêàìè ÿâëÿþòñÿ òåìè ñòðóêòóðàìè, êîòîðûå ïîðîæäàþòñÿ àíàëèçàòîðîì ñèñòåì, îáðàáàòûâàþùèõ åñòåñòâåííûé ÿçûê.

Ãðàììàòèêè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ

Ãðàììàòèêè ÍÑ ñîñòîÿò èç íàáîðà íåêîíå÷íûõ ñèìâîëîâ (íàïðèìåð, òàêèå êàòåãîðèè, êàê N, V, DET, P, NP, S è ò.ä.), íàáîðà êîíå÷íûõ ñèìâîëîâ (ëåêñè÷åñêèå åäèíèöû òèïà “Äæîí”, “êóïèòü”, “ãàçåòà” è ò.ä.) è íàáîð ïðàâèë, êîòîðûå ïðåîáðàçóþò íåêîíå÷íûå ñèìâîëû â öåïî÷êó êîíåíûõ è íåêîíå÷íûõ ñèìâîëîâ. Åñëè äàííûå ïðàâèëà íå çàâèñÿò îò êîíòåêñòà íåêîíå÷íîãî ñèìâîëà, òî òàêàÿ ãðàììàòèêà íàçûâàåòñÿ êîíòåêñòíî-ñâîáîäíîé; â ïðîòèâíîì ñëó÷àå ãðàììàòèêà íàçûâàåòñÿ êîíòåêñòíî-çàâèñèìîé.

Ãðàììàòèêà ÍÑ â Òðàíñôîðìàöèîííîé ãðàììàòèêå. Ãðàììàòèêà ÍÑ èãðàåò î÷åíü áîëüøóþ ðîëü â òðàíñôîðìàöèîííîé ãðàììàòèêå. Îñíîâíàÿ èäåÿ Òà çàêëþ÷àåòñÿ â òîì, ÷òî äëÿ ñòðóêòóðíîãî îïèñàíèÿ ñóùåñòâóåò áàçîâûé êîìïîíåíò è, ñîîòâåòñòâåííî, áàçîâûå ïðàâèëà. Âñå îñòàëüíûå ïðàâèëà âûâîäÿòñÿ èç áàçîâûõ ïóòåì òðàíñôîðìàöèîííûõ ïðàâèë. Äåðåâüÿ, ïîðîæäåííûå òðàíñôîðìàöèîííûìè ïðàâèëàìè, òàêæå ÿâëÿþòñÿ äåðåâüÿìè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ. Äàííîå ïðåäñòàâëåíèå Òà ÿâëÿåòñÿ ñèëüíî óïðîùåííûì, íî äëÿ äàííîé ðàáîòû åãî âïîëíå äîñòàòî÷íî.

Âîçðîæäåíèå ãðàììàòèêè ÍÑ è äåðåâüåâ ÍÑ

Íà÷èíàÿ ïðèìåðíî ñ 1975 ãîäà â ãðàììàòèêó ÍÑ áûëè âíåñåíû íåêîòîðûå äîïîëíåíèÿ è îáíîâëåíèÿ. Íå âûõîäÿ çà ðàìêè êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêè, îáðàçîâàëàñü Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ (ÎÃÍÑ). Ãðàììàòèêà Ñëîæåíèÿ Äåðåâüåâ (ÃÑÄ) - Tree-Adjoining Grammar - îáðàçîâàëàñü íà îñíîâå ïîñòðîåíèÿ äåðåâüåâ áåç èñïîëüçîâàíèÿ ïðàâèë ïåðåõîäà. Ðàññìîòðèì ýòè äâå ãðàììàòèêè.

Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ (ÎÃÍÑ). Êðîìå âñåõ âûøåóïîìÿíóòûõ ñâîéñòâ ãðàììàòèê ÍÑ Ãàçäàð (Gazdar) ââåë â ÎÃÍÑ äâà íîâûõ ïîíÿòèÿ: “ïóñòûå” êàòåãîðèè (ýëèïñèñ?) è ñâÿçàííûå ïðàâèëà, à òàêæå ìåòàïðàâèëà äëÿ âûâîäà îäíèõ ïðàâèë èç äðóãèõ. Ýëèïñèñ è ñâÿçàííûå ïðàâèëà íå óâåëè÷èâàþò ïîðîæäàþùóþ ñïîñîáíîñòü çà ïðåäåëû êîíòåêòñíî-ñâîáîäíîé ãðàììàòèêè. Ìåòàïðàâèëà, åñëè îíè íå îãðàíè÷åíû êàêèìè-ëèáî óñëîâèÿìè, óâåëè÷èâàþò ïîðîæäàþùóþ ñïîñîáíîñòü çà ïðåäåëû êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêè, ïîòîìó ÷òî ìåòàïðàâèëî ìîæåò ïîðîæäàòü áåñêîíå÷íûé íàáîð êîíòåêñòíî-ñâîáîäíûõ ïðàâèë, êîòîðûå â ñâîþ î÷åðåäü ïîðîæäàþò êîíòåêñòíî-çàâèñèìûé ÿçûê. Ìåòàïðàâèëà â ðåàëüíûõ ãðàììàòèêàõ, îïèñàííûõ ïî ïðàâèëàì îáîáùåííîé ãðàììàòèêè ÍÑ, äîñòàòî÷íî îãðàíè÷åíû è ïîýòîìó íå óâåëè÷èâàþò ïîðîæäàþùóþ ñïîñîáíîñòü.