Открыть главное меню

Изменения

Синтаксический анализ

339 байт добавлено, 10:54, 22 июля 2008
Нет описания правки
Автор: '''Игорь Ножов'''<br>Опубликовано в журнале [http://offline.computerra.ru/2002/446/18250/ "Компьютерра" №21 от 05 июня 2002 года]
''«А есть журнал «Картофель и овощи», с картинками. А есть «За рулем». А есть «Сибирские огни». А есть «Синтаксис», слово какое-то вроде как непристойное, а что значит, не понять. Должно, матерное».
Татьяна Толстая. «Кысь»''
: ''«А есть журнал «Картофель и овощи», с картинками. А есть «За рулем». А есть «Сибирские огни». А есть «Синтаксис», слово какое-то вроде как непристойное, а что значит, не понять. Должно, матерное».''
 
: ''Татьяна Толстая. «Кысь»''
главных критериев правильности синтаксической структуры - принцип проективности: структура проективна, если
ни одна из стрелок не пересекает другую стрелку.
 
Проективность можно проиллюстрировать примером 1 (рис. 1). Пример на рис. 2 является непроективным.
 
 
[[Изображение:SyntaxAnalysis_1.jpg]]
 
В русской разговорной речи возможен свободный порядок слов, и пример из языка вальбири при определенной
виде фильтр на непроективность. Требование проективности синтаксической структуры предложения универсально
для большинства индоевропейских языков.
 
Степень свободы линейного порядка слов в предложении определяется сложностью морфологии языка. Так, русский
грамматической неправильности («Kills the farmer the duckling»). Падежные окончания русских существительных
позволяют свободно менять порядок слов во фразе, сохраняя смысл исходного высказывания (кто и кого убил).
 
 
[[Изображение:SyntaxAnalysis_2.jpg]]
фрагменты автоматического синтаксического анализа текстов из произведений А. Чехова («Крыжовник») (рис. 3) 2
и В. Набокова («Сестры Вэйн») (рис. 4).
 
 
[[Изображение:SyntaxAnalysis_3.jpg]]
Доказательством независимости правильной синтаксической структуры от смысла высказывания служат два самых
известных в современной лингвистической традиции примера:
 
 
[[Изображение:SyntaxAnalysis_5.jpg]]
было нетрудно догадаться, густой грязью, завалено мусором, '''велосипедист''' свалился в яму. (Пример Т. Ю.
Кобзаревой.) 3 (рис. 7).
 
 
[[Изображение:SyntaxAnalysis_7.jpg]]
Вторая ступень анализа - установление связей между словами в построенных сегментах - сталкивается с проблемой морфологической омонимии, то есть неоднозначностью (рис. 8).
 
 
[[Изображение:SyntaxAnalysis_8.jpg]]
анализа. На «длинных» предложениях количество комбинаторных вариантов иногда достигает нескольких сотен,
поэтому используются разного рода математические и лингвистические ухищрения, позволяющие избежать анализа
всех комбинаторно возможных вариантов. Для сравнения ([http://www.aot.ru)]: скорость программы морфологического
анализа составляет 6000 слов в секунду, синтаксического - 300 слов в секунду.
В англоязычном мире программы синтаксического анализа давно нашли применение в системах автоматической
индексации, реферирования текстов, машинного перевода и интеллектуального поиска. Примером могут служить
продукты компании Inxight ([http://www.inxight.com) Inxight] и Xerox. Одной из самых известных и свободно распространяемых
программ анализа английского предложения является LinkParser, разработанная сотрудниками Стэнфордского
университета.
Пример анализа системы LinkParser 4 (рис 9).  [[Изображение:SyntaxAnalysis_9.jpg]] 
Синтаксический анализ русского языка, за редким исключением, используется только в системах машинного
перевода. Хотя существуют и весьма неожиданные области применения. Например, компания «ВААЛ» ([http://www.vaal.ru) «ВААЛ»]использует синтаксический модуль группы «Диалинг» ( [http://www.aot.ru) «Диалинг»] для создания психологических методик анализа
предвыборных, социологических и политических текстов.
Вероятно, в ближайшем будущем та же участь постигнет и синтаксический анализ.
[http://offline.computerra.ru/2002/446/18250/ "Компьютерра" №21 от 05 июня 2002 года]
[[Категория:Лингвистика]]