Падежи: различия между версиями
Grand (обсуждение | вклад) м |
Oreolek (обсуждение | вклад) м |
||
(не показано 11 промежуточных версий 2 участников) | |||
Строка 2: | Строка 2: | ||
Необходимость учитывать падежи - главная особенность русскоязычного синтаксического анализа, если сравнивать с англоязычным. При этом, в рамках ИЛ никаких принципиальных изменений не происходит, - вводимые предложения также являются командами из глаголов, прямых и косвенных объектов. Если это позволяет среда, англоязычный парсер всегда может быть достроен для русскоязычных фраз. Вопрос лишь в сложности и удобстве такого решения. | Необходимость учитывать падежи - главная особенность русскоязычного синтаксического анализа, если сравнивать с англоязычным. При этом, в рамках ИЛ никаких принципиальных изменений не происходит, - вводимые предложения также являются командами из глаголов, прямых и косвенных объектов. Если это позволяет среда, англоязычный парсер всегда может быть достроен для русскоязычных фраз. Вопрос лишь в сложности и удобстве такого решения. | ||
+ | |||
== Падежи и их значение в РИЛ == | == Падежи и их значение в РИЛ == | ||
− | Именительный | + | ''Именительный'' |
# Используется для отдачи приказов указанием действующего лица: "лиса, молчи" | # Используется для отдачи приказов указанием действующего лица: "лиса, молчи" | ||
# Для уточнений | # Для уточнений | ||
− | |||
− | |||
# может вводиться как сокращение | # может вводиться как сокращение | ||
Часто используется при формировании сообщений: "Но Илья Муромец ещё не проснулся!" | Часто используется при формировании сообщений: "Но Илья Муромец ещё не проснулся!" | ||
− | Родительный | + | |
+ | ''Родительный'' | ||
# выражает определение или дополнение, что делает его прилагательным в терминах анализатора: обух топора | # выражает определение или дополнение, что делает его прилагательным в терминах анализатора: обух топора | ||
# указывает косвенный объект места действия: "взять все со стола" | # указывает косвенный объект места действия: "взять все со стола" | ||
− | Часто используется при формировании сообщений, обозначая отсутствие, принадлежность | + | Часто используется при формировании сообщений, обозначая отсутствие, принадлежность и ряд других случаев: "У Вас нет СПИДа", "Что вы хотите получить от козла?", "Вы не дотянетесь до кота" |
− | Дательный<br> | + | |
+ | ''Дательный''<br> | ||
используется в глаголах, выражающих действие направленное к объекту или от него (обычно косвенный объект): "дать хомяку", "прибить к столбу", "идти к дому", "привязать к забору"<br> | используется в глаголах, выражающих действие направленное к объекту или от него (обычно косвенный объект): "дать хомяку", "прибить к столбу", "идти к дому", "привязать к забору"<br> | ||
В сообщениях указывает кому (не) удается что-то сделать, указывает косвенный объект | В сообщениях указывает кому (не) удается что-то сделать, указывает косвенный объект | ||
− | Винительный | + | |
+ | ''Винительный''<br> | ||
указывает как прямой, так и косвенный объекты: "сунуть палку в топку" | указывает как прямой, так и косвенный объекты: "сунуть палку в топку" | ||
В сообщениях используется аналогично | В сообщениях используется аналогично | ||
− | Творительный<br> | + | ''Творительный''<br> |
также называется инструментальным, что ясно говорит об его роли. | также называется инструментальным, что ясно говорит об его роли. | ||
# обозначает косвенный объект: "побрить злодея топором" | # обозначает косвенный объект: "побрить злодея топором" | ||
Строка 33: | Строка 35: | ||
В сообщениях используется аналогично | В сообщениях используется аналогично | ||
− | Второй творительный<br> | + | |
+ | ''Второй творительный''<br> | ||
Литературная или украинизированная форма с окончаниями -ою, -ею, -ёю<br> | Литературная или украинизированная форма с окончаниями -ою, -ею, -ёю<br> | ||
используется редко, главным образом для распознования ввода эстетствующих игроков: "окропить святою водою" | используется редко, главным образом для распознования ввода эстетствующих игроков: "окропить святою водою" | ||
− | Предложный | + | |
+ | ''Предложный''<br> | ||
# тема для разговора: "спросить о плинтусе" | # тема для разговора: "спросить о плинтусе" | ||
# определение места: "сидеть на стуле" | # определение места: "сидеть на стуле" | ||
В выводе практически не используется напрямую, а только через местный. О последнем ниже. | В выводе практически не используется напрямую, а только через местный. О последнем ниже. | ||
− | Местный<br> | + | |
+ | ''Местный''<br> | ||
малоизвестный падеж, который объединяет два последних случая в родительном и предложном падежах. Существование его вызвано тем, что у разных слов обстоятельство места указывается по разному - чаще в форме предложного, но порой и дательного падежа: | малоизвестный падеж, который объединяет два последних случая в родительном и предложном падежах. Существование его вызвано тем, что у разных слов обстоятельство места указывается по разному - чаще в форме предложного, но порой и дательного падежа: | ||
"ящик на столе", "ящик на полу"<br> | "ящик на столе", "ящик на полу"<br> | ||
Указание местного падежа в системе позволяет учитывать эту неоднозначность. <br> | Указание местного падежа в системе позволяет учитывать эту неоднозначность. <br> | ||
− | Имеет смысл только для вывода и | + | Имеет смысл только для вывода и должен использоваться очень активно в любой стандартной библиотеке. |
+ | |||
+ | |||
+ | ''Звательный''<br> | ||
+ | Может использоваться в командах актерам: "Вась, наливай" | ||
+ | |||
+ | |||
+ | ''Количественно-отделительный''<br> | ||
+ | является разновидностью родительного, но форма порой совпадает с дательным: налить чаю и положить сахару<br> | ||
+ | Может быть введен игроком для указания прямого объекта | ||
+ | |||
+ | |||
+ | ''Лишительный''<br> | ||
+ | Совпадает либо с родительным, либо с винительным: нет вилки, не можешь взять вилку. Может влиять только на вывод фразы, но автор интуитивно поймет какой из падежей подставить в конкретном случае, а потому для РИЛ не актуален. | ||
+ | |||
+ | |||
+ | ''Счетный, превратительный, ждательный'' | ||
+ | практически не актуальны для РИЛ | ||
+ | |||
== Особенности адаптации англоязычного парсера == | == Особенности адаптации англоязычного парсера == | ||
Строка 52: | Строка 75: | ||
Обычно русскоязычные предложения с падежными структурами можно привести к виду англоязычных, где косвенный объект и дополнения указываются предлогами. | Обычно русскоязычные предложения с падежными структурами можно привести к виду англоязычных, где косвенный объект и дополнения указываются предлогами. | ||
− | Дательный: | + | |
+ | Дательный:<br> | ||
* дать корзину Плохишу -> дать корзина to Плохиш | * дать корзину Плохишу -> дать корзина to Плохиш | ||
− | Творительный | + | |
+ | Творительный:<br> | ||
* забить гвоздь калькулятором -> забить гвоздь with калькулятор | * забить гвоздь калькулятором -> забить гвоздь with калькулятор | ||
− | Родительный | + | |
+ | Родительный:<br> | ||
* прихлопнуть князя Гвидона -> прихлопнуть князя of Гвидона | * прихлопнуть князя Гвидона -> прихлопнуть князя of Гвидона | ||
+ | |||
В иных возможных случаях падежи также согласуются через предлоги и хорошо вписываются в англоязычную схему. | В иных возможных случаях падежи также согласуются через предлоги и хорошо вписываются в англоязычную схему. | ||
+ | |||
+ | |||
+ | == Реализация в существующих парсерных платформах == | ||
+ | |||
+ | |||
+ | ''RTADS'' | ||
+ | |||
+ | |||
+ | из падежей TADS распознаёт только английский притяжательный (через 's), причем эта функция вшита в глубины системы и не вычленяется. Таким образом, изначально система все трактует как именительный и ожидает предлогов для указания косвенных объектов.<br> | ||
+ | При русскоязычной адаптации был разработан алгоритм предварительного разбора фразы и преведения к виду, указанному в предыдущем параграфе. Творительный и дательный падеж распознаются только с глаголами, к которым они пременимы (стукнуть тяжелым, подарить девушке), в остальных случаях трактуются как именительный. Родительный опознается только в прилагательных. <br> | ||
+ | Хотя подход нельзя назвать чистым, но если система понимает неправильно согласованные фразы (взять ботинке из тумбочкой), никому от этого большого вреда не будет (кроме случеев совпадения форм у разных объектов: прыгнуть с крыши => Имеете в виду "крыша" или "крыши"?) | ||
+ | |||
+ | |||
+ | |||
+ | ''[[ТОМ]]'' | ||
+ | |||
+ | |||
+ | Для поддержки падежей используется универсальная система морфологического согласования на основе [[ТОМ: Лингвистический ключ|лингвистических ключей]]. При этом изначально платформа о падежах ничего не знает, а сами падежи задаются в коде игры, или в стандартных библиотеках. | ||
+ | |||
+ | Падежные формы задаются объектам с помощью [[ТОМ: Лексема|лексем]], и далее используются в согласовании по падежам и для определения правильных форм в парсере: | ||
+ | мышонок.title="мышон%; Мр; Ип; Ип=ок; Рп=ка; Дп=ку; Вп=ка; Тп=ком; Пп=ке;" //для синтеза | ||
+ | мышонок.lex = .title //та же лексема для анализа в парсере | ||
+ | |||
+ | Для изменения по падежам при синтезе текста используется оператор согласования: | ||
+ | %дать {мышонок*Дп} {горох*Рп}. | ||
+ | |||
+ | Для указания формы слова в команде, согласование по падежам указывается в шаблоне команды: | ||
+ | .шаблон = "дать=дай @Кому*Дп @Что*Вп" | ||
+ | |||
+ | Том в качестве команд принимает только правильно согласованные фразы. В случае ошибки выводится сообщение: ''"мышонком" - слово в неверной форме.'' | ||
== Ссылки == | == Ссылки == | ||
− | * [http://ru. | + | * [[wikipedia:Падеж|Падежи в Большой Википедии]] |
+ | * [http://rusgram.narod.ru/1173-1193.html "Склонение существительных". Двутомник "Русская грамматика" в электронном виде] | ||
+ | * [http://www.krugosvet.ru/enc/gumanitarnye_nauki/lingvistika/PADEZH.html Семантическая роль падежей в языке] | ||
[[Категория:Глоссарий]] [[Категория:Лингвистика]] | [[Категория:Глоссарий]] [[Категория:Лингвистика]] |
Текущая версия на 08:06, 26 января 2024
Паде́ж в синтетических языках — категория слова (обычно имени), показывающая его синтаксическую роль в предложении и связывающая отдельные слова предложения.
Необходимость учитывать падежи - главная особенность русскоязычного синтаксического анализа, если сравнивать с англоязычным. При этом, в рамках ИЛ никаких принципиальных изменений не происходит, - вводимые предложения также являются командами из глаголов, прямых и косвенных объектов. Если это позволяет среда, англоязычный парсер всегда может быть достроен для русскоязычных фраз. Вопрос лишь в сложности и удобстве такого решения.
Содержание
Падежи и их значение в РИЛ
Именительный
- Используется для отдачи приказов указанием действующего лица: "лиса, молчи"
- Для уточнений
- может вводиться как сокращение
Часто используется при формировании сообщений: "Но Илья Муромец ещё не проснулся!"
Родительный
- выражает определение или дополнение, что делает его прилагательным в терминах анализатора: обух топора
- указывает косвенный объект места действия: "взять все со стола"
Часто используется при формировании сообщений, обозначая отсутствие, принадлежность и ряд других случаев: "У Вас нет СПИДа", "Что вы хотите получить от козла?", "Вы не дотянетесь до кота"
Дательный
используется в глаголах, выражающих действие направленное к объекту или от него (обычно косвенный объект): "дать хомяку", "прибить к столбу", "идти к дому", "привязать к забору"
В сообщениях указывает кому (не) удается что-то сделать, указывает косвенный объект
Винительный
указывает как прямой, так и косвенный объекты: "сунуть палку в топку"
В сообщениях используется аналогично
Творительный
также называется инструментальным, что ясно говорит об его роли.
- обозначает косвенный объект: "побрить злодея топором"
- указывает место: взять за стеклом ключи
В сообщениях используется аналогично
Второй творительный
Литературная или украинизированная форма с окончаниями -ою, -ею, -ёю
используется редко, главным образом для распознования ввода эстетствующих игроков: "окропить святою водою"
Предложный
- тема для разговора: "спросить о плинтусе"
- определение места: "сидеть на стуле"
В выводе практически не используется напрямую, а только через местный. О последнем ниже.
Местный
малоизвестный падеж, который объединяет два последних случая в родительном и предложном падежах. Существование его вызвано тем, что у разных слов обстоятельство места указывается по разному - чаще в форме предложного, но порой и дательного падежа:
"ящик на столе", "ящик на полу"
Указание местного падежа в системе позволяет учитывать эту неоднозначность.
Имеет смысл только для вывода и должен использоваться очень активно в любой стандартной библиотеке.
Звательный
Может использоваться в командах актерам: "Вась, наливай"
Количественно-отделительный
является разновидностью родительного, но форма порой совпадает с дательным: налить чаю и положить сахару
Может быть введен игроком для указания прямого объекта
Лишительный
Совпадает либо с родительным, либо с винительным: нет вилки, не можешь взять вилку. Может влиять только на вывод фразы, но автор интуитивно поймет какой из падежей подставить в конкретном случае, а потому для РИЛ не актуален.
Счетный, превратительный, ждательный
практически не актуальны для РИЛ
Особенности адаптации англоязычного парсера
Обычно русскоязычные предложения с падежными структурами можно привести к виду англоязычных, где косвенный объект и дополнения указываются предлогами.
Дательный:
- дать корзину Плохишу -> дать корзина to Плохиш
Творительный:
- забить гвоздь калькулятором -> забить гвоздь with калькулятор
Родительный:
- прихлопнуть князя Гвидона -> прихлопнуть князя of Гвидона
В иных возможных случаях падежи также согласуются через предлоги и хорошо вписываются в англоязычную схему.
Реализация в существующих парсерных платформах
RTADS
из падежей TADS распознаёт только английский притяжательный (через 's), причем эта функция вшита в глубины системы и не вычленяется. Таким образом, изначально система все трактует как именительный и ожидает предлогов для указания косвенных объектов.
При русскоязычной адаптации был разработан алгоритм предварительного разбора фразы и преведения к виду, указанному в предыдущем параграфе. Творительный и дательный падеж распознаются только с глаголами, к которым они пременимы (стукнуть тяжелым, подарить девушке), в остальных случаях трактуются как именительный. Родительный опознается только в прилагательных.
Хотя подход нельзя назвать чистым, но если система понимает неправильно согласованные фразы (взять ботинке из тумбочкой), никому от этого большого вреда не будет (кроме случеев совпадения форм у разных объектов: прыгнуть с крыши => Имеете в виду "крыша" или "крыши"?)
Для поддержки падежей используется универсальная система морфологического согласования на основе лингвистических ключей. При этом изначально платформа о падежах ничего не знает, а сами падежи задаются в коде игры, или в стандартных библиотеках.
Падежные формы задаются объектам с помощью лексем, и далее используются в согласовании по падежам и для определения правильных форм в парсере:
мышонок.title="мышон%; Мр; Ип; Ип=ок; Рп=ка; Дп=ку; Вп=ка; Тп=ком; Пп=ке;" //для синтеза мышонок.lex = .title //та же лексема для анализа в парсере
Для изменения по падежам при синтезе текста используется оператор согласования:
%дать {мышонок*Дп} {горох*Рп}.
Для указания формы слова в команде, согласование по падежам указывается в шаблоне команды:
.шаблон = "дать=дай @Кому*Дп @Что*Вп"
Том в качестве команд принимает только правильно согласованные фразы. В случае ошибки выводится сообщение: "мышонком" - слово в неверной форме.