Падежи: различия между версиями
Grand (обсуждение | вклад) мНет описания правки |
Oreolek (обсуждение | вклад) мНет описания правки |
||
| (не показано 10 промежуточных версий 2 участников) | |||
| Строка 2: | Строка 2: | ||
Необходимость учитывать падежи - главная особенность русскоязычного синтаксического анализа, если сравнивать с англоязычным. При этом, в рамках ИЛ никаких принципиальных изменений не происходит, - вводимые предложения также являются командами из глаголов, прямых и косвенных объектов. Если это позволяет среда, англоязычный парсер всегда может быть достроен для русскоязычных фраз. Вопрос лишь в сложности и удобстве такого решения. |
Необходимость учитывать падежи - главная особенность русскоязычного синтаксического анализа, если сравнивать с англоязычным. При этом, в рамках ИЛ никаких принципиальных изменений не происходит, - вводимые предложения также являются командами из глаголов, прямых и косвенных объектов. Если это позволяет среда, англоязычный парсер всегда может быть достроен для русскоязычных фраз. Вопрос лишь в сложности и удобстве такого решения. |
||
== Падежи и их значение в РИЛ == |
== Падежи и их значение в РИЛ == |
||
| Строка 8: | Строка 9: | ||
# Используется для отдачи приказов указанием действующего лица: "лиса, молчи" |
# Используется для отдачи приказов указанием действующего лица: "лиса, молчи" |
||
# Для уточнений |
# Для уточнений |
||
Что Вы имели в виду под "розовый": стол или стул?<br> |
|||
>стул |
|||
# может вводиться как сокращение |
# может вводиться как сокращение |
||
Часто используется при формировании сообщений: "Но Илья Муромец ещё не проснулся!" |
Часто используется при формировании сообщений: "Но Илья Муромец ещё не проснулся!" |
||
| Строка 17: | Строка 16: | ||
# выражает определение или дополнение, что делает его прилагательным в терминах анализатора: обух топора |
# выражает определение или дополнение, что делает его прилагательным в терминах анализатора: обух топора |
||
# указывает косвенный объект места действия: "взять все со стола" |
# указывает косвенный объект места действия: "взять все со стола" |
||
Часто используется при формировании сообщений, обозначая отсутствие, принадлежность |
Часто используется при формировании сообщений, обозначая отсутствие, принадлежность и ряд других случаев: "У Вас нет СПИДа", "Что вы хотите получить от козла?", "Вы не дотянетесь до кота" |
||
| Строка 25: | Строка 24: | ||
''Винительный'' |
''Винительный''<br> |
||
указывает как прямой, так и косвенный объекты: "сунуть палку в топку" |
указывает как прямой, так и косвенный объекты: "сунуть палку в топку" |
||
В сообщениях используется аналогично |
В сообщениях используется аналогично |
||
| Строка 41: | Строка 40: | ||
используется редко, главным образом для распознования ввода эстетствующих игроков: "окропить святою водою" |
используется редко, главным образом для распознования ввода эстетствующих игроков: "окропить святою водою" |
||
''Предложный'' |
''Предложный''<br> |
||
# тема для разговора: "спросить о плинтусе" |
# тема для разговора: "спросить о плинтусе" |
||
# определение места: "сидеть на стуле" |
# определение места: "сидеть на стуле" |
||
В выводе практически не используется напрямую, а только через местный. О последнем ниже. |
В выводе практически не используется напрямую, а только через местный. О последнем ниже. |
||
''Местный''<br> |
''Местный''<br> |
||
| Строка 50: | Строка 51: | ||
"ящик на столе", "ящик на полу"<br> |
"ящик на столе", "ящик на полу"<br> |
||
Указание местного падежа в системе позволяет учитывать эту неоднозначность. <br> |
Указание местного падежа в системе позволяет учитывать эту неоднозначность. <br> |
||
Имеет смысл только для вывода и |
Имеет смысл только для вывода и должен использоваться очень активно в любой стандартной библиотеке. |
||
''Звательный''<br> |
|||
Может использоваться в командах актерам: "Вась, наливай" |
|||
''Количественно-отделительный''<br> |
|||
является разновидностью родительного, но форма порой совпадает с дательным: налить чаю и положить сахару<br> |
|||
Может быть введен игроком для указания прямого объекта |
|||
''Лишительный''<br> |
|||
Совпадает либо с родительным, либо с винительным: нет вилки, не можешь взять вилку. Может влиять только на вывод фразы, но автор интуитивно поймет какой из падежей подставить в конкретном случае, а потому для РИЛ не актуален. |
|||
''Счетный, превратительный, ждательный'' |
|||
практически не актуальны для РИЛ |
|||
== Особенности адаптации англоязычного парсера == |
== Особенности адаптации англоязычного парсера == |
||
| Строка 56: | Строка 75: | ||
Обычно русскоязычные предложения с падежными структурами можно привести к виду англоязычных, где косвенный объект и дополнения указываются предлогами. |
Обычно русскоязычные предложения с падежными структурами можно привести к виду англоязычных, где косвенный объект и дополнения указываются предлогами. |
||
Дательный: |
Дательный:<br> |
||
* дать корзину Плохишу -> дать корзина to Плохиш |
* дать корзину Плохишу -> дать корзина to Плохиш |
||
Творительный |
Творительный:<br> |
||
* забить гвоздь калькулятором -> забить гвоздь with калькулятор |
* забить гвоздь калькулятором -> забить гвоздь with калькулятор |
||
Родительный |
Родительный:<br> |
||
* прихлопнуть князя Гвидона -> прихлопнуть князя of Гвидона |
* прихлопнуть князя Гвидона -> прихлопнуть князя of Гвидона |
||
В иных возможных случаях падежи также согласуются через предлоги и хорошо вписываются в англоязычную схему. |
В иных возможных случаях падежи также согласуются через предлоги и хорошо вписываются в англоязычную схему. |
||
== Реализация в существующих парсерных платформах == |
|||
''RTADS'' |
|||
из падежей TADS распознаёт только английский притяжательный (через 's), причем эта функция вшита в глубины системы и не вычленяется. Таким образом, изначально система все трактует как именительный и ожидает предлогов для указания косвенных объектов.<br> |
|||
При русскоязычной адаптации был разработан алгоритм предварительного разбора фразы и преведения к виду, указанному в предыдущем параграфе. Творительный и дательный падеж распознаются только с глаголами, к которым они пременимы (стукнуть тяжелым, подарить девушке), в остальных случаях трактуются как именительный. Родительный опознается только в прилагательных. <br> |
|||
Хотя подход нельзя назвать чистым, но если система понимает неправильно согласованные фразы (взять ботинке из тумбочкой), никому от этого большого вреда не будет (кроме случеев совпадения форм у разных объектов: прыгнуть с крыши => Имеете в виду "крыша" или "крыши"?) |
|||
''[[ТОМ]]'' |
|||
Для поддержки падежей используется универсальная система морфологического согласования на основе [[ТОМ: Лингвистический ключ|лингвистических ключей]]. При этом изначально платформа о падежах ничего не знает, а сами падежи задаются в коде игры, или в стандартных библиотеках. |
|||
Падежные формы задаются объектам с помощью [[ТОМ: Лексема|лексем]], и далее используются в согласовании по падежам и для определения правильных форм в парсере: |
|||
мышонок.title="мышон%; Мр; Ип; Ип=ок; Рп=ка; Дп=ку; Вп=ка; Тп=ком; Пп=ке;" //для синтеза |
|||
мышонок.lex = .title //та же лексема для анализа в парсере |
|||
Для изменения по падежам при синтезе текста используется оператор согласования: |
|||
%дать {мышонок*Дп} {горох*Рп}. |
|||
Для указания формы слова в команде, согласование по падежам указывается в шаблоне команды: |
|||
.шаблон = "дать=дай @Кому*Дп @Что*Вп" |
|||
Том в качестве команд принимает только правильно согласованные фразы. В случае ошибки выводится сообщение: ''"мышонком" - слово в неверной форме.'' |
|||
== Ссылки == |
== Ссылки == |
||
* [ |
* [[wikipedia:Падеж|Падежи в Большой Википедии]] |
||
* [http://rusgram.narod.ru/1173-1193.html "Склонение существительных". Двутомник "Русская грамматика" в электронном виде] |
|||
* [http://www.krugosvet.ru/enc/gumanitarnye_nauki/lingvistika/PADEZH.html Семантическая роль падежей в языке] |
|||
[[Категория:Глоссарий]] [[Категория:Лингвистика]] |
[[Категория:Глоссарий]] [[Категория:Лингвистика]] |
||
Текущая версия от 06:06, 26 января 2024
Паде́ж в синтетических языках — категория слова (обычно имени), показывающая его синтаксическую роль в предложении и связывающая отдельные слова предложения.
Необходимость учитывать падежи - главная особенность русскоязычного синтаксического анализа, если сравнивать с англоязычным. При этом, в рамках ИЛ никаких принципиальных изменений не происходит, - вводимые предложения также являются командами из глаголов, прямых и косвенных объектов. Если это позволяет среда, англоязычный парсер всегда может быть достроен для русскоязычных фраз. Вопрос лишь в сложности и удобстве такого решения.
Падежи и их значение в РИЛ
Именительный
- Используется для отдачи приказов указанием действующего лица: "лиса, молчи"
- Для уточнений
- может вводиться как сокращение
Часто используется при формировании сообщений: "Но Илья Муромец ещё не проснулся!"
Родительный
- выражает определение или дополнение, что делает его прилагательным в терминах анализатора: обух топора
- указывает косвенный объект места действия: "взять все со стола"
Часто используется при формировании сообщений, обозначая отсутствие, принадлежность и ряд других случаев: "У Вас нет СПИДа", "Что вы хотите получить от козла?", "Вы не дотянетесь до кота"
Дательный
используется в глаголах, выражающих действие направленное к объекту или от него (обычно косвенный объект): "дать хомяку", "прибить к столбу", "идти к дому", "привязать к забору"
В сообщениях указывает кому (не) удается что-то сделать, указывает косвенный объект
Винительный
указывает как прямой, так и косвенный объекты: "сунуть палку в топку"
В сообщениях используется аналогично
Творительный
также называется инструментальным, что ясно говорит об его роли.
- обозначает косвенный объект: "побрить злодея топором"
- указывает место: взять за стеклом ключи
В сообщениях используется аналогично
Второй творительный
Литературная или украинизированная форма с окончаниями -ою, -ею, -ёю
используется редко, главным образом для распознования ввода эстетствующих игроков: "окропить святою водою"
Предложный
- тема для разговора: "спросить о плинтусе"
- определение места: "сидеть на стуле"
В выводе практически не используется напрямую, а только через местный. О последнем ниже.
Местный
малоизвестный падеж, который объединяет два последних случая в родительном и предложном падежах. Существование его вызвано тем, что у разных слов обстоятельство места указывается по разному - чаще в форме предложного, но порой и дательного падежа:
"ящик на столе", "ящик на полу"
Указание местного падежа в системе позволяет учитывать эту неоднозначность.
Имеет смысл только для вывода и должен использоваться очень активно в любой стандартной библиотеке.
Звательный
Может использоваться в командах актерам: "Вась, наливай"
Количественно-отделительный
является разновидностью родительного, но форма порой совпадает с дательным: налить чаю и положить сахару
Может быть введен игроком для указания прямого объекта
Лишительный
Совпадает либо с родительным, либо с винительным: нет вилки, не можешь взять вилку. Может влиять только на вывод фразы, но автор интуитивно поймет какой из падежей подставить в конкретном случае, а потому для РИЛ не актуален.
Счетный, превратительный, ждательный
практически не актуальны для РИЛ
Особенности адаптации англоязычного парсера
Обычно русскоязычные предложения с падежными структурами можно привести к виду англоязычных, где косвенный объект и дополнения указываются предлогами.
Дательный:
- дать корзину Плохишу -> дать корзина to Плохиш
Творительный:
- забить гвоздь калькулятором -> забить гвоздь with калькулятор
Родительный:
- прихлопнуть князя Гвидона -> прихлопнуть князя of Гвидона
В иных возможных случаях падежи также согласуются через предлоги и хорошо вписываются в англоязычную схему.
Реализация в существующих парсерных платформах
RTADS
из падежей TADS распознаёт только английский притяжательный (через 's), причем эта функция вшита в глубины системы и не вычленяется. Таким образом, изначально система все трактует как именительный и ожидает предлогов для указания косвенных объектов.
При русскоязычной адаптации был разработан алгоритм предварительного разбора фразы и преведения к виду, указанному в предыдущем параграфе. Творительный и дательный падеж распознаются только с глаголами, к которым они пременимы (стукнуть тяжелым, подарить девушке), в остальных случаях трактуются как именительный. Родительный опознается только в прилагательных.
Хотя подход нельзя назвать чистым, но если система понимает неправильно согласованные фразы (взять ботинке из тумбочкой), никому от этого большого вреда не будет (кроме случеев совпадения форм у разных объектов: прыгнуть с крыши => Имеете в виду "крыша" или "крыши"?)
Для поддержки падежей используется универсальная система морфологического согласования на основе лингвистических ключей. При этом изначально платформа о падежах ничего не знает, а сами падежи задаются в коде игры, или в стандартных библиотеках.
Падежные формы задаются объектам с помощью лексем, и далее используются в согласовании по падежам и для определения правильных форм в парсере:
мышонок.title="мышон%; Мр; Ип; Ип=ок; Рп=ка; Дп=ку; Вп=ка; Тп=ком; Пп=ке;" //для синтеза мышонок.lex = .title //та же лексема для анализа в парсере
Для изменения по падежам при синтезе текста используется оператор согласования:
%дать {мышонок*Дп} {горох*Рп}.
Для указания формы слова в команде, согласование по падежам указывается в шаблоне команды:
.шаблон = "дать=дай @Кому*Дп @Что*Вп"
Том в качестве команд принимает только правильно согласованные фразы. В случае ошибки выводится сообщение: "мышонком" - слово в неверной форме.