ТОМ: Морфологический ключ: различия между версиями
ASBer (обсуждение | вклад) м (+ ключи числа и количества) |
ASBer (обсуждение | вклад) м |
||
Строка 1: | Строка 1: | ||
− | Основное назначение ключа - описание морфологических свойств слов и словосочетаний естественного языка, обрабатываемых в ТОМе. | + | Основное назначение ключа - описание морфологических свойств слов и словосочетаний естественного языка, обрабатываемых в [[TOM: язык программирования|ТОМе]]. |
Ключи широко используются в синтезе выводимого текста и в анализе введенной команды. | Ключи широко используются в синтезе выводимого текста и в анализе введенной команды. | ||
Версия 15:27, 22 октября 2008
Основное назначение ключа - описание морфологических свойств слов и словосочетаний естественного языка, обрабатываемых в ТОМе. Ключи широко используются в синтезе выводимого текста и в анализе введенной команды.
Содержание
Структура ключа
Ключ - это строка специального формата. Ключ состоит из свойств, на каждое свойство приходится два символа.
Первый символ - значение свойства,
Второй символ - имя свойства.
Пример:
ИпЕчНд
Ключ в примере состоит из 3х свойств:
- И - значение, п - свойство (именительный падеж),
- Е - значение, ч - свойство (единственное число),
- Н - значение, д - свойство (неодушевленное).
Для обозначения значений различных свойств могут быть использованы одни и те же символы. При этом для различных свойств они будут иметь различный смысл.
Пример:
МчМр - множественное число, мужской род.
Имена свойств и их значения (за исключением 2х свойств) создаются автором игры, или автором стандартной библиотеки и не являются жестко заданными.
Подбор ключа
Подбор производится в случаях, когда из заданного списка ключей необходимо выбрать ключ наиболее похожий на ключ-образец.
Подбор происходит по следующим правилам:
- если в ключе есть то же свойство что и в образце, и значения свойств совпадают - вес ключа увеличивается.
- если в ключе есть то же свойство что и в образце, но значения свойств не совпадают - ключ отбрасывается.
- если в ключе есть свойство, которого нет в образце - вес ключ уменьшается.
- после взвешивания выбирается ключ с максимальным весом.
- если найдено несколько ключей с одинаковым весом - берется ближайший к началу списка.
Допускается вариант когда ни один ключ из списка не подходит.
Подбор ключей - рутинная операция для формирования словоформ при синтезе текста и для подбора объектов в парсинге.