ТОМ: Лексема: различия между версиями
ASBer (обсуждение | вклад) м (Новая: Лексема - это строка специального формата, описывающая способы формирования необходимых словоформ. =...) |
Apromix (обсуждение | вклад) (Испр. орф. ошибку) |
||
(не показано 12 промежуточных версий 2 участников) | |||
Строка 1: | Строка 1: | ||
− | Лексема - это строка специального формата, описывающая способы формирования необходимых словоформ. | + | Лексема - это строка специального формата, описывающая способы формирования необходимых словоформ. Лексемы широко используются при синтезе выводимого текста и в анализе введенной команды. |
==Структура лексемы== | ==Структура лексемы== | ||
Лексема состоит из 4х частей: | Лексема состоит из 4х частей: | ||
− | * основа лексемы; | + | * основа лексемы (1 шт.); |
− | * | + | * [[ТОМ: Лингвистический ключ|ключ]] постоянных свойств лексемы (1 шт.); |
− | * | + | * [[ТОМ: Лингвистический ключ|ключ]] словоформы по умолчанию (1 шт.); |
− | * модификаторы лексемы; | + | * модификаторы лексемы (списком); |
+ | Части лексемы разделяются точкой с запятой. | ||
+ | |||
+ | |||
+ | Пример: | ||
+ | "лес%; НдЕчМр; Ип; Ип=; Рп=а; Дп=у; Вп=; Тп=ом; ПпИ2=е; ПпМ2=у" | ||
+ | Где: | ||
+ | * лес%; - [[ТОМ: Лексема#Основа лексемы|основа]]; | ||
+ | * НдЕчМр; - [[ТОМ: Лексема#Ключ постоянных свойств|ключ постоянных свойств]]; | ||
+ | * Ип; - [[ТОМ: Лексема#Ключ словоформы по умолчанию|ключ словоформы по умолчанию]]; | ||
+ | * Ип=; Рп=а; Дп=у; Вп=; Тп=ом; ПпИ2=е; ПпМ2=у - [[ТОМ: Лексема#Модификаторы лексемы|модификаторы]]. | ||
+ | |||
+ | |||
+ | ===Основа лексемы=== | ||
+ | Основа - это строка модифицируемая в словоформу. | ||
+ | Основа может содержать спец.символы '''%''' и '''#'''. | ||
+ | При формировании словоформы символы '''%''' замещаются подобранным модификатором, а символы '''#''' замещаются числом - количеством объектов. | ||
+ | |||
+ | ===Ключ постоянных свойств=== | ||
+ | ===Ключ словоформы по умолчанию=== | ||
+ | При формировании словоформы ключ по умолчанию добавляется к согласующему ключу. | ||
+ | Свойства согласующего ключа при этом более приоритетны. | ||
+ | |||
+ | В случае, если согласующий ключ не задан или пустой, поиск словоформы производится для ключа по умолчанию. | ||
+ | |||
+ | ===Модификаторы лексемы=== | ||
+ | модификатор лексемы имеет следующие форматы: | ||
+ | ключ = модификатор; | ||
+ | или | ||
+ | ключ = модификатор1, модификатор2, ... модификаторN; | ||
+ | или | ||
+ | ключ < модификатор; | ||
+ | |||
+ | ==Использование лексем для синтеза текста== | ||
+ | Основная задача лексемы при синтезе текста - выдать словоформу, согласующуюся с другими элементами текста. | ||
+ | |||
+ | ==Использование лексем в парсинге команд== | ||
+ | |||
+ | [[Категория:Документация ТОМ]] |
Текущая версия на 10:58, 27 октября 2010
Лексема - это строка специального формата, описывающая способы формирования необходимых словоформ. Лексемы широко используются при синтезе выводимого текста и в анализе введенной команды.
Содержание
Структура лексемы
Лексема состоит из 4х частей:
- основа лексемы (1 шт.);
- ключ постоянных свойств лексемы (1 шт.);
- ключ словоформы по умолчанию (1 шт.);
- модификаторы лексемы (списком);
Части лексемы разделяются точкой с запятой.
Пример:
"лес%; НдЕчМр; Ип; Ип=; Рп=а; Дп=у; Вп=; Тп=ом; ПпИ2=е; ПпМ2=у"
Где:
- лес%; - основа;
- НдЕчМр; - ключ постоянных свойств;
- Ип; - ключ словоформы по умолчанию;
- Ип=; Рп=а; Дп=у; Вп=; Тп=ом; ПпИ2=е; ПпМ2=у - модификаторы.
Основа лексемы
Основа - это строка модифицируемая в словоформу. Основа может содержать спец.символы % и #. При формировании словоформы символы % замещаются подобранным модификатором, а символы # замещаются числом - количеством объектов.
Ключ постоянных свойств
Ключ словоформы по умолчанию
При формировании словоформы ключ по умолчанию добавляется к согласующему ключу. Свойства согласующего ключа при этом более приоритетны.
В случае, если согласующий ключ не задан или пустой, поиск словоформы производится для ключа по умолчанию.
Модификаторы лексемы
модификатор лексемы имеет следующие форматы:
ключ = модификатор;
или
ключ = модификатор1, модификатор2, ... модификаторN;
или
ключ < модификатор;
Использование лексем для синтеза текста
Основная задача лексемы при синтезе текста - выдать словоформу, согласующуюся с другими элементами текста.