ТОМ: Лексема: различия между версиями
ASBer (обсуждение | вклад) м (→Основа лексемы) |
Apromix (обсуждение | вклад) (Испр. орф. ошибку) |
||
(не показано 6 промежуточных версий 2 участников) | |||
Строка 6: | Строка 6: | ||
* [[ТОМ: Лингвистический ключ|ключ]] постоянных свойств лексемы (1 шт.); | * [[ТОМ: Лингвистический ключ|ключ]] постоянных свойств лексемы (1 шт.); | ||
* [[ТОМ: Лингвистический ключ|ключ]] словоформы по умолчанию (1 шт.); | * [[ТОМ: Лингвистический ключ|ключ]] словоформы по умолчанию (1 шт.); | ||
− | * модификаторы лексемы ( | + | * модификаторы лексемы (списком); |
Части лексемы разделяются точкой с запятой. | Части лексемы разделяются точкой с запятой. | ||
Строка 21: | Строка 21: | ||
===Основа лексемы=== | ===Основа лексемы=== | ||
Основа - это строка модифицируемая в словоформу. | Основа - это строка модифицируемая в словоформу. | ||
− | Основа может содержать спец.символы % и #. | + | Основа может содержать спец.символы '''%''' и '''#'''. |
− | При формировании словоформы символы % замещаются подобранным модификатором, а символы # замещаются числом - количеством объектов. | + | При формировании словоформы символы '''%''' замещаются подобранным модификатором, а символы '''#''' замещаются числом - количеством объектов. |
===Ключ постоянных свойств=== | ===Ключ постоянных свойств=== | ||
===Ключ словоформы по умолчанию=== | ===Ключ словоформы по умолчанию=== | ||
+ | При формировании словоформы ключ по умолчанию добавляется к согласующему ключу. | ||
+ | Свойства согласующего ключа при этом более приоритетны. | ||
+ | |||
+ | В случае, если согласующий ключ не задан или пустой, поиск словоформы производится для ключа по умолчанию. | ||
+ | |||
===Модификаторы лексемы=== | ===Модификаторы лексемы=== | ||
+ | модификатор лексемы имеет следующие форматы: | ||
+ | ключ = модификатор; | ||
+ | или | ||
+ | ключ = модификатор1, модификатор2, ... модификаторN; | ||
+ | или | ||
+ | ключ < модификатор; | ||
==Использование лексем для синтеза текста== | ==Использование лексем для синтеза текста== | ||
+ | Основная задача лексемы при синтезе текста - выдать словоформу, согласующуюся с другими элементами текста. | ||
+ | |||
==Использование лексем в парсинге команд== | ==Использование лексем в парсинге команд== | ||
+ | |||
+ | [[Категория:Документация ТОМ]] |
Текущая версия на 10:58, 27 октября 2010
Лексема - это строка специального формата, описывающая способы формирования необходимых словоформ. Лексемы широко используются при синтезе выводимого текста и в анализе введенной команды.
Содержание
Структура лексемы
Лексема состоит из 4х частей:
- основа лексемы (1 шт.);
- ключ постоянных свойств лексемы (1 шт.);
- ключ словоформы по умолчанию (1 шт.);
- модификаторы лексемы (списком);
Части лексемы разделяются точкой с запятой.
Пример:
"лес%; НдЕчМр; Ип; Ип=; Рп=а; Дп=у; Вп=; Тп=ом; ПпИ2=е; ПпМ2=у"
Где:
- лес%; - основа;
- НдЕчМр; - ключ постоянных свойств;
- Ип; - ключ словоформы по умолчанию;
- Ип=; Рп=а; Дп=у; Вп=; Тп=ом; ПпИ2=е; ПпМ2=у - модификаторы.
Основа лексемы
Основа - это строка модифицируемая в словоформу. Основа может содержать спец.символы % и #. При формировании словоформы символы % замещаются подобранным модификатором, а символы # замещаются числом - количеством объектов.
Ключ постоянных свойств
Ключ словоформы по умолчанию
При формировании словоформы ключ по умолчанию добавляется к согласующему ключу. Свойства согласующего ключа при этом более приоритетны.
В случае, если согласующий ключ не задан или пустой, поиск словоформы производится для ключа по умолчанию.
Модификаторы лексемы
модификатор лексемы имеет следующие форматы:
ключ = модификатор;
или
ключ = модификатор1, модификатор2, ... модификаторN;
или
ключ < модификатор;
Использование лексем для синтеза текста
Основная задача лексемы при синтезе текста - выдать словоформу, согласующуюся с другими элементами текста.