ТОМ: Лексема: различия между версиями
ASBer (обсуждение | вклад) |
Apromix (обсуждение | вклад) Испр. орф. ошибку |
||
| (не показаны 3 промежуточные версии 2 участников) | |||
| Строка 6: | Строка 6: | ||
* [[ТОМ: Лингвистический ключ|ключ]] постоянных свойств лексемы (1 шт.); |
* [[ТОМ: Лингвистический ключ|ключ]] постоянных свойств лексемы (1 шт.); |
||
* [[ТОМ: Лингвистический ключ|ключ]] словоформы по умолчанию (1 шт.); |
* [[ТОМ: Лингвистический ключ|ключ]] словоформы по умолчанию (1 шт.); |
||
* модификаторы лексемы ( |
* модификаторы лексемы (списком); |
||
Части лексемы разделяются точкой с запятой. |
Части лексемы разделяются точкой с запятой. |
||
| Строка 32: | Строка 32: | ||
===Модификаторы лексемы=== |
===Модификаторы лексемы=== |
||
модификатор лексемы имеет следующие |
модификатор лексемы имеет следующие форматы: |
||
ключ = модификатор; |
ключ = модификатор; |
||
или |
или |
||
| Строка 40: | Строка 40: | ||
==Использование лексем для синтеза текста== |
==Использование лексем для синтеза текста== |
||
Основная задача лексемы при синтезе текста - выдать словоформу, согласующуюся с другими элементами текста. |
|||
==Использование лексем в парсинге команд== |
==Использование лексем в парсинге команд== |
||
[[Категория:Документация ТОМ]] |
|||
Текущая версия от 07:58, 27 октября 2010
Лексема - это строка специального формата, описывающая способы формирования необходимых словоформ. Лексемы широко используются при синтезе выводимого текста и в анализе введенной команды.
Структура лексемы
Лексема состоит из 4х частей:
- основа лексемы (1 шт.);
- ключ постоянных свойств лексемы (1 шт.);
- ключ словоформы по умолчанию (1 шт.);
- модификаторы лексемы (списком);
Части лексемы разделяются точкой с запятой.
Пример:
"лес%; НдЕчМр; Ип; Ип=; Рп=а; Дп=у; Вп=; Тп=ом; ПпИ2=е; ПпМ2=у"
Где:
- лес%; - основа;
- НдЕчМр; - ключ постоянных свойств;
- Ип; - ключ словоформы по умолчанию;
- Ип=; Рп=а; Дп=у; Вп=; Тп=ом; ПпИ2=е; ПпМ2=у - модификаторы.
Основа лексемы
Основа - это строка модифицируемая в словоформу. Основа может содержать спец.символы % и #. При формировании словоформы символы % замещаются подобранным модификатором, а символы # замещаются числом - количеством объектов.
Ключ постоянных свойств
Ключ словоформы по умолчанию
При формировании словоформы ключ по умолчанию добавляется к согласующему ключу. Свойства согласующего ключа при этом более приоритетны.
В случае, если согласующий ключ не задан или пустой, поиск словоформы производится для ключа по умолчанию.
Модификаторы лексемы
модификатор лексемы имеет следующие форматы:
ключ = модификатор;
или
ключ = модификатор1, модификатор2, ... модификаторN;
или
ключ < модификатор;
Использование лексем для синтеза текста
Основная задача лексемы при синтезе текста - выдать словоформу, согласующуюся с другими элементами текста.