ТОМ: Морфологический ключ: различия между версиями
ASBer (обсуждение | вклад) |
ASBer (обсуждение | вклад) мНет описания правки |
||
| (не показано 16 промежуточных версий 2 участников) | |||
| Строка 1: | Строка 1: | ||
Основное назначение ключа - описание морфологических свойств слов и словосочетаний естественного языка, обрабатываемых в ТОМе. |
Основное назначение ключа - описание [[wikipedia:Морфология (лингвистика)|морфологических]] свойств слов и словосочетаний естественного языка, обрабатываемых в [[TOM: язык программирования|ТОМе]]. |
||
Ключи широко используются в синтезе выводимого текста и в анализе введенной команды. |
Ключи широко используются в синтезе выводимого текста и в анализе введенной команды. |
||
==Структура ключа== |
==Структура ключа== |
||
Ключ - это строка специального формата. |
Ключ - это строка специального формата. |
||
Ключ содержит в себе морфологические свойства. |
|||
Ключ состоит из параметров, на каждый параметр приходится два символа. |
|||
На каждое свойство отводится два символа. |
|||
Первый символ - значение |
Первый символ - значение свойства, |
||
Второй символ - имя |
Второй символ - имя свойства. |
||
Пример: |
Пример: |
||
ИпЕчНд |
ИпЕчНд |
||
Ключ в примере состоит из 3х |
Ключ в примере состоит из 3х свойств: |
||
#И - значение, п - |
#И - значение, п - свойство (именительный падеж), |
||
#Е - значение, ч - |
#Е - значение, ч - свойство (единственное число), |
||
#Н - значение, д - |
#Н - значение, д - свойство (неодушевленное). |
||
| ⚫ | |||
Для обозначения значений различных свойств могут быть использованы одни и те же символы. При этом для различных свойств они будут иметь различный смысл. |
|||
Пример: |
|||
МчМр - множественное число, мужской род. |
|||
| ⚫ | |||
==Подбор ключа== |
|||
Подбор производится в случаях, когда из заданного списка ключей необходимо выбрать ключ наиболее похожий на ключ-образец. |
|||
Подбор происходит по следующим правилам: |
|||
*если в ключе есть то же свойство что и в образце, и значения свойств совпадают - вес ключа увеличивается. |
|||
*если в ключе есть то же свойство что и в образце, но значения свойств не совпадают - ключ отбрасывается. |
|||
*если в ключе есть свойство, которого нет в образце - вес ключ уменьшается. |
|||
*после взвешивания выбирается ключ с максимальным весом. |
|||
*если найдено несколько ключей с одинаковым весом - берется ближайший к началу списка. |
|||
Допускается вариант когда ни один ключ из списка не подходит. |
|||
Подбор ключей - рутинная операция для формирования словоформ при синтезе текста и для подбора объектов в парсинге. |
|||
==Суммирование ключей== |
|||
==Извлечение части ключа== |
|||
==Способы получить ключ== |
==Способы получить ключ== |
||
===1. |
===1. Ключ из строки=== |
||
===2. |
===2. Ключ из объекта=== |
||
===3. |
===3. Ключ как свойство формы объекта=== |
||
==Свойства числа и количества== |
|||
Т.к. объекты в ТОМе имеют количественное измерение (свойство [[TOM: язык программирования#.num / .число|.num]]), морфологические cвойства числа и количества для объекта рассчитываются системой. |
|||
Свойство числа - "ч" имеет два предопределенных значение: |
|||
* Еч - единственное число; |
|||
* Мч - множественное число. |
|||
Свойство количества - "к" имеет три предопределенных значение: |
|||
* 1к - для чисел заканчивающихся на 1; |
|||
* 2к - для чисел заканчивающихся на 2, 3 и 4; |
|||
* 5к - для чисел 11, 12, 13, 14 или заканчивающихся на 5, 6, 7, 8, 9, 0. |
|||
[[Категория:Документация ТОМ]] |
|||
Текущая версия от 08:20, 26 января 2009
Основное назначение ключа - описание морфологических свойств слов и словосочетаний естественного языка, обрабатываемых в ТОМе. Ключи широко используются в синтезе выводимого текста и в анализе введенной команды.
Структура ключа
Ключ - это строка специального формата. Ключ содержит в себе морфологические свойства. На каждое свойство отводится два символа.
Первый символ - значение свойства,
Второй символ - имя свойства.
Пример:
ИпЕчНд
Ключ в примере состоит из 3х свойств:
- И - значение, п - свойство (именительный падеж),
- Е - значение, ч - свойство (единственное число),
- Н - значение, д - свойство (неодушевленное).
Для обозначения значений различных свойств могут быть использованы одни и те же символы. При этом для различных свойств они будут иметь различный смысл.
Пример:
МчМр - множественное число, мужской род.
Имена свойств и их значения (за исключением 2х свойств) создаются автором игры, или автором стандартной библиотеки и не являются жестко заданными.
Подбор ключа
Подбор производится в случаях, когда из заданного списка ключей необходимо выбрать ключ наиболее похожий на ключ-образец.
Подбор происходит по следующим правилам:
- если в ключе есть то же свойство что и в образце, и значения свойств совпадают - вес ключа увеличивается.
- если в ключе есть то же свойство что и в образце, но значения свойств не совпадают - ключ отбрасывается.
- если в ключе есть свойство, которого нет в образце - вес ключ уменьшается.
- после взвешивания выбирается ключ с максимальным весом.
- если найдено несколько ключей с одинаковым весом - берется ближайший к началу списка.
Допускается вариант когда ни один ключ из списка не подходит.
Подбор ключей - рутинная операция для формирования словоформ при синтезе текста и для подбора объектов в парсинге.
Суммирование ключей
Извлечение части ключа
Способы получить ключ
1. Ключ из строки
2. Ключ из объекта
3. Ключ как свойство формы объекта
Свойства числа и количества
Т.к. объекты в ТОМе имеют количественное измерение (свойство .num), морфологические cвойства числа и количества для объекта рассчитываются системой.
Свойство числа - "ч" имеет два предопределенных значение:
- Еч - единственное число;
- Мч - множественное число.
Свойство количества - "к" имеет три предопределенных значение:
- 1к - для чисел заканчивающихся на 1;
- 2к - для чисел заканчивающихся на 2, 3 и 4;
- 5к - для чисел 11, 12, 13, 14 или заканчивающихся на 5, 6, 7, 8, 9, 0.