ТОМ: Морфологический ключ: различия между версиями

Материал из IFВики
Перейти к навигации Перейти к поиску
м (Свойства числа и количества)
м (Свойства числа и количества)
Строка 50: Строка 50:
  
 
==Свойства числа и количества==
 
==Свойства числа и количества==
Т.к. объекты в ТОМе имеют количественное измерение (свойство [[TOM: язык программирования#.num / .число|.num]]), cвойства числа и количества для объекта рассчитываются системой.
+
Т.к. объекты в ТОМе имеют количественное измерение (свойство [[TOM: язык программирования#.num / .число|.num]]), морфологические cвойства числа и количества для объекта рассчитываются системой.
  
Ключ числа - "ч" имеет два предопределенных значение:
+
Свойство числа - "ч" имеет два предопределенных значение:
 
* Еч - единственное число;
 
* Еч - единственное число;
 
* Мч - множественное число.
 
* Мч - множественное число.
  
Ключ количества - "к" имеет три предопределенных значение:
+
Свойство количества - "к" имеет три предопределенных значение:
 
* 1к - для чисел заканчивающихся на 1;
 
* 1к - для чисел заканчивающихся на 1;
 
* 2к - для чисел заканчивающихся на 2, 3 и 4;
 
* 2к - для чисел заканчивающихся на 2, 3 и 4;
 
* 5к - для чисел заканчивающихся на 5, 6, 7, 8, 9 и 0.
 
* 5к - для чисел заканчивающихся на 5, 6, 7, 8, 9 и 0.

Версия 15:25, 28 октября 2008

Основное назначение ключа - описание морфологических свойств слов и словосочетаний естественного языка, обрабатываемых в ТОМе. Ключи широко используются в синтезе выводимого текста и в анализе введенной команды.

Структура ключа

Ключ - это строка специального формата. Ключ состоит из свойств, на каждое свойство приходится два символа.

Первый символ - значение свойства,

Второй символ - имя свойства.

Пример:

ИпЕчНд 

Ключ в примере состоит из 3х свойств:

  1. И - значение, п - свойство (именительный падеж),
  2. Е - значение, ч - свойство (единственное число),
  3. Н - значение, д - свойство (неодушевленное).


Для обозначения значений различных свойств могут быть использованы одни и те же символы. При этом для различных свойств они будут иметь различный смысл.

Пример:

МчМр - множественное число, мужской род.

Имена свойств и их значения (за исключением 2х свойств) создаются автором игры, или автором стандартной библиотеки и не являются жестко заданными.

Подбор ключа

Подбор производится в случаях, когда из заданного списка ключей необходимо выбрать ключ наиболее похожий на ключ-образец.

Подбор происходит по следующим правилам:

  • если в ключе есть то же свойство что и в образце, и значения свойств совпадают - вес ключа увеличивается.
  • если в ключе есть то же свойство что и в образце, но значения свойств не совпадают - ключ отбрасывается.
  • если в ключе есть свойство, которого нет в образце - вес ключ уменьшается.
  • после взвешивания выбирается ключ с максимальным весом.
  • если найдено несколько ключей с одинаковым весом - берется ближайший к началу списка.

Допускается вариант когда ни один ключ из списка не подходит.


Подбор ключей - рутинная операция для формирования словоформ при синтезе текста и для подбора объектов в парсинге.

Суммирование ключей

Извлечение части ключа

Способы получить ключ

1. Ключ из строки

2. Ключ из объекта

3. Ключ как свойство формы объекта

Свойства числа и количества

Т.к. объекты в ТОМе имеют количественное измерение (свойство .num), морфологические cвойства числа и количества для объекта рассчитываются системой.

Свойство числа - "ч" имеет два предопределенных значение:

  • Еч - единственное число;
  • Мч - множественное число.

Свойство количества - "к" имеет три предопределенных значение:

  • 1к - для чисел заканчивающихся на 1;
  • 2к - для чисел заканчивающихся на 2, 3 и 4;
  • 5к - для чисел заканчивающихся на 5, 6, 7, 8, 9 и 0.