The stemming algorithm
i-suffixes (*) of Russian tend to be quite regular, with irregularities of declension involving a change to the stem. Irregular forms therefore usually just generate two or more possible stems. Stems in Russian can be very short, and many of the suffixes are also particle words that make ‘natural stopwords’, so a tempting way of running the stemmer is to set a minimum stem length of zero, and thereby reduce to null all words which are made up entirely of suffix parts. We have been a little more cautious, and have insisted that a minimum stem contains one vowel.
The 32 letters of the Russian alphabet are as follows, with the transliterated forms that we will use here shown in brackets:
а (a) б (b) в (v) г (g) д (d) е (e) ж (zh) з (z)
и (i) й (ì) к (k) л (l) м (m) н (n) о (o) п (p)
р (r) с (s) т (t) у (u) ф (f) х (kh) ц (ts) ч (ch)
ш (sh) щ (shch) ъ (") ы (y) ь (') э (è) ю (iu) я (ia)
There is a 33rd letter, ё (ë), but it is rarely used, and we assume it is mapped into е (e).
The following are vowels:
а (a) е (e) и (i) о (o) у (u) ы (y) э (è) ю (iu) я (ia)
In any word, RV is the region after the first vowel, or the end of the word if it contains no vowel.
R1 is the region after the first non-vowel following a vowel, or the end of the word if there is no such non-vowel.
R2 is the region after the first non-vowel following a vowel in R1, or the end of the word if there is no such non-vowel.
For example:
p r o t i v o e s t e s t v e n n o m
|<------RV ------>|
|<-----R1 ------>|
|<-----R2 ------>|
(See note on R1 and R2.)
We now define the following classes of ending:
PERFECTIVE GERUND:
group 1: в (v) вши (vshi) вшись (vshis')
group 2: ив (iv) ивши (ivshi) ившись (ivshis') ыв (yv) ывши (yvshi) ывшись (yvshis')
group 1 endings must follow а (a) or я (ia)
In searching for an ending in a class, always choose the longest one from the class.
So in seaching for a NOUN ending for величие (velichie), choose ие (ie) rather than е (e).
Undouble н (n) means, if the word ends нн (nn), remove the last letter.
Here now are the stemming rules.
All tests take place in the the RV part of the word.
So in the test for perfective gerund, the а (a) or я (ia) which the group 1 endings must follow must itself be in RV. In other words the letters before the RV region are never examined in the stemming process.
Do each of steps 1, 2, 3 and 4.
Step 1: Search for a PERFECTIVE GERUND ending. If one is found remove it, and that is then the end of step 1. Otherwise try and remove a REFLEXIVE ending, and then search in turn for (1) an ADJECTIVAL, (2) a VERB or (3) a NOUN ending. As soon as one of the endings (1) to (3) is found remove it, and terminate step 1.
Step 2: If the word ends with и (i), remove it.
Step 3: Search for a DERIVATIONAL ending in R2 (i.e. the entire ending must lie in R2), and if one is found, remove it.
Step 4: (1) Undouble н (n), or, (2) if the word ends with a SUPERLATIVE ending, remove it and undouble н (n), or (3) if the word ends ь (') (soft sign) remove it.
Лингвистика
Переведите, пожалуйста, с английского на русский ОЧЕНЬ НАДО!!!
Произошедшие i-суффиксы алгоритма (*) русского языка имеют тенденцию быть весьма регулярными, с неисправностями отклонения, вовлекающего изменение к стеблю. Нерегулярные формы поэтому обычно только производят два или больше возможных стебля. Стебли на русском языке могут быть очень короткими, и многие из суффиксов - также слова частицы, которые делают ‘естественные stopwords’, таким образом заманчивый способ управлять stemmer состоит в том, чтобы установить минимальную длину стебля ноля, и таким образом уменьшать, чтобы аннулировать все слова, которые составлены полностью частей суффикса. Мы были немного более осторожными, и настояли, что минимальный стебель содержит одного гласного. 32 письма от российского алфавита следующим образом, с транслитерируемыми формами, которые мы будем использовать здесь показанный в скобках: а (a) б (b) в (v) г (g) д (d) е (e) ж (zh) з (z) и (i) й (ì) к (k) л (l) м (m) н (n) о (o) п (p) р (r) с (s) т (t) у (u) ф (f) х (kh) ц (ts) ч (ch) ш (sh) щ (shch) ъ ("") ы (y) ь (') э (è) ю (iu) я (ia) есть 33-ье письмо, ё (ë), но это редко используется, и мы предполагаем, что это нанесено на карту в е (e). Следующее - гласные: а (a) е (e) и (i) о (o) у (u) ы (y) э (è) ю (iu) я (ia) В любом слове, RV - область после первого гласного, или конца слова, если это не содержит гласного. R1 - область после первого негласного после гласного, или конца слова, если нет такого негласного. R2 - область после первого негласного после гласного в R1, или конца слова, если нет такого негласного. Например: p r o t я v o e s t e s t v e n n o м. | <------RV------> | | <-----R1------> | | <-----R2------> | (См. примечание по R1 и R2.) Мы теперь определяем следующие классы окончания: ГЕРУНДИЙ СОВЕРШЕННОГО ВИДА: группа 1: в (v) вши (vshi) вшись группа (vshi) 2: ив (iv) ивши (ivshi) ившись ыв (ivshi) (yv) ывши (yvshi) ывшись группа (yvshi) 1 окончание должен следовать за а (a) или я (ia) В поиске окончания в классе, всегда выбирать самый длинный из класса. Так в seaching для СУЩЕСТВИТЕЛЬНОГО, заканчивающегося для величие (velichie), выберите ие (то есть) а не е (e). Раскройте н (n) средства, если слово заканчивает нн (nn), удалите последнее письмо. Вот теперь произошедшие правила. Все тесты имеют место в часть RV слова. Так в тесте на герундий совершенного вида, а (a) или я (ia), за которым должна следовать группа 1 окончание, должен самостоятельно быть в RV. Другими словами письма перед областью RV никогда не исследуются в процессе происхождения. Сделайте каждый из шагов 1, 2, 3 и 4. Шаг 1: Ищите окончание ГЕРУНДИЯ СОВЕРШЕННОГО ВИДА. Если Вы найдены, удаляют это, и это - тогда конец шага 1. Иначе попробуйте и удалите РЕФЛЕКСИВНОЕ окончание, и затем ищите в свою очередь (1) АДЪЕКТИВНОЕ, (2) ГЛАГОЛ или (3) окончание СУЩЕСТВИТЕЛЬНОГО. Как только одно из окончаний (1) к (3) найдено, удаляют это, и конечный шаг 1. Шаг 2: Если концы слова с и (i), удалите это. Шаг 3: Ищите ДЕРИВАЦИОННОЕ окончание в R2 (то есть все окончание должно лечь в R2), и если Вы найдены, удалите это. Шаг 4: (1) Раскрывают н (n), или, (2), если концы слова с ПРЕВОСХОДНЫМ окончанием, удалите его и раскройте н (n), или (3), если слово заканчивает ь ('') (мягкий знак) удаляют это.
Текст доволно специфический. С лета, быстро перевести не представляется возможным. Можно попробывать, но только не за спасибо. Обратитесь в бюро переводов.
Похожие вопросы
- Помогите пожалуйста перевести текст с английского на русский, очень нужно для поступления. Сам в английском не очень.
- Помогите, пожалуйста, перевести текст с английского на русский... очень надо
- Переведите, пожалуйста, с английского на русский. Только не предлагать перевести через онлайн переводчик
- Переведите, пожалуйста, с английского на русский.
- Переведите пожалуйста с английского на русский.Pashtun people.
- Переведите пожалуйста с английского на русский!!!
- переведите пожалуйста с английского на русский немножко (без онлайн перевода ) 10 баллов
- Переведите пожалуйста с английского на русский
- Переведите пожалуйста с английского на русский!
- Переведите, пожалуйста с английского на русский (для тех, кто действительно владеет языком)