Лингвистика

Расскажите что такое закон Ципфа, как и для чего его применяют?

Хотелось бы самому привести эксперимент по закону Ципфа и получить экспериментальные данные подтверждающие закон. Как провести такой эксперимент?
Я знаю из курса лексикологии про этот закон то, что фонетическая длина лексемы обратнопропорциональна частотности употреблеия слова в речи, а количество значений у лексемы прямопропорционально частотности употребления слова в речи. Вроде это два разных закона, они объясняют разные языковые явления, например, многозначность слова. А вот как применить этот закон на приведенном тексте непонятно, может, кусок текста слишком мал для анализа. Посмотрите частотные словари, может там какая-нибудь информация в приложениях приводится.
Может, следует делать наоборот: сравнивать данные частотного словаря с текстом, потому что те данные, что вы приводите, взяты из специализированного текста, и прослеживается, например, что частотно употребительный союз "А" встречается в тексте одинаково часто, как и слово "ВЕРОЯТНОСТНЫЙ". Что, конечно, для речи не характерно.
АП
Алексей Покровский
607
Лучший ответ
Закон Ципфа (Зипфа) -эмпирическая закономерность распределения частоты слов естественного языка: если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка) . Например второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и т. д.
Закон Ципфа (Зипфа) — эмпирическая закономерность распределения частоты слов естественного языка: если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка) . Например второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и т. д.

Закон носит имя своего первооткрывателя — американского лингвиста Джорджа Ципфа (George Kingsley Zipf) из Гарвардского университета.
Виталий Котин
Виталий Котин
1 050