Частотная статистика русского языка

1591 0

Некоторые статистические данные об использовании русских слов


  • Средняя длина слова 5,3 символа.

  • Средняя длина предложения 10,4 слова.

  • 1000 наиболее частотных лемм покрывает 64,1% текста.

  • 2000 наиболее частотных лемм покрывают 75,0% текста.

  • 3000 наиболее частотных лемм покрывают 76,5% текста.

  • 5000 наиболее частотных лемм покрывают 82,1% текста.

***


Отсюда.

Оценка информации
Голосование
загрузка...
Поделиться:

Оставить комментарий

Вы вошли как Гость. Вы можете авторизоваться

Будте вежливы. Не ругайтесь. Оффтоп тоже не приветствуем. Спам убивается моментально.
Оставляя комментарий Вы соглашаетесь с правилами сайта.

(Обязательно)

Информация о сайте

Ящик Пандоры — информационный сайт, на котором освещаются вопросы: науки, истории, религии, образования, культуры и политики.

Легенда гласит, что на сайте когда-то публиковались «тайные знания» – информация, которая долгое время была сокрыта, оставаясь лишь достоянием посвящённых. Ознакомившись с этой информацией, вы могли бы соприкоснуться с источником глубокой истины и взглянуть на мир другими глазами.
Однако в настоящее время, общеизвестно, что это только миф. Тем не менее ходят слухи, что «тайные знания» в той или иной форме публикуются на сайте, в потоке обычных новостей.
Вам предстоит открыть Ящик Пандоры и самостоятельно проверить, насколько легенда соответствует действительности.

Сайт может содержать контент, не предназначенный для лиц младше 18-ти лет. Прежде чем приступать к просмотру сайта, ознакомьтесь с разделами:

Со всеми вопросами и предложениями обращайтесь по почте info@pandoraopen.ru