Частотная статистика русского языка

1593 0

Некоторые статистические данные об использовании русских слов


  • Средняя длина слова 5,3 символа.

  • Средняя длина предложения 10,4 слова.

  • 1000 наиболее частотных лемм покрывает 64,1% текста.

  • 2000 наиболее частотных лемм покрывают 75,0% текста.

  • 3000 наиболее частотных лемм покрывают 76,5% текста.

  • 5000 наиболее частотных лемм покрывают 82,1% текста.

***


Отсюда.

Оценка информации
Голосование
загрузка...
Поделиться:

Оставить комментарий

Вы вошли как Гость. Вы можете авторизоваться

Будте вежливы. Не ругайтесь. Оффтоп тоже не приветствуем. Спам убивается моментально.
Оставляя комментарий Вы соглашаетесь с правилами сайта.

(Обязательно)