в общем есть такая тема как Алгоритм Хаффмана. высчитывается вероятность повторения каждого символа и делится на общее количество символов. потом строется дерево хаффмана - каждому символу присваивается двоичный код,получается файл, содержащий 0 и 1. а строку 11111111111110(14 байт) можно например сжать в m0 (m - 13 буква алфавита, 13 единиц) получили , что сжатие в 7 раз...
ну вот...
Вот Пеленг део говорит,я так же думал,а значит и знаю