Матюгальник - проблемы с чтением русского текста из потока
Привет. Вот описание моей проги:
Код:
/**
* matygalnik (матюгальник)
*
* usage
* stdin | matyk | stdout
* for example see how using grep command
* используйте так же как комманду grep
* заменяет некоторую часть слов на матерные
*
* скомпелируйте программу с опцией -D HTML=1 если хотите
* конвертировать web-страницы
*
* author Atrill
* version 0.7.4
* copyright GPL 2
* date 28.06.2009
*/
Проблема в том, что я не могу прочитать поток функцией getc в никсах, т.к. там с кодировкой непонятно что. Думал что каждый символ нормально занимает 2 байта - нет. Одни символы занимают 1 байт, а другие 2. Пока всё работает, но всё же хотелось бы читать поток через getc отдельными символами.
Кто-нибудь подскажет как это сделать? Исходники прилагаются.