Показать сообщение отдельно

  #3  
Старый 30.10.2016, 14:09
fire-dance
Постоянный
Регистрация: 12.05.2015
Сообщений: 974
С нами: 5792726

Репутация: 12


По умолчанию

Цитата:
Сообщение от takitano  

Для тех, кому нужны умляуты или другие европейские спецбуквы, которэ имеют привычку преврашаться в кракозяблы после конвертации между UTF-8/Win1252...

Код:
sed -f fix.sed < datei.txt > UTF-8_WIN_1252.txt
fix.sed:

Код:
s/ä/ä/g
s/ö/ö/g
s/ü/ü/g
s/Ä/Ä/g
s/Ö/Ö/g
s/Ü/Ü/g
s/ß/ß/g
s/á/á/g
s/Ã /à/g
s/â/â/g
s/Á/Á/g
s/À/À/g
s/Â/Â/g
s/é/é/g
s/è/è/g
s/ê/ê/g
s/É/É/g
s/È/È/g
s/Ê/Ê/g
s/Ã/í/g
s/ì/ì/g
s/î/î/g
s/Í/Í/g
s/ÃŒ/Ì/g
s/ÃŽ/Î/g
s/ó/ó/g
s/ò/ò/g
s/ô/ô/g
s/Ó/Ó/g
s/Ã’/Ò/g
s/Ô/Ô/g
s/ú/ú/g
s/ù/ù/g
s/û/û/g
s/Ú/Ú/g
s/Ù/Ù/g
s/Û/Û/g
Работает не всегда точно! Так что всегда сохраняйте исходник.

я в линуксе не очень за кракозябры знаю там их полно но мыла не хотел удалять

Можно пробывать чистить словарь таким способом уменьшая словарь 5-10 гиг может скинет
 
Ответить с цитированием