![]() |
cp1251 VS utf-8
Собственно хотелось бы с вами пообсуждать кто какую кодировку предпочитает и кто какие плюсы и минусы видит в них обеих. Просто лазия по инету вижу совершенно противоположные мнения по этому поводу...
От себя скажу, что с юникодом работаю не так давно, примерно месяц, но уже увидел плюсы этой кодировки..и ни разу не замечал чтобы вес страниц повышался в два раза, немного вырастает конечно, но не в два это точно. Ну и конечно поддержка бОльшего количества символов. Ну так вот, хотелось бы узнать кто считает что русский текст должен быть в ср1251, а кто считает что юникод кодировка будущего)) Просьба без флуда и обосновывать свои выводы :) |
юникод, оф корз )
собственно из-за нормальной поддержки языков |
Юзаю cp1251 - привычка...
|
UTF-8 из-за юниксов.
Хотя у себя на компе предпочитаю cp1251 т.к. из под винды. Но проголосовал за UTF-8 |
http://habrahabr.ru/blogs/webdev/38026/
— Очень хорошая статья. |
1251 имхо,но и utf-8 имеет и будет иметь всегда будущее.
|
а какие минусы у утф8, кроме ее плюсов?
|
проголосовал за UTF-8.
UTF-8 удобно любой движок с других языков переводить на русский. не нужно БД движка перекодировывать. |
Цитата:
Наглядный пример: отправка SMS. В кириллице вы отправите сообщение длинной в два раза меньше чем в латинице, так что выгоднее писать транслитом (что я всегда и делаю, иначе SMS-ка разобьётся на 2 части и придётся платить за 2 SMS). Наглядный пример того как юникод UTF8 бьёт по карману (была бы CP1251 - разницы бы не было в чём я пишу SMS в латинице или в кирилице). |
причем в 2 раза
|
и вам ее жалко? у вас на серверах по 256 мб и диски на 2 гига?
|
Цитата:
|
да не бьет она по карману, это пересчет копеек. пример с смс вообще не в тему.
|
Не вижу смысла юзать utf-8 на русскоязычных сайтах. так что за cp1251
|
Проголосовал за utf-8. Т.к. сам сижу из под никсов, и как правильно написал UnPazz не нужно БД перекодировать.
|
Цитата:
|
Цитата:
Цитата:
P.S. Т.е. уже одно то, что в кирилице я отправлю 1 сообщение короче чем в латинице уже не гуд!. |
это заганялово
|
Цитата:
P.S. Тоже самое касается передачи данных по сети по тарифам с подсчётом трафика, как известно он меряется в байтах, килобайтах, мегабайтах и т.д. Серфя сайты в юникоде ты заплатишь больше бабла чем в 1251. Тоже касается и хостинга с ограниченным траффиком - в юникоде он кончится быстрее чем в 1251, если используется кирилица... |
так я уже сказал все
|
Смысл гонятся за меньшим размером? У вас диски по 100 мб, скорость интернета 32 кб в секунду? С использованием UTF-8 не будет проблем с MySQL, http-запросами...
-=lebed=-, читай статью внимательнее: Цитата:
|
Я за cp1251 т.к. привычнее, с utf-8 очень мало работал.
|
В UTF-8 один знак занимает от одного до четырёх байт, в зависимости от языка. для русского - два, для латиницы - 1, а во всех остальных CP-1251, KOI-8r, Cyrillic Mac, DOS всего один и соответственно размер файла меньше)) я за CP-1251, да и в привычку уже вошло))
|
привычка дело такое... тем более никаких сложностей перевести на утф8 нету.
|
По мне: меньше код-удобней кодировка. С html - согласен - пример не очень удачный, вот работа с удалённой базой в UTF-8, где данные в кирилице будет ощутима разница в объёме по сравнению с латиницей.
|
пиздец
|
Цитата:
|
Цитата:
Цитата:
На некоторых текстах занимет больше места. Но может и меньше занимать за счет отсутствия &xxxx; в HTML. Цитата:
Да и UTF16 там какой-то. UTF8 не 2хбайтовый. Цитата:
|
Вот маленький пример -
Сейчас идут споры, чтобы в России заменить "и" на "i", подсчитали примерно сколько бы было денег сэкономлено (печать и т.д.), так вот, вышли миллионы $... Вот и смотрим разницу между cp1251 и utf-8. И не говорите, что вес не имеет значения. |
Цитата:
Кто говорил что UTF8 двухбайтовый? от 1 до 4 байт! на кирилический символ уходит 2 байта и это верно! Вот тебе два сообщения: Код:
Пример текстаКод:
Пример текстаP.S. "Про какой-то UTF16" можно тут почитать: http://ru.wikipedia.org/wiki/UTF-16 |
Цитата:
В какой кодировке должна отправляться СМС из Украины в Россию? Подумай над этим вопросом. Поймешь. Цитата:
|
Цитата:
По поводу кодировки SMS: Максимальный размер сообщения в стандарте GSM — 140 байт и всё, как хочешь так и кодируй, хоть в BinHEX! Цитата:
|
Цитата:
Допустим, внутри страны была бы cp1251. Ну тогда просто операторы подняли бы цены на смс. И все стало бы на свои места. Тебе не кажется, что цены за смс-трафик(в прямом смысле слова трафик, т.е. за мегабайт, к примеру) немного неадекватны? )) |
Цитата:
Пользуясь латиницей я могу передать больше информации за те же деньги, чем используя кирилицу, и я знаю почему это так, и поэтому я этим пользуюсь (как и многие другие). Кстати 1251 содержит и многие украинские символы, так что можно было бы передавать и в 1251. Просто те, кто херачат СМС в национальных кодировках более чем 70 символов, попросту теряют бабло на этом и это факт неоспоримый, почему? Из-за кодировки, потому как 71 символ - это уже ДВА СМС, т.е. двойной тариф! |
совмещаю обе.
вот послушал вас и теперь загрузился на тему. наверное я совсем не рационально их юзал =( |
-=lebed=-, сейчас у тебя нет выбора. cp1251 ты все равно не можешь юзать %)
|
проголосовал за Unicode UTF-8
|
Цитата:
Так что выбор есть! Надо просто пользоваться, а не тупо идти на поводу тех, кто зарабатывает бабло на этом, ну скажите нахрена мне редко-используемые символы кириллицы? Посмотрите сколько там символов http://ru.wikipedia.org/wiki/Кириллица_в_Юникоде и как они выглядят! По мне хватит и 33 (а лучше 32 - так в полубайт укладываемся) Азбука морзе - тоже весчь не плохая, можно было и ей кодировать точка - 0, тире - 1 красота! (http://ru.wikipedia.org/wiki/Азбука_Морзе) UTF-8 избыточнена для одного национального алфавита, это видно невооружённым глазом, неспорю, что удобна в мировом масштабе для разных алфавитов, различных наций... P.S. Ну с SMS всех обламали - это же очевидно, заложив многонациональную кодировку (в конкретном случае UTF16) а использующие латиницу нации остались в плюсе...ну и я юзаю, потому как 70 символов мне часто мало, а два СМС - жирно... ;) |
чего ты приелся к этим смс?
|
Цитата:
P.S. И вообще сравнение если честно некорректное, если уж сравнивать то KOI-8R и 1251 или UTF8 и UTF16, потому как это всё равно что говорить что лучше 8 битный проц или 16-ти битный, что лучше 32 битная винда или 64 битная, что лучше 128 битный хэш или 256 битный (он не чем не лучше просто более стойкий к коллизиям, но опять же минус - больше места занимает) для каждых задач нужен свой размер, сейчас например хэш от 100 бит считается стойким, завтра от 128, после завтра от 160 и т.д. скорости, мощности растут ;) Для кодирования кириллицы 1251 хватает "за глаза" (есть конечно проблемы, не спорю, но выгод сейчас пока больше). Юникод победит, но и другие нац. кодировки ещё жить долго будут... есть кстати ещё минусы UTF, в частности при передаче данных с потерями и восстановлении данных с помощью контрольных сумм, но не буду в это углублятся, подумайте сами... P.S. Приведёт ли кто-нибудь плюсы UTF? |
| Время: 21:41 |