ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
|
Результаты опроса: Какую кодировку предпочитаешь ты?
|
|
cp1251
|
  
|
18 |
1.70% |
|
utf-8
|
  
|
1,039 |
98.30% |
 |
|

06.11.2008, 16:11
|
|
Познавший АНТИЧАТ
Регистрация: 01.06.2008
Сообщений: 1,047
Провел на форуме: 5321514
Репутация:
3313
|
|
Смысл гонятся за меньшим размером? У вас диски по 100 мб, скорость интернета 32 кб в секунду? С использованием UTF-8 не будет проблем с MySQL, http-запросами...
-=lebed=-, читай статью внимательнее:
Во-вторых, хочется оспорить то, что страницы на utf8 имеют гораздо больший размер, чем на cp1251. Символы ASCII(латиница, арабские цифры, знаки препинания и т.д.) занимают в utf8 всего один байт, так же как и в cp1251. Таким образом при создании страниц на латинице никаких увеличений в размере страниц не наблюдается. С кириллицей — согласен. Если документ содержит только буквы русского алфавита и никаких других символов (что, согласитесь, бывает достаточно редко, ибо без html-тегов не сильно обойдешься  ) — то в UTF‑8 он действительно станет в два раза больше. А если в нём, например, поровну русских и арабских букв — в UTF‑8 он будет в два раза меньше, чем, например, в cp1251. Чаще всего — основной вес страницы составляет не html-код, а всякого рода javascript, flash, картинки, css и т.д. Тем, кто заботится о «весе», следовало бы в первую очередь выкинуть из кода подстановки для тех символов, которым они не нужны, например, — для длинного тире или для неразрывного пробела (ой, как часто я вижу это в страницах новичков). Видим, что вместо 1 знака длинного тире мы пишем 6, вместо 1 знака неразрывного пробела мы пишем 5 знаков. И где же экономия? Действительно, иногда доходит до маразма — некто упирается: «Не буду делать страницы в UTF‑8, потому что они от этого увеличиваются» — а сам при этом ваяет код с жуткими атрибутами и подстановками, который без них мог бы быть в пять раз короче.
Последний раз редактировалось ChaaK; 06.11.2008 в 16:13..
|
|
|

06.11.2008, 16:14
|
|
Постоянный
Регистрация: 19.02.2008
Сообщений: 438
Провел на форуме: 956872
Репутация:
186
|
|
Я за cp1251 т.к. привычнее, с utf-8 очень мало работал.
|
|
|

06.11.2008, 16:17
|
|
Постоянный
Регистрация: 02.07.2008
Сообщений: 472
Провел на форуме: 3728999
Репутация:
444
|
|
В UTF-8 один знак занимает от одного до четырёх байт, в зависимости от языка. для русского - два, для латиницы - 1, а во всех остальных CP-1251, KOI-8r, Cyrillic Mac, DOS всего один и соответственно размер файла меньше)) я за CP-1251, да и в привычку уже вошло))
|
|
|

06.11.2008, 16:18
|
|
наркоман с медалью
Регистрация: 07.05.2005
Сообщений: 3,704
Провел на форуме: 19975136
Репутация:
4536
|
|
привычка дело такое... тем более никаких сложностей перевести на утф8 нету.
|
|
|

06.11.2008, 16:19
|
|
Флудер
Регистрация: 21.06.2006
Сообщений: 3,193
Провел на форуме: 12702287
Репутация:
4738
|
|
По мне: меньше код-удобней кодировка. С html - согласен - пример не очень удачный, вот работа с удалённой базой в UTF-8, где данные в кирилице будет ощутима разница в объёме по сравнению с латиницей.
|
|
|

06.11.2008, 16:20
|
|
наркоман с медалью
Регистрация: 07.05.2005
Сообщений: 3,704
Провел на форуме: 19975136
Репутация:
4536
|
|
пиздец
|
|
|

06.11.2008, 16:21
|
|
Постоянный
Регистрация: 02.07.2008
Сообщений: 472
Провел на форуме: 3728999
Репутация:
444
|
|
Смысл гонятся за меньшим размером? У вас диски по 100 мб, скорость интернета 32 кб в секунду? С использованием UTF-8 не будет проблем с MySQL, http-запросами...
что правда - то правда!!!
|
|
|

06.11.2008, 16:26
|
|
Pagan Heart
Регистрация: 12.08.2004
Сообщений: 3,791
Провел на форуме: 6490435
Репутация:
2290
|
|
Хотя у себя на компе предпочитаю cp1251 т.к. из под винды.
Даже стандартный блокнот работает с утф8.
а какие минусы у утф8, кроме ее плюсов?
Никаких.
На некоторых текстах занимет больше места. Но может и меньше занимать за счет отсутствия &xxxx; в HTML.
см. пост выше, отредактил, как это выливается в "реальные" деньги...
Интересно посмотреть, как китайцы и т.д. пишут в cp1251. Расскажешь? )
Да и UTF16 там какой-то. UTF8 не 2хбайтовый.
Ты тоже матчасть учи. UTF8 не 2хбайтовый.
|
|
|

06.11.2008, 16:30
|
|
Постоянный
Регистрация: 19.02.2008
Сообщений: 438
Провел на форуме: 956872
Репутация:
186
|
|
Вот маленький пример -
Сейчас идут споры, чтобы в России заменить "и" на "i", подсчитали примерно сколько бы было денег сэкономлено (печать и т.д.), так вот, вышли миллионы $... Вот и смотрим разницу между cp1251 и utf-8. И не говорите, что вес не имеет значения.
|
|
|

06.11.2008, 16:42
|
|
Флудер
Регистрация: 21.06.2006
Сообщений: 3,193
Провел на форуме: 12702287
Репутация:
4738
|
|
Сообщение от nerezus
Даже стандартный блокнот работает с утф8.
Никаких.
На некоторых текстах занимет больше места. Но может и меньше занимать за счет отсутствия &xxxx; в HTML.
Интересно посмотреть, как китайцы и т.д. пишут в cp1251. Расскажешь? )
Да и UTF16 там какой-то. UTF8 не 2хбайтовый.
Ты тоже матчасть учи. UTF8 не 2хбайтовый.
2nerezus ты китаец? 1251 - национальная кодировка для России, речь шла про неё.
Кто говорил что UTF8 двухбайтовый? от 1 до 4 байт!
на кирилический символ уходит 2 байта и это верно!
Вот тебе два сообщения:
Код:
Пример текста
имхо тут сразу всё видно...
P.S. "Про какой-то UTF16" можно тут почитать: http://ru.wikipedia.org/wiki/UTF-16
Последний раз редактировалось -=lebed=-; 06.11.2008 в 16:54..
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|