Показать сообщение отдельно

  #3  
Старый 12.10.2007, 17:34
DWORD
Участник форума
Регистрация: 24.07.2007
Сообщений: 138
Провел на форуме:
165671

Репутация: 215
По умолчанию

Цитата:
Скорее всего дело в различном способе парсинга символов в char-коды. Букве "д" соответствует код 228, а вот httpUtility.Urlencode(string) не поддерживает символы большими кодами, и поэтому раскладывает код на два числа:
%e4 = %d0 + %b4 (т.е. 228 = 208 + 20),
Вот так загнул ну ты даешь! %d0%b4 это просто UTF8 представление буквы.
Если интересно вот алгоритм на php как составляется UTF8 из cp1251
Код:
function CP1251toUTF8($string){
	$out = '';
	for ($i = 0; $i<strlen($string); ++$i){
		$ch = ord($string{$i});
		if ($ch < 0x80)
			$out .= chr($ch);
		else
			if($ch >= 0xC0)
				if($ch < 0xF0)
					$out .= "\xD0".chr(0x90 + $ch - 0xC0);
				else
					$out .= "\xD1".chr(0x80 + $ch - 0xF0);
			else
			switch($ch){
				case 0xA8: $out .= "\xD0\x81"; break;
				case 0xB8: $out .= "\xD1\x91"; break;
			   	case 0xA1: $out .= "\xD0\x8E"; break;
				case 0xA2: $out .= "\xD1\x9E"; break;
				case 0xAA: $out .= "\xD0\x84"; break;
				case 0xAF: $out .= "\xD0\x87"; break;
				case 0xB2: $out .= "\xD0\x86"; break;
				case 0xB3: $out .= "\xD1\x96"; break;
				case 0xBA: $out .= "\xD1\x94"; break;
				case 0xBF: $out .= "\xD1\x97"; break;
				case 0x8C: $out .= "\xD3\x90"; break;
				case 0x8D: $out .= "\xD3\x96"; break;
				case 0x8E: $out .= "\xD2\xAA"; break;
				case 0x8F: $out .= "\xD3\xB2"; break;
				case 0x9C: $out .= "\xD3\x91"; break;
				case 0x9D: $out .= "\xD3\x97"; break;
				case 0x9E: $out .= "\xD2\xAB"; break;
				case 0x9F: $out .= "\xD3\xB3"; break;
			}
	}
	return $out;
}
 
Ответить с цитированием