Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   С/С++, C#, Delphi, .NET, Asm (https://forum.antichat.xyz/forumdisplay.php?f=24)
-   -   [Delphi][Sockets] проблемы с получением изображения (https://forum.antichat.xyz/showthread.php?t=79586)

vvs777 04.08.2008 07:42

[Delphi][Sockets] проблемы с получением изображения
 
Прошу помочь разобраться а то я че-то торможу не могу понять откуда берется г**но.

Delphi. Uses WinSock.
TCP. Connect на 80 порт, GET, save to file.

Код:

function wsrecvstring(mailsocket:TSocket; var L:Longint):string;
var
  buffer:array[1..64000] of byte;
  i:integer;
  buffstr:string;
begin
    buffstr:='';
    fillchar(buffer,sizeof(buffer),0);
    l:=winsock.recv(mailsocket,buffer[1],sizeof(buffer),0);
    if L>0 then
    for i:=1 to L do
    begin
          buffstr:=buffstr+chr(buffer[i]);
    end;
    try
        result:=buffstr;
    except
        result:='';
    end;
end;

...
heads:='';
heads:=wsrecvstring(mysock,L);
np:=1;
repeat
          s:=wsrecvstring(mysock,L);
          heads:=heads+s;
until l<1;

При этом в полученном содержимом (для хтмл-страниц оно неипет, а вот бинарники засирает)
иногда появляются конструкции вида
Цитата:

13#10 //CRLF
послед_3-4_символа
13#10 //CRLF
это типа слитно.
Например
Цитата:

HTTP/1.1 200 OK
...
Content-Type: image/jpeg

1000
яШяа JFIF...
- ср**ая тысяча
потом в том эе файле еще раз она же, потом f56, 5321, и в разных файлах свое. В конце 0 и неско CRLF подрял.
Откуда берется не ясно.
Данные (картинки и тестовые до 25кб - остальные не пробовал) с сервера приходят одним цельным пакетом (когда-то сталкивался с тем что на некоторых серваках заголовок идет одним пакетом, данные остальными, потом увидел что это не обязательно
и если это криво склеивать вместе...
хотя у меня не криво
heads:=heads+s; без мусора.
).

Может кто видел это раньше?
PS: предложения типа юзай wininet/indy/nm/fp не принимаются. Надо на сокетах и только.

alamat 04.08.2008 11:07

У меня тоже была такая хня и до сих пор есть на некоторых HTTP серверах... непонятно откуда она берется.. но я бы посоветовал почитать rfc

slesh 04.08.2008 13:22

лучше читай чуть по другому.
Код:

var
  buffer:array[0..64000] of byte;
  i:integer;
  buffstr:string;
begin
  buffstr:='';
  repeat
    l:=winsock.recv(mailsocket,buffer,sizeof(buffer),0);
    buffstr:=buffstr+copy(buffer,1,l);
  until l<=0;
  result:=buffstr;

может быть чуть не правильно. нет компилятора под рукой проверить.
но примерно так ты скачаешь полностью всё что прислал сервер.
А на счет тысячи - хз сам встречался что добавляют.

vvs777 04.08.2008 15:09

В принципе да, copy(buffer,1,l);.
Но я же говорю, все приходит одним пакетом!!!
Лажа находится в середине пакета, прочитанного за 1 вызов recv().
Вот в чем проблема.
Неужели приййдется юзать WSARecv? я ж это ненавижу...
Вот заюзал wsaRecvEx(), теперь каждый файл состоит из 2 кусков, опять тысяча в начале и все, 2-3 лажи во втрором куске и ноль в конце...
Как с этим браузеры борятся, не могу понять.
И никогда раньше не слышал о том что сервер может вставлять куски хлама в данные. Только заголовки!

life96 04.08.2008 23:17

это протокол Http/1.1 Imho
попробуй как то заставить работать в Http/1.0, там этого нет
(как - не знаю, но это определятся запросом Get)

slesh 05.08.2008 09:39

дык это и есть в запросе
GET /image.jpg HTTP/1.0 или GET /image.jpg HTTP/1.1

life96 05.08.2008 09:55

ну правильно, но я же не знаю как он там (или кто за него) запросы формирует :)
вчера кстати попробовал загружать картинки с нескольких серверов, никто в режиме HTTP/1.1 чанки не использовал %( vvs777 дай пример сервера с которым у тебя "проблемы"

vvs777 09.08.2008 02:40

Нашел в чем дело, топик можно закрывать.
в логи если глянуть - Chunked. Вот его надо было обрабатывать.


Время: 12:08