PDA

Просмотр полной версии : Выдирание инфы со странички


klin
19.08.2007, 16:25
Доброго дня.
Не знаю как даже правильно спросить, поэтому не обезсудьте.

Мне надо с сайта выдрать информацию о товаре.
На странице идет список товаров, при кликаньи мыши по наименованию товара, в том же окне открывается окно с характеристиками товара.
Перечень названий характеристик всегда одинаков.

Например

Товар1
Товар2
Товар3
Товар4

Кликаем по второму товару, открываем страницу

Товар2
----Вес
----Цвет
----Размер


Чтобы мне вручную это сделать, - ужоснах!
Там примерно 5000 наименований.

Мне надо перегнать в Excell и отсортировать как мне нужно
Есть ли такие проги, которые помогли бы автоматизировать хоть частично проект.
Ну или на крайняк в какую сторону топать если прогу создавать... :confused:

n1†R0x
19.08.2007, 16:48
Топать в сторону регулярных выражений.

http://ru.php.net/manual/ru/reference.pcre.pattern.syntax.php
http://ru.php.net/manual/ru/reference.pcre.pattern.modifiers.php

погугли, на пхп.нет инфа по регуляркам не очень перевариваемая имхо)

k1b0rg
19.08.2007, 17:14
Смотри твой алгоритм.

Законектится на сайт ,пропарсить все товары, занести в массив, id товара.
Дальше пробегая по этому массиву, заходишь непосредственно на сам товар. Парсишь его данные, опять заноссишь в массив. Лучше сделать какой-нить двумерный массив.

id =>
name =>123
cost => 666
и т.д. Далее бегаешь по массиву ,и заносишь данные в ексель.

Вот тебе самый просто алгоритм.

Чтобы его реализовать посмотри маны по
fsockopen или fopen
preg_match_all
работа с COM объектами...например с экселем смотри здесь http://develop83.hocomua.ru/?%D1%F2%E0%F2%FC%E8:PHP_%F7%E0%F1%F2%FC_2%3A:%C8%E 7_PHP_%E2_Excel%3A_%F0%E0%E1%EE%F2%E0_%F1_COM-%EE%E1%FA%E5%EA%F2%E0%EC%E8_%3A_%C2%E2%E5%E4%E5%ED %E8%E5