![]() |
Умные парсеры
Вообщем хочу написать парсер на php , которыйпарсит загруженную страницу вот по такому вот алгоритму:
1. найти в тексте все имена людей и записать их в файл отдельно 2. найти в тексте все глаголы (Past simple tense) и также записать их в файл отдельно.. Вопрос: Это вообще реально ли? Можно ли это как то будет ускорить? |
Цитата:
Если без словарей, анализировать где глагог, а где имя каким образом будешь? Попахивает лингвистическим анализатором, сам ты его сходу точно быстро не напишешь... |
спасибо а если этих самых имён и глаголов более 10.000 тыс. стоит ли?
И какова будет скорость? |
Цитата:
|
а как мне можно приучить паука чтобы он мог копировать страницы вконтакте в базу данных?
Вконтакте ведь запаролен |
в http запрос добавляй cookiesы контакта.
Используй curl/zend_http_client, т.к с ними проще работать. |
ChaaK
Где можно почиать на русском так чтобы выучить ра и навсегда про curl/zend_http_client? |
Google.com -> работа с curl site:phpclub.ru
Не могу дать прямой ссылки, т.к сижу с тела |
| Время: 20:35 |