HOME FORUMS MEMBERS RECENT POSTS LOG IN  
× Авторизация
Имя пользователя:
Пароль:
Нет аккаунта? Регистрация
Баннер 1   Баннер 2
НОВЫЕ ТОРГОВАЯ НОВОСТИ ЧАТ
loading...
Скрыть
Вернуться   ANTICHAT > ПРОГРАММИРОВАНИЕ > PHP
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

Умные парсеры
  #1  
Старый 10.11.2008, 09:15
MafiaBoy3
Banned
Регистрация: 14.04.2007
Сообщений: 297
С нами: 10040168

Репутация: 38
По умолчанию Умные парсеры

Вообщем хочу написать парсер на php , которыйпарсит загруженную страницу вот по такому вот алгоритму:
1. найти в тексте все имена людей и
записать их в файл отдельно
2. найти в тексте все глаголы (Past simple tense) и также записать их в файл отдельно..


Вопрос: Это вообще реально ли?
Можно ли это как то будет ускорить?
 
Ответить с цитированием

  #2  
Старый 10.11.2008, 10:12
-=lebed=-
Флудер
Регистрация: 21.06.2006
Сообщений: 3,193
С нами: 10467746

Репутация: 4738


По умолчанию

Цитата:
Сообщение от MafiaBoy3  
Вообщем хочу написать парсер на php , которыйпарсит загруженную страницу вот по такому вот алгоритму:
1. найти в тексте все имена людей и
записать их в файл отдельно
2. найти в тексте все глаголы (Past simple tense) и также записать их в файл отдельно..


Вопрос: Это вообще реально ли?
Можно ли это как то будет ускорить?
Реально, если есть словарь глаголов и отдельно имён.
Если без словарей, анализировать где глагог, а где имя каким образом будешь? Попахивает лингвистическим анализатором, сам ты его сходу точно быстро не напишешь...
 
Ответить с цитированием

  #3  
Старый 10.11.2008, 11:12
MafiaBoy3
Banned
Регистрация: 14.04.2007
Сообщений: 297
С нами: 10040168

Репутация: 38
По умолчанию

спасибо а если этих самых имён и глаголов более 10.000 тыс. стоит ли?
И какова будет скорость?
 
Ответить с цитированием

  #4  
Старый 10.11.2008, 11:21
-=lebed=-
Флудер
Регистрация: 21.06.2006
Сообщений: 3,193
С нами: 10467746

Репутация: 4738


По умолчанию

Цитата:
Сообщение от MafiaBoy3  
спасибо а если этих самых имён и глаголов более 10.000 тыс. стоит ли?
И какова будет скорость?
Не знаю, но если заюзаешь регулярки, имхо, должно относительно быстро получиться...
 
Ответить с цитированием

  #5  
Старый 10.11.2008, 11:34
MafiaBoy3
Banned
Регистрация: 14.04.2007
Сообщений: 297
С нами: 10040168

Репутация: 38
По умолчанию

а как мне можно приучить паука чтобы он мог копировать страницы вконтакте в базу данных?

Вконтакте ведь запаролен
 
Ответить с цитированием

  #6  
Старый 10.11.2008, 11:40
Chaak
Познавший АНТИЧАТ
Регистрация: 01.06.2008
Сообщений: 1,047
С нами: 9443906

Репутация: 3313


По умолчанию

в http запрос добавляй cookiesы контакта.

Используй curl/zend_http_client, т.к с ними проще работать.

Последний раз редактировалось ChaaK; 10.11.2008 в 11:44..
 
Ответить с цитированием

  #7  
Старый 10.11.2008, 11:49
MafiaBoy3
Banned
Регистрация: 14.04.2007
Сообщений: 297
С нами: 10040168

Репутация: 38
По умолчанию

ChaaK
Где можно почиать на русском так чтобы выучить ра и навсегда про curl/zend_http_client?
 
Ответить с цитированием

  #8  
Старый 10.11.2008, 11:55
Chaak
Познавший АНТИЧАТ
Регистрация: 01.06.2008
Сообщений: 1,047
С нами: 9443906

Репутация: 3313


По умолчанию

Google.com -> работа с curl sitehpclub.ru

Не могу дать прямой ссылки, т.к сижу с тела
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Парсеры (php) Sov1et Разное - Покупка, продажа, обмен 5 24.08.2008 14:51



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT ™ © 2001- Antichat Kft.

×

Создать сделку

Продавец: ник или ID

Название сделки:

Сумма USDT:

Срок сделки, дней:

Кто платит комиссию:

Условия сделки:

После создания сделки средства будут зарезервированы в холде до завершения сделки.

×

Мои сделки

Загрузка...
×

Сделка


Загрузка чата...