![]() |
Парсер текста
В паблике нормальных не нашел поэтому написал свой.
Собирает тексты с http://www.sexytales.ru/ Адалт тематика. [+]Убирает теги [+]Разбивает все по текстам и сохраняет [+]Разбивает по категориям Требует php+cURL+chmod 777 Кому не охота загоняться уже спарсенные ~150 метров текста разбитые по категориям.Правда в них есть мусор. Парсер Тексты |
Цитата:
2. sizeof быстрее count. Предлагаю исправить на следующее Цитата:
Цитата:
Цитата:
|
Цитата:
|
Цитата:
|
Цитата:
А насчет sizeof, то тесты показали, что функция быстрее. |
алиас функции работает быстрее, чем сама функция? 0_о
Цитата:
вот погуглил, сразу же нашел: http://www.andreas-glaser.com/2008/08/19/php-count-vs-sizeof/ разницы никакой |
Цитата:
|
вот этот комент чтоли?
http://habrahabr.ru/blogs/php/22799/#comment_538772 по-моему также безосновательно... |
Цитата:
2)sizeof не может быть быстрее count , потому что sizeof это function sizeof($p) { return count($p); } |
Цитата:
Цитата:
|
Исходный код не смотрел, но насколко я помню в манах функции count() на php.net написано, что count() является псевдонимом sizeof(). То есть это одна и та же функция. Кстати вот А вообще раздел SEO и раздел о пыхе это 2 разных раздела =). Комрад вообще-то старался, и выложил скрипт за спасибо, но спасибо так и не услышал.
|
а можно перезалить?
ТС, а скрипт парсит только с указанного сайта, если ему подменить урл другой сайт парсить не будет? |
Цитата:
скрипт написан специально под данный сайт. Если подменить урл то ничего не выйдет, если только структура другого сайта будет точно такой же. |
Цитата:
|
не имею исходника, но если в цикле переменная не меняется, тогда всё проще:
$count_pages = count($pages); while($i<$count_pages) |
скрипт удален с народа.
может ТС будет так любезен перезалить?) (хочу посмотреть исходник для себя) Дайте ссылочку на другие парсеры текстов, плз.. Надо хоть когда-то и свой написать=)) |
Цитата:
|
Цитата:
http://forum.antichat.ru/thread89109.html http://forum.antichat.ru/thread24603.html |
паресер слов http://company.yandex.ru/technology/mystem/
есть и сорцы |
Цитата:
|
а перезалить можно?
|
еще один суперский и простой парсер , рекомендую
|
| Время: 09:23 |