W!z@rD
11.01.2009, 18:46
Всем добрый день...
Сегодня думал чем заняться после того как успешно сдал математику... (вчера был экзамен)
Вобщем написал утилиту, лоадер/гугл-парсер.
http://img380.imageshack.us/img380/7003/01112009202112ez3.jpg
1. Парсит гугл (пока только 1 страницу, 100 результатов, если будет продвижение, сделаю парсинг по страницам)
2. По идее передает работу плагинам, а именно циклом foreach начинает пробегать по всем элементам listView'a и передавать ссылку;
3. Если что-то нашли, интерфейс Check (реализованный в плагине) вернул true, то соответствующая строка изменяет цвет на розовый.
Реализовано:
1. Парсинг гугла; (Регулярное выражение - (?<=<(\S|\s)*)((?<=(href=('|"")+))|(?<=(href=))[^('|"")])([^'>""\s)]*)(?=('|""|[\S])?) );
2. Поддержка плагинов;
3. Демо пример плагина SQL-Injection (сделал сам, потом начал искать текста ошибок, в гугле вбил "ошибки во время sql injection" получил 1 ссылку - http://www.rsdn.ru/article/inet/SqlInjectionSearch.xml).
Ряд вопросов:
1. Необходим более опытный программист, который поможет разрулить с бизнес логикой;
2. Нужна грамотная реализация поддержки плагинов.
Кто поможет?
Планируется:
1. Реализация ведения лога путем добавления своего обработчика Exception'ов. При catch'ах генерация нового исключения с описанием ошибки;
2. Добавление многопоточности (Web);
3. Использование PE библиотеки от MS;
4. Выставление критериев поиска;
5. Собственные настройки для плагинов;
6. Визуальное сопровождение работы.
"Подводные камни"
1. Автоматически из списка ссылок (при парсинге гугла) исключаются ссылки содержащие в себе "google", не содержащие в себе "http";
2. При компиляции библиотека Core копируется в папку Plugins, проверял, по сути она там не нужна.
Требования:
.NET Framework 3.5
7Zip для распаковки архива
Бинарник - http://www.sendspace.com/file/b6tbxi 8Kb
Исходник - http://www.sendspace.com/file/pb4s69 32Kb
Сегодня думал чем заняться после того как успешно сдал математику... (вчера был экзамен)
Вобщем написал утилиту, лоадер/гугл-парсер.
http://img380.imageshack.us/img380/7003/01112009202112ez3.jpg
1. Парсит гугл (пока только 1 страницу, 100 результатов, если будет продвижение, сделаю парсинг по страницам)
2. По идее передает работу плагинам, а именно циклом foreach начинает пробегать по всем элементам listView'a и передавать ссылку;
3. Если что-то нашли, интерфейс Check (реализованный в плагине) вернул true, то соответствующая строка изменяет цвет на розовый.
Реализовано:
1. Парсинг гугла; (Регулярное выражение - (?<=<(\S|\s)*)((?<=(href=('|"")+))|(?<=(href=))[^('|"")])([^'>""\s)]*)(?=('|""|[\S])?) );
2. Поддержка плагинов;
3. Демо пример плагина SQL-Injection (сделал сам, потом начал искать текста ошибок, в гугле вбил "ошибки во время sql injection" получил 1 ссылку - http://www.rsdn.ru/article/inet/SqlInjectionSearch.xml).
Ряд вопросов:
1. Необходим более опытный программист, который поможет разрулить с бизнес логикой;
2. Нужна грамотная реализация поддержки плагинов.
Кто поможет?
Планируется:
1. Реализация ведения лога путем добавления своего обработчика Exception'ов. При catch'ах генерация нового исключения с описанием ошибки;
2. Добавление многопоточности (Web);
3. Использование PE библиотеки от MS;
4. Выставление критериев поиска;
5. Собственные настройки для плагинов;
6. Визуальное сопровождение работы.
"Подводные камни"
1. Автоматически из списка ссылок (при парсинге гугла) исключаются ссылки содержащие в себе "google", не содержащие в себе "http";
2. При компиляции библиотека Core копируется в папку Plugins, проверял, по сути она там не нужна.
Требования:
.NET Framework 3.5
7Zip для распаковки архива
Бинарник - http://www.sendspace.com/file/b6tbxi 8Kb
Исходник - http://www.sendspace.com/file/pb4s69 32Kb