![]() |
Cкрипт для отсеивания мыл
ку
встеретился с такй проблемой, есть тхт файл в нём станицы в которых мыла .не подскажете скрипт желательно на перле для отсеивания мыл с страниц типа парсера,может я не внимательно искал но вроди не нашол на форуме) спс |
|
что-то невразумительное ))
а по просче есть?хотя идея ясна |
Написал небольшой скрипт, по-прежнему не работает с двойными доменами (user@company.net.ua), но с обычными вроде норм, протестируйте плз)
PHP код:
|
Дети мои...
PHP код:
|
эффективнее же искать до первого пробела или переноса строки до и после собаки, и тогда не будет проблем с двойными и более доменами :)
|
Цитата:
представь себе, что мыла, предположим, в таком формате: PHP код:
|
вот тут глянь http://forum.antichat.ru/showpost.php?p=290912&postcount=44
а вот на перле от Genom PHP код:
|
мыло отделено от остального хтмл пробелами или <, если оно там еще чем то может быть отделено, то этот символ надо вставить в [ |>] через |
#!/usr/bin/perl open (html, '<file.txt'); open (mila, '>mila.txt'); while (<html>) { if ($_ =~ /[ |>](.+@.+.\w+)[ |<]/gi) { print mila "$1\n"; } } close html; close mila; |
тоже довольнотаки часто встречается:
mail@site.ru |
| Время: 08:03 |