
24.05.2009, 05:56
|
|
Участник форума
Регистрация: 24.06.2008
Сообщений: 105
Провел на форуме: 674665
Репутация:
276
|
|
Недавно потребовалось отпарсить данные с фейка.
Написал этот маленький скрипт, возможно кому-нибудь пригодится.
Парсит по формату: мыло@хост<разделитель>паро ь
Убирает дублирующиеся мыльники (юзеры часто думают что ошиблись, и начинают вводить повторно).
Код:
#!/usr/bin/perl
use warnings;
use strict;
my $delim = ':';
open IN, '<', 'in.txt' or die $!;
chomp (my @lines = <IN>) && close IN;
open OUT, '>', 'out.txt' or die $!;
for (@lines)
{
print OUT $_, "\n" if
(m#([a-z0-9][a-z0-9-_]+@[a-z0-9-_]+\.[a-z]{2,4})$delim\S+#ig) &&
($_{$1}=!exists $_{$1});
}
close OUT && print 'finished';
Последний раз редактировалось Whirt; 24.05.2009 в 16:34..
|
|
|