Такой вопрос: в суперсловарях (30-100 ГБ) я вижу много паролей типа:
петров
Петров
ПЕТРОВ
petrov
Petrov
PETROV
1petrov
1Petrov
1PETROV
01petrow
123Petrow
1978Petrow
petrov1
petrov01
petrov1956
1петров1
23петров1966
1966петров1978
петров\
petrov#!
#petrov!
?PETROW?
т.е. фамилии с одно-, двух-, трёх- или четырёхзначными цифрами спереди, сзади или с обоих сторон. Мне такие пароли в основном словаре не нужны. У меня есть словарь, сосотояший только из фамилий:
Петров
петров
ПЕТРОВ
petrov
Petrov
PETROV
petrow
Petrow
PETROW
Я просортировал оба словаря с помошью простого "sort". Как мне теперь сравнить оба файла и удалить из первого все строки, включающие фамилии из второго? Сначала я попробовал "comm -23 big.txt names.txt > big_no_names.txt". Но в big.txt остались все строки состояшие не только из фамилии:
1petrov
1Petrov
1PETROV
01petrow
123Petrow
1978Petrow
petrov1
petrov01
petrov1956
1петров1
23петров1966
1966петров1978
петров\
petrov#!
#petrov!
?PETROW?
Вопрос: как удалить и эти строки? Т.е. и те строки где фамилия является лишь частью пароля?