
09.04.2017, 15:41
|
|
New Member
Регистрация: 30.10.2016
Сообщений: 17
С нами:
5019446
Репутация:
0
|
|
Сообщение от VasiliyP
-
UPD:
- Еще вариант: Вы, когда будете применять ваш словарь фамилий, будете прикручивать к каждому слову цифры. Сделайте по этому алгоритму словарь - фамилии с цифрами, а далее - то, что вы уже делали при помощи comm (разность словарей, большого и 'фамилии с цифрами').
Предложили такую вещь:
no_names.sh
CDEL=`cat names.txt`
grep -v [$CDEL] big.txt > big_no_names.txt
Но проблема в том, что grep требует много ресурсов и не тянет словарь в 30 ГБ на моём компе. Придётся действительно делать словарь с цифрами (сделал: из 6 МБ и цифрами от 1 до 4 знаков только справа(!) получилось почти 16 ГБ!!!!).
|
|
|