
13.09.2015, 05:34
|
|
Elder - Старейшина
Регистрация: 23.05.2012
Сообщений: 3,462
Провел на форуме: 1070390
Репутация:
81
|
|
Сообщение от gpuhash
Вот любите вы под каждую мелкую задачу целую программу писать
Все это придумано уже лет дцать назад
Ну например:
tr -dc "[:alnum:][:space:][unct:]"
gawk 'length($1) > 7 {print $1} '
sort
sort -u
Все вместе: cat musor.txt | tr -dc "[:alnum:][:space:][unct:]" | gawk 'length($1) > 7 {print $1} ' | sort -u > slovar.txt
и т.д.
Причем все то же самое можно и на sed сделать, но боюсь при набирании примеров у меня сломаются пальцы, а у некоторых - моск
P.S. Под виндовз все эти утилиты тоже есть, достаточно поставить CYGWIN
Кое-что из своего)
)............................только цифры - остальное) sed -r '/^[0-9]{1,}$/!d' 1.dic > cifri.dic|sed -r '/^[0-9]{1,}$/d' 1.dic > ostalnoe.dic
)...............буквы и буквы+цифры - остальное) sed -r '/^([a-z]{1,}|[a-z]{3,}[0-9]{1,})$/I!d' 1.dic > bukvi-bukvocifri.dic|sed -r '/^([a-z]{1,}|[a-z]{3,}[0-9]{1,})$/Id' 1.dic > ostalnoe.dic
).Разделить - короче 11, длинее 10 символов) sed '/.........../!d' 1.dic > dlinee10.dic|sed '/.........../d' 1.dic > koroche11.dic
|
|
|