![]() |
подскажите пожалуйста скрипт для решения такой задачи: есть файл со списком адресов сайтов, каждый сайт с новой строки, адрес начинается с http:// Нужно скачать файл robots.txt у каждого сайта, и сохранить с именем домена, например: mysiteru.txt (содержит robots.txt сайта mysite,ru), mysitecomua.txt (mysite.com.ua), subdomainmysitenet.txt (subdomain.mysite.net).
|
Код:
Код:
cat filename | awk -F/ '{print $0" -O "$3}' | xargs -L1 wgetКод: Код:
cat filename | awk -F/ '{print $0"/robots.txt -O "$3}' | xargs -L1 wget |
спасибо, на выходных будет доступ к никсу, попробую.
|
А в каком формате сохранить этот скрипт? Или каждый раз через терминал проганять?
|
Цитата:
|
| Время: 00:57 |