PDA

Просмотр полной версии : [SPAM] Методики "зашумления" текста


Antonio Falkone
03.08.2011, 02:13
http://images.feedgrids.com/assets/post_images/38e4cc4548e076965b1fc4c359ef3eec.jpg

[SPAM] Методики "зашумления" текста

В данной статье будет рассказано о методах, используемых спамерами для "преодоления" спам-фильтров.

А именно, речь пойдет о работе с текстом спам сообщения и методах его "зашумления".

1. Понятие спама

Спам (англ. spam) — рассылка коммерческой, политической и

иной рекламы или иного вида сообщений (информации) лицам,

не выражавшим желания их получать.

В общепринятом значении термин «спам» в русском языке впервые стал употребляться

применительно к рассылке электронных писем. Не запрошенные сообщения в системах

мгновенного обмена сообщениями (например, ICQ) носят название SPIM (англ. Spam over IM)​

2. Немного о работе спам-фильтров

Спам-фильтры – это программное обеспечение для автоматического определения спама,

которое предназначено для использования конечными пользователями или серверами и

позволяют фильтровать нормальную переписку от спам рассылок.

Исходные данные для фильтрации:

1. IP-адрес сервера отправителя

2. статистика слов в письмах

3. оформление и стиль писем, характерные обороты

4. контрольные суммы («сигнатуры») текстов писем

Методы фильтрации:

1. Анализ содержание письма

Байесовская фильтрации спама - основана на методе математического вычисления

для каждого встреченного в письмах слова вероятности того, что письмо с этим словом — спам.​

2. Анализ отправителя письма

Чёрные списки — перечень физических или юридических лиц, занесёный в соответствующий

список, которые по каким-либо причинам признаны недружественными по отношению к составителю списка.​Серые списки - метод основан на том, что «поведение» программного обеспечения, предназначенного

для рассылки спама, отличается от поведения обычных почтовых серверов.​а) возвращение кода временной ошибки;

б) отказ в приеме писем с неправильным обратным адресом;

в) анализ заголовков письма;

г) системы определения признаков массовости сообщения и др.​

3. Методики "зашумления" текста

3.1. «Зашумление» на основе обычного текста

- Написание слова с ошибками

- Смена регистра букв в пределах одного слова

Пример: FrEE PoRno

- Разрядка - отделение букв друг от друга пробелами, знаками препинания

V I A G R A

С~Е~М~И~Н~А~Р~Ы

8*913*345~67.89​

- Использование в качестве «наполнителей» букв или цифр

Subject: 11ВеБ САЙ55Т Б3З ПР3ДВА88РИТ3ЛЬН0Й 0ПЛ9АТЫ!!!

Вы не 0плачив4аете разра60тку Ваш5его сай3та

и размещ3ние ег0 в Инте66рнете ,

а пла1тите то1лько а60нентскую пла9ту в раз$$мере

1.500 р./месяц с м0ме11нта ег0 зап3уска​

- Смесь букв русского и латинского алфавита

Пример: MACCOBЫE PACCЫЛKИ

- Использование буквы вместо цифр

Пример: 8 (Ol2) ЗЧ5-б7-89

- Запись цифр числительными

Пример: 8 (012) 345-6-семь-8-девять

3.2. Добавление вариативной строки

а) произвольная последовательность букв и цифр

http://www.securelist.com/ru/images/articles/randome_text_1_s.png

б) "ключевые слова"

Наша организация по юридическим договорам без предоплаты оформляет пропуска

METRO Cash and carry во всемирно известную сеть немецких магазинов METRO Cash

and Carry на частных лиц и сотрудников организаций!за 5 дней!

{site}

ДАЛЬШЕ НЕ ЧИТАЙТЕ ЭТО КЛЮЧЕВЫЕ СЛОВА:

основанного рубежом уплаченный расширить сомневался роспотребнадзора согласно

груп игрушки высококачественные юниленд неприятие цифра интересом показывает

европа предугадывать zwiesel

{site}​

3.3. Цитирование в сообщениях популярных книг и заголовков новостных лент

http://www.securelist.com/ru/images/articles/email_spam.png

И по Балтическим волнам

"Пади, пади!" - раздался крик;

Бессониц, легких вдохновений,

Когда болела голова;

И, устремив на чуждый свет

Себе присвоить ум чужой;

Тому уж нет очарований.

Среди вседневных наслаждений?

В бумажном колпаке, не раз

Покамест в утреннем уборе​

3.4. «Зашумление» средствами html

а) набор «зашумляющих» символов минимальным

шрифтом, а также придание им бледного оттенка

http://www.securelist.com/ru/images/articles/randome_text_2_s.png

http://www.securelist.com/ru/images/articles/randome_text_3_s.png

б) тэг и сопутствующие ему (, )

http://s41.radikal.ru/i094/1108/cf/99510c210964.jpg

в) комментарии, заключенные внутрь дескриптора

http://s41.radikal.ru/i094/1108/2d/b2e3fa5aeb74.jpg

г) Использование UTF-8-кодов

http://s014.radikal.ru/i326/1108/50/b376b782d72e.jpg

3.5. ASCII спам

http://i.i.com.com/cnwk.1d/i/bto/20080826/ascii_spam_8.26.2008_fixed.png

Использовался материал:

1. Wikipedia

2. securelist.com

Antonio Falkone
03.08.2011, 02:15
Список спам-слов (http://antispamsniper.com/ru/misc/stop_words.txt)

Исключаем по возможности из текстов!!!

Chrome~
03.08.2011, 04:03
Смена регистра букв в пределах одного слова - думаю, бесперспективный вариант.

Использование в качестве «наполнителей» букв или цифр - неэффективный по отношению к самому получателю сообщения.

«Зашумление» средствами html, а именно с помощью тега - интересный вариант. Также шифрование ключевых для получателя слов в ASCII art тоже интересный вариант.

Antonio Falkone
03.08.2011, 09:24
Смена регистра букв в пределах одного слова
- думаю, бесперспективный вариант.
Использование в качестве «наполнителей» букв или цифр
- неэффективный по отношению к самому получателю сообщения.


Согласен, это одни из первых методов "зашумления".

Но не сказать о них, в связи с этим, было нельзя.

Александр RR
09.08.2011, 15:45
Antonio Falkone said:
Список спам-слов (http://antispamsniper.com/ru/misc/stop_words.txt)

Исключаем по возможности из текстов!!!


где в списке слова "порно" ?)

akella_
10.08.2011, 21:00
Текст зашумлить не сложно, ща проги для рассылки все могут, я например вставляю рандомно около 1к слов, беелый цвет букавак и все норм, туеву хучу отправляет без всяких нареканий, но стоит воткнуть ссылку вот эт проблема так проблема, 5 писем максимум, длее ошибка "550 spam...". Может кто знает вариантег? лично я уже перепробывал 101 способ, результат 100-200 писем в сутки

Don^Paradox
10.08.2011, 22:32
Текст зашумлить не сложно, ща проги для рассылки все могут, я например вставляю рандомно около 1к слов, беелый цвет букавак и все норм, туеву хучу отправляет без всяких нареканий, но стоит воткнуть ссылку вот эт проблема так проблема, 5 писем максимум, длее ошибка "550 spam...". Может кто знает вариантег? лично я уже перепробывал 101 способ, результат 100-200 писем в сутки


Естественно все защищают пользователей от спама в виде ссылок

acckyi_boxxx
11.08.2011, 11:41
Естественно все защищают пользователей от спама в виде ссылок


хм а если попробовать на js тоесть

var link = зашифрованная ссылка

var a = функция расшифровывающая сцылку

document.write a

интересно прокатит ?

Antonio Falkone
11.08.2011, 15:09
Текст зашумлить не сложно, ща проги для рассылки все могут, я например вставляю рандомно около 1к слов, беелый цвет букавак и все норм, туеву хучу отправляет без всяких нареканий, но стоит воткнуть ссылку вот эт проблема так проблема, 5 писем максимум, длее ошибка "550 spam...". Может кто знает вариантег? лично я уже перепробывал 101 способ, результат 100-200 писем в сутки


Методы маскировки ссылок.

1) Добавление домена третьего уровня

или каталога со случайными именами

Пример:

http://dksj1.viagra.info

http://viagra.info/lfk85

2) Использование сервисов сокращения ссылок

Пример:

http://tinyurl.com/ххххх

3) Редирект Google и др.

Пример:

http://www.google.com/search?btnG=1&pws=0&q=antichat.ru

4) Ссылка в виде картинки

Пример:

/images/test_antichat.gif

5) Ссылка в виде ASCII

Сделать можно здесь:

www.asciiflow.com

6) Ссылка в виде IP

Пример:

209.85.148.103 (http://209.85.148.103)

и другие методы....

Antonio Falkone
11.08.2011, 15:20
хм а если попробовать на js тоесть
var link = зашифрованная ссылка
var a = функция расшифровывающая сцылку
document.write a
интересно прокатит ?


Вполне возможно, если поддерживается

javascript в теле письма. На Hotmail можно...

-=Zhenek=-
11.08.2011, 19:14
Пример:
http://dksj1.viagra.info
http://viagra.info/lfk85


Если viagra.info в черном списке как слово даже, то ни одна ссылка с упоминанием ее не пройдет 100%

Antonio Falkone
11.08.2011, 20:26
Если viagra.info в черном списке как слово даже, то ни одна ссылка с упоминанием ее не пройдет 100%


Помимо этого большинство сервисов фильтрации спама

при проверке вычленяют из URL только доменное имя

второго уровня, что делает этот способ менее актуальным.

akella_
12.08.2011, 20:47
Antonio Falkone said:
Методы маскировки ссылок.
1) Добавление домена третьего уровня
или каталога со случайными именами
Пример:
http://dksj1.viagra.info
http://viagra.info/lfk85
2) Использование сервисов сокращения ссылок
Пример:
http://tinyurl.com/ххххх
3) Редирект Google и др.
Пример:
http://www.google.com/search?btnG=1&pws=0&q=antichat.ru
4) Ссылка в виде картинки
Пример:
/images/test_antichat.gif
5) Ссылка в виде ASCII
Сделать можно здесь:
www.asciiflow.com
6) Ссылка в виде IP
Пример:
209.85.148.103 (http://209.85.148.103)
и другие методы....


К сожелению все эти способы обречены на провал)). А рассылка без активной ссылки не даст должного эффекта.

Antonio Falkone
12.08.2011, 21:21
К сожелению все эти способы обречены на провал)). А рассылка без активной ссылки не даст должного эффекта.


1. Очень конструктивно...

Сервис сокращения ссылок, не паблик, должен 100% помочь.

2. Не всегда не активная ссылка - минус.

Пример/легенда:

Проверка владельца e-mail'а на то, что он не робот

Да и в рекламных целях неактивная ссылка, мне кажется,

вполне пойдет. Т.к. если товар/услуга действительно нужен(а)

пользователю, он перейдет на необходимый сайт утруждая

себя введением его в адресную строку браузера.

akella_
14.08.2011, 21:22
Antonio Falkone said:
1. Очень конструктивно...
Сервис сокращения ссылок, не паблик, должен 100% помочь.
2. Не всегда не активная ссылка - минус.
Пример/легенда:
Проверка владельца e-mail'а на то, что он не робот
Да и в рекламных целях неактивная ссылка, мне кажется,
вполне пойдет. Т.к. если товар/услуга действительно нужен(а)
пользователю, он перейдет на необходимый сайт утруждая
себя введением его в адресную строку браузера.


Вы бы сами для начала попробовали прежде чем давать теоретические советы. Я юзал 47 сервисов сокращения ссылок, фуфляк полный, кстати на любой адрес блокируется по виду "сервис.com" не зависимо от продолжения.

Зачем заниматься самообманом по поводу неактивных ссылок, в этом весь и смысл спама привлечь незаинтересованную клиентуру (тому челу который решит купить сотовый телефон через интернет спам не нужен он и так запросто найдет нужный магаз), а ткнув в активную ссылку незаинтересованный юзер попадет на прокладку, где уже специально обученные люди будут его заинтересовывать.

З.Ы. Не понимаю с какой целью вообще писалась эта статья

Antonio Falkone
14.08.2011, 21:39
Сервис сокращения ссылок,
не паблик
, должен 100% помочь.




Я юзал 47 сервисов сокращения ссылок, фуфляк полный, кстати на любой адрес блокируется по виду "сервис.com" не зависимо от продолжения.


Известные сервисы могут быть априори - "забанены".

akella_
15.08.2011, 10:05
если бы вы не поленились и попробовали отправить десяток другой писем, то поняли бы что любой сервис сокращения ссылок, валяющийся в паблике или сделанный 10 минут назад, попадает под фильтр после 10-20 отправленных писем. Короче это школьный способ отваливается по любому, не стоит на нем заострять внимание.

Bingo
06.10.2011, 17:02
ASCII спам - Вообще улыбнуло! Действительно, можно рассылать таким образом на ящики инфу о том, что все плохо) ТС, спасибо за статью! Действительно полезная информация, рекомендую к прочтению.

I-Never-Die
12.08.2012, 23:29
Имхо, намного проще слать рандомизированные изображения в письмах и не заморачиваться с текстом, особенно с активными ссылками, ибо умирают они быстро. Ну да, так мы потеряем часть юзеров. Но действительно заинтересовавшиеся не поленятся ввести адрес с изображения руками.

alextrust
13.08.2012, 03:39
Имхо, намного проще слать рандомизированные изображения в письмах и не заморачиваться с текстом, особенно с активными ссылками, ибо умирают они быстро. Ну да, так мы потеряем часть юзеров. Но действительно заинтересовавшиеся не поленятся ввести адрес с изображения руками.


а ты забыл что в gmail например изображения нужно еще и открывать

Zigert
13.08.2012, 13:24
Имхо, намного проще слать рандомизированные изображения в письмах и не заморачиваться с текстом, особенно с активными ссылками, ибо умирают они быстро. Ну да, так мы потеряем часть юзеров. Но действительно заинтересовавшиеся не поленятся ввести адрес с изображения руками.



очень большой процент юзеров потеряется если адресс будет на изображении ибо лень вводить, запоминать и т.п., тот же самый вк например, спам без ссылки = очень низкому профиту.

I-Never-Die
14.08.2012, 00:24
а ты забыл что в gmail например изображения нужно еще и открывать


да я и не знал


очень большой процент юзеров потеряется если адресс будет на изображении ибо лень вводить, запоминать и т.п., тот же самый вк например, спам без ссылки = очень низкому профиту.


спам со ссылкой = быстрому банану

grantgaranto
22.08.2012, 00:42
спасибо большое за статью, навела на очень интересные мысли

ASCII вообще классно

gidropon
24.08.2012, 03:40
Статья хорошая

Хорошо все рассказали и понятным языком,спасибо

drim
24.08.2012, 03:55
статья родом из 90х. практической ценности не имеет.

фильтры реагируют на контактную информацию - номера телефонов, ICQ, скайп и _особенно_ ссылок.

Возьмите любое письмо из папки спам, перешлите самому себе без контактной информации - оно попадёт в инбокс. С контактной информацией - в "SPAM"

Sind-blog
26.08.2012, 17:12
статья родом из 90х. практической ценности не имеет.
фильтры реагируют на контактную информацию - номера телефонов, ICQ, скайп и _особенно_ ссылок.
Возьмите любое письмо из папки спам, перешлите самому себе без контактной информации - оно попадёт в инбокс. С контактной информацией - в "SPAM"


Тема создана в лохматом 2011

boortyhuhtyu
31.08.2012, 04:41
failed

ewerost
04.10.2012, 08:41
Спасибо за статью

узнал много нового!

GAiN
04.10.2012, 16:47
статья хорошая, а вообще я против спама !

но одобряю такой спам - которым можно зафлудить нехороших людей или организацию !

Tip.the.besT
08.10.2012, 17:03
на мой взгляд после того как гулгл проиндексирует, взять ссылку с него. ну как могут в бан гугол или ящу добавить...

qaz
08.10.2012, 20:56
такой вопросец, насчот зашумления ссылок в письме, а если например кидать ссылку на сайт уязвимый на хсс с ждаваскрипт переадресацией на нжный ресурс, ну типа так


http://myprom.ru/goto.php?url=window.location.href = "http://mh-proxy.ru/"



как думаете прокатит? ведь менять ссылки на дырявые сайты легче чем регать новые домены и тд

FlooP1k
13.10.2012, 17:31
Интересно, а сейчас работает еще зашумление текста, просто мне кажется сейчас все антиспам системы должны работать наоборот если в одно слове есть и русские и английские буквы, то можно сразу подчеркивать как подозрительные, а если еще и все слова такие, то сразу в спам.

Mobile
28.10.2012, 02:22
Предупреждаю, соблюдаем правила раздела. Набивать посты запрещено, текст по типу - "Хорошая статья, лови +" это нарушение. Игнорирование этого предупреждения - бан от 3 дней.

vostro812
30.10.2012, 03:08
Вчера делал рассылку, из 100 сообщений с ссылкой инбокс только 16.

Интересный момент получился, спамил с подменой адреса отправителя, но вот беда, подмена была одного ящика, а забанили через неколько часов совершенно другой - основной. При чём основной ящик нигде не фигурировал во время спама.

Protocoler
08.07.2013, 20:37
Вчера делал рассылку, из 100 сообщений с ссылкой инбокс только 16.
Интересный момент получился, спамил с подменой адреса отправителя, но вот беда, подмена была одного ящика, а забанили через неколько часов совершенно другой - основной. При чём основной ящик нигде не фигурировал во время спама.


Значение HELO менял ? Либо заходил на ящик с которого спамил под настоящим ip все время , вот тебя и прикрыли.. Просто пробили по IP на каких ящиках еще такой ip светился..

FunOfGun
08.08.2013, 16:10
Работало, работает и работать будет!
Любой спам-фильтр - это фактически регулярка!
Если Вы когджа нибудь писали регулярки, то должны понимать что даже слово "мама" можно "представить пользователю" в десятках вариаций! А если слов (фраз) достаточно много, то и вариантов больше!
Вы считаете за "символы", только буквы и цифры?
А как же табуляция и пробелы?
А различная кодировка и перекодирование?
А различная длина строк и пробелы в конце них?
А разное количество строк и пустое пространство между ними?
А если речь заходит об HTML, то тут "вариаций" на 2 порядка больше ... если не на три порядка!
Одним словом - рандом убить и победить не возможно!
Ни в тексте ни в бинарниках (но это уже отдельная песня).


если бы я писал антиспам, я бы в первую очередь избавился от всего, что невидимо для человека(табуляции, html теги и т.д.), картинок(т.к. их сложнее анализировать), потом привел бы к удобной мне кодировке и только после этого уже анализировал:

если в тексте много слов, набранных в двух раскладках(русские+английс кие буквы в одном слове) -- скорей всего спам

если много "слов", в которых смешаны буквы и цифры(g64wrfgs64w) -- спам

сравнил бы с другими сообщениями, отмеченными как спам

и т.д. множество условий ​