[SPAM] Методики "зашумления" текста
В данной статье будет рассказано о методах, используемых спамерами для "преодоления" спам-фильтров.
А именно, речь пойдет о работе с текстом спам сообщения и методах его "зашумления".
1. Понятие спама
Спам (англ. spam) — рассылка коммерческой, политической и
иной рекламы или иного вида сообщений (информации) лицам,
не выражавшим желания их получать.
В общепринятом значении термин «спам» в русском языке впервые стал употребляться
применительно к рассылке электронных писем. Не запрошенные сообщения в системах
мгновенного обмена сообщениями (например, ICQ) носят название SPIM (англ. Spam over IM)
2. Немного о работе спам-фильтров
Спам-фильтры – это программное обеспечение для автоматического определения спама,
которое предназначено для использования конечными пользователями или серверами и
позволяют фильтровать нормальную переписку от спам рассылок.
Исходные данные для фильтрации:
1. IP-адрес сервера отправителя
2. статистика слов в письмах
3. оформление и стиль писем, характерные обороты
4. контрольные суммы («сигнатуры») текстов писем
Методы фильтрации:
1. Анализ содержание письма
Байесовская фильтрации спама - основана на методе математического вычисления
для каждого встреченного в письмах слова вероятности того, что письмо с этим словом — спам.
2. Анализ отправителя письма
Чёрные списки — перечень физических или юридических лиц, занесёный в соответствующий
список, которые по каким-либо причинам признаны недружественными по отношению к составителю списка.
Серые списки - метод основан на том, что «поведение» программного обеспечения, предназначенного
для рассылки спама, отличается от поведения обычных почтовых серверов.а) возвращение кода временной ошибки;
б) отказ в приеме писем с неправильным обратным адресом;
в) анализ заголовков письма;
г) системы определения признаков массовости сообщения и др.
3. Методики "зашумления" текста
3.1. «Зашумление» на основе обычного текста
- Написание слова с ошибками
- Смена регистра букв в пределах одного слова
Пример: FrEE PoRno
- Разрядка - отделение букв друг от друга пробелами, знаками препинания
V I A G R A
С~Е~М~И~Н~А~Р~Ы
8*913*345~67.89
- Использование в качестве «наполнителей» букв или цифр
Subject: 11ВеБ САЙ55Т Б3З ПР3ДВА88РИТ3ЛЬН0Й 0ПЛ9АТЫ!!!
Вы не 0плачив4аете разра60тку Ваш5его сай3та
и размещ3ние ег0 в Инте66рнете ,
а пла1тите то1лько а60нентскую пла9ту в раз$$мере
1.500 р./месяц с м0ме11нта ег0 зап3уска
- Смесь букв русского и латинского алфавита
Пример: MACCOBЫE PACCЫЛKИ
- Использование буквы вместо цифр
Пример: 8 (
Ol2) З
Ч5-
б7-89
- Запись цифр числительными
Пример: 8 (012) 345-6-семь-8-девять
3.2. Добавление вариативной строки
а) произвольная последовательность букв и цифр
б) "ключевые слова"
Наша организация по юридическим договорам без предоплаты оформляет пропуска
METRO Cash and carry во всемирно известную сеть немецких магазинов METRO Cash
and Carry на частных лиц и сотрудников организаций!за 5 дней!
{site}
ДАЛЬШЕ НЕ ЧИТАЙТЕ ЭТО КЛЮЧЕВЫЕ СЛОВА:
основанного рубежом уплаченный расширить сомневался роспотребнадзора согласно
груп игрушки высококачественные юниленд неприятие цифра интересом показывает
европа предугадывать zwiesel
{site}
3.3. Цитирование в сообщениях популярных книг и заголовков новостных лент
И по Балтическим волнам
"Пади, пади!" - раздался крик;
Бессониц, легких вдохновений,
Когда болела голова;
И, устремив на чуждый свет
Себе присвоить ум чужой;
Тому уж нет очарований.
Среди вседневных наслаждений?
В бумажном колпаке, не раз
Покамест в утреннем уборе
3.4. «Зашумление» средствами html
а) набор «зашумляющих» символов минимальным
шрифтом, а также придание им бледного оттенка
б) тэг и сопутствующие ему (, )
в) комментарии, заключенные внутрь дескриптора
г) Использование UTF-8-кодов
3.5. ASCII спам
Использовался материал:
1. Wikipedia
2. securelist.com