УСТРАНЕНИЕ КОНКУРЕНТОВ. БЛОКИРОВКА ДОМЕНОВ, БЛОКИРОВКА ИНСТАГРАМ/ТЕЛЕГРАМ И ДРУГОЕ. ПРОВЕРЕННЫЙ СЕЛЛЕР.

ANTICHAT — форум по информационной безопасности, OSINT и технологиям

ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию. Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club, и теперь снова доступен на новом адресе — forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.

		Форум АНТИЧАТ > БЕЗОПАСНОСТЬ И УЯЗВИМОСТИ > Безопасность и Анонимность > Защита ОС: вирусы, антивирусы, файрволы.
ASM – техники из старого сундука [3]

Страница 1 из 2

Опции темы

Поиск в этой теме

Опции просмотра

20.09.2021, 00:22

Marylin

Постоянный

Регистрация: 01.09.2019

Сообщений: 378

Провел на форуме:
145166

Репутация: 0

Hello All!

Делиться со-всякими алго и наработками уже входит у меня в привычку, и в продолжении цикла этих заметок предлагаю разбор всякого хлама из старого сундука. На повестке дня сегодня следующее:

1. Фиктивный стек;
2. Список установленных программ в реестре;
3. Базовые операции с текстом;
4. Заключение.
----------------------------------------------

1. Фиктивный стек

Герою восточного фольклора Ходже Насреддину приписывают выражение: -"Если гора не идёт к Магомеду, то Магомед пойдёт к горе". В этой части статьи попробуем спроецировать данное утверждение на системный стек, но для начала рассмотрим микро-архитектуру центрального процессора, и какое место занимает в ней этот стек.

На рисунке ниже представлена структурная схема входящих в состав CPU основных блоков.

При запуске нашей программы, функции системного загрузчика с префиксом LDR загружают образ двоичного кода с диска в оперативную память DDR-SDRAM (Synchronous Dynamic Random Access Memory), после чего код становится доступным центральному процессору CPU. Как только регистр-указатель EIP упрётся в точку-входа в программу EntryPoint, диспетчер памяти тут-же в пакетном режиме считывает из ОЗУ как-минимум по одной 4 Кбайтной странице из секции-кода и секции-данных (итого 8Кб), и сбрасывает их в кэш процессора L3.

Такого алго придерживаются процессоры только на старте, а дальше – данные читаются из ОЗУ исключительно по-востребованию, блоками по 64-байт, чтобы их можно было поместить в одну линейку кэш "Cache-Line". Если софт гигантских размеров типа Photoshop или Word из пакета Office, то диспетчер может заполнить кодом\данными весь кэш L3, что влечёт за собой тормоза на старте. Здесь всё в штатном режиме, а вот дальше уже интересней..

Кэши L2 и L3 не разделяют информацию на код и данные, более того в архитектуре НТ (гипертрейдинг) они являются общими для всех ядер одного процессора. Зато кэшей L1 уже два – отдельно для кода и отдельно для данных. Структура кэш-линеек такова, что помимо самой информации, в них имеются и специальные поля под названием "Tag", где хранится старшая часть виртуального адреса ОЗУ, от куда была скопирована инфа. Проверяя эти теги процессор ищет в L2 байты, которые принадлежат секции-кода и отправляет их в L1-инструкций, и далее в исполнительный конвейер. Соответственно если в теге прописан адрес секции-данных, то линейка отправляется в L1-данных, который ведёт диалог исключительно с блоками Load\Store ядра процессора Execute, минуя его Front-End.

Теперь рассмотрим ситуацию, когда декодер обнаруживает в L1 инструкцию PUSH – это может быть, например, передача параметров функции через стек. Поскольку стек представляет собой своеобразную секцию-данных, процессору приходится перегонять операнд инструкции PUSH по большой ветке кровообращения, из L1 инструкций, в L1 данных и обратно. Здесь становится очевидно, что в алгоритме вызова процедур и функций имеются недочёты, поскольку бесполезный транспорт данных явно снижает общую производительность. Для инженеров это было легче запрограммировать, чем искать компромиссы, ..тем-более что ситуации бывают разные и лучше выбрать золотую середину.

Однако фанатиков нетрадиционного кода такой расклад не устраивал, и ещё на третьих пеньках они придумали вполне разумное решение этой проблемы (салам Магомед). В основе оригинальной мысли лежал тот факт, что если в секции-данных заранее подготовить стековый фрейм с готовыми аргументами, можно будет не копировать их в стек, а наоборот натравить на этот фрейм регистр-указатель стека ESP (Stack-Pointer). Поскольку процессор слепо верит этому регистру, то примет подложный стек за чистую монету и без лишних слов отработает запрос. Тут главное правильно расположить все аргументы функции в секции-данных, не забыв при этом зарезервировать место под адрес-возврата, куда его неявно помещает инструкция CALL. Посмотрим на такой пример:

C-подобный:

Код:

.
data
text        db
'Hello!'
,
0
mes1        db
'Codeby.net'
,
0
mes2        db
'Marylin'
,
0
align
16
localStack  rd
64
funcArg     dd
0
,
text
,
2222
h
,
3333
h
,
4444
h
,
5555
h
;
//
@exit
:
cinvoke  _getch
        cinvoke  exit
,
0
;
//-------
proc foo a1
,
a2
,
a3
,
a4
,
a5
;
//
@exit
:
cinvoke  _getch
        cinvoke  exit
,
0
;
//-------
proc foo a1
,
a2
,
a3
,
a4
,
a5
;
//
;
// Квота реестра!
invoke  GetSystemRegistryQuota
,
maxReg
,
curReg
         shr
[
maxReg
]
,
20
;
//
,
[
maxReg
]
,
[
curReg
]
;
// Открыть ветку реестра "..\Uninstall"
invoke  RegOpenKeyEx
,
HKEY_LOCAL_MACHINE
,
key
,
0
,
\
                              KEY_QUERY_VALUE
+
KEY_ENUMERATE_SUB_KEYS
,
\
                              hKey
;
// Вычислить кол-во подразделов в ней (нули - типы информации)
invoke  RegQueryInfoKeyA
,
[
hKey
]
,
0
,
0
,
0
,
index
,
0
,
0
,
0
,
0
,
0
,
0
,
0
cinvoke  printf
,

,
[
index
]
dec
[
index
]
;
//
,
0
,
0
,
buff
,
buffLen
         cmp     eax
,
2
;
//
,
[
counter
]
,
buff
         inc
[
counter
]
;
//
;
// Запросить дескриптор ввода для ReadConsoleA()
invoke  GetStdHandle
,
STD_INPUT_HANDLE
        mov
[
inpHndl
]
,
eax
;
// Запрос на ввод строки в буфер
cinvoke  printf
,

invoke  ReadConsoleA
,
[
inpHndl
]
,
inpBuff
,
128
,
strLen
,
0
;
// Перевод в верхний регистр
mov     ecx
,
[
strLen
]
;
// длина строки\цикла
mov     esi
,
inpBuff
;
// источник
push    ecx esi
;
// (про запас..)
mov     edi
,
bigBuff
;
// приёмник
@@
:
lodsb
;
// AL = очередной символ из ESI
cmp     al
,
'A'
;
// фильтр букв, отсеивая цифры и знаки
jb      @fuck1
;
//  ^^^^ (меньше Below)
cmp     al
,
'z'
;
//   ^^^^
ja      @fuck1
;
//    ^^^^ (больше Above)
and     al
,
11011111
b
;
// сбросить бит(5) маской
@fuck1
:
stosb
;
// записать в приёмник EDI
loop    @b
;
// промотать цикл ECX-раз..
;
// Перевод в нижний регистр
pop     esi ecx
        mov     edi
,
smallBuff
@@
:
lodsb
        cmp     al
,
'A'
jb      @fuck2
        cmp     al
,
'z'
ja      @fuck2
        or      al
,
00100000
b
;
//
,
bigBuff
,
smallBuff

@exit
:
cinvoke  _getch
       cinvoke  exit
,
0
;
//---------------
section
'.idata'
import data readable
library  msvcrt
,
'msvcrt.dll'
,
kernel32
,
'kernel32.dll'
include
'api\msvcrt.inc'
include
'api\kernel32.inc'

• Избавиться от лишних пробелов в строке – ещё одна часто встречающаяся задача.

В виду того-что готовой функции API для этих целей в природе не существует, всё приходится делать в ручную. Суть в том, чтобы запоминать предыдущий символ, и сравнивать его с текущим. Если оба пробелы, то пропускаем перезапись текущего в буфер, иначе всё в штатном режиме, без изменений. Вот простая как 2-копейки реализация, зато пользу от неё можно наблюдать в консоли:

C-подобный:

Код:

format   pe console
entry    start
include
'win32ax.inc'
;
//----------
.
data
inpBuff    rb
128
inpHndl    dd
0
strLen     dd
0
buff       db
0
;
//----------
.
code
start
:
invoke  SetConsoleTitle
,

;
// Запросить дескриптор ввода для ReadConsoleA()
invoke  GetStdHandle
,
STD_INPUT_HANDLE
        mov
[
inpHndl
]
,
eax
;
// Запрос на ввод строки в буфер
cinvoke  printf
,

invoke  ReadConsoleA
,
[
inpHndl
]
,
inpBuff
,
128
,
strLen
,
0
;
// Парсим строку на лишние пробелы --------------------------
mov     ecx
,
[
strLen
]
;
// длина строки\цикла
mov     esi
,
inpBuff
;
// источник
mov     edi
,
esi
;
// приёмник
@@
:
lodsb
;
// AL = очередной символ
cmp     al
,
' '
;
// это пробел?
jne     @miss
;
// нет: пропускаем
cmp     ax
,
'  '
;
// да: тест с предыдущим
je      @next
;
// 2 пробела - пропускаем
@miss
:
stosb
;
// перезапись символа
@next
:
xchg    ah
,
al
;
// запомним текущий символ
loop    @b
;
// мотаем цикл по длине ЕСХ..
mov     byte
[
edi
]
,
0
;
// вставить маркер конца стоки
;
//-----------------------------------------------------------
;
// Результат
cinvoke  printf
,

,
inpBuff

@exit
:
cinvoke  _getch
       cinvoke  exit
,
0
;
//---------------
section
'.idata'
import data readable
library  msvcrt
,
'msvcrt.dll'
,
kernel32
,
'kernel32.dll'
include
'api\msvcrt.inc'
include
'api\kernel32.inc'

4. Заключение.

Мелочи подобного рода сильно отравляют жизнь начинающим асматикам, а так.. (на случай, если грянет гром) "зонт" у нас уже имеется. В скрепке можно найти исполняемые файлы для тестов. Надеюсь ещё встретимся в сообществе античат , всем удачи и пока.

20.09.2021, 00:45

Muxtar

Новичок

Регистрация: 02.06.2021

Сообщений: 0

Провел на форуме:
0

Репутация: 0

Приятно видеть такого опытного человека, темболее ассемблерца. Лайк однозначно за труду

20.09.2021, 01:06

Marylin

Постоянный

Регистрация: 01.09.2019

Сообщений: 378

Провел на форуме:
145166

Репутация: 0

Цитата:

Muxtar сказал(а):

Лайк однозначно

..ну тогда и вам лайк, за положительный отзыв.

20.09.2021, 01:50

Hardreversengineer

Новичок

Регистрация: 20.08.2019

Сообщений: 0

Провел на форуме:
0

Репутация: 0

Тимур, спасибо за статью! Когда читаю Ваши статьи, особенно с такими отсылками, мне кажется что я учусь у какого-то древнего восточного мудреца.

20.09.2021, 10:04

DragonFly

Новичок

Регистрация: 01.06.2020

Сообщений: 0

Провел на форуме:
0

Репутация: 0

Цитата:

Marylin сказал(а):

• Если нас интересует регистр символов, то ставка здесь делается на их расположении в таблице ASCII. Заглянув в неё можно обнаружить, что разница между кодами прописных и заглавных составляет ровно 20h. Например код латиницы(А) в верхнем регистре (заглавной) равен 41h, а её-же прописной равен 61h. Аналогичный сдвиг наблюдаем и со-всеми остальными буквами, хоть в латинице, хоть в кириллице. Такой расклад наводит на мысль, что таблицу составляли отнюдь не глупые люди.

да, как показывает практика, все гениальное - просто
главное разобраться
вспоминаю деление в ассемблере из предыдущих техник из сундука логическими операциями
спасибо за статью!
пс. @Mikl___ книгу, которую рекомендовал, "Алгоритмические трюки для программистов" заказал

20.09.2021, 10:07

Muxtar

Новичок

Регистрация: 02.06.2021

Сообщений: 0

Провел на форуме:
0

Репутация: 0

Цитата:

DragonFly сказал(а):

да, как показывает практика, все гениальное - просто
главное разобраться
вспоминаю делание в ассемблере из предыдущих техник логическими операциями
спасибо за статью!
пс. @Mikl___ книгу, которую рекомендовал, "Алгоритмические трюки для программистов" заказал

А учить Ассемблер не сложно?

20.09.2021, 10:16

DragonFly

Новичок

Регистрация: 01.06.2020

Сообщений: 0

Провел на форуме:
0

Репутация: 0

Цитата:

Muxtar сказал(а):

А учить Ассемблер не сложно?

Все сложно, простого нет ничего))) Питон вроде не сложный, но там куча библиотек, каждая как отдельный язык. Вот Си взять, количество ключевых слов и операторов не большое, но считается, что он не легкий..
Я вот буду си учить, а там плюс минус с ассемблером надо будет сталкиваться, чтоб лучше все понимать . И вообще, надо учить компьютер сайенс, как можно сейчас называть, все сразу на места становится, имею в виду понимание процессов. Даже элементарное понятие, почему индексация с 0, а не 1
@Marylin , я прав?

20.09.2021, 11:45

Hardreversengineer

Новичок

Регистрация: 20.08.2019

Сообщений: 0

Провел на форуме:
0

Репутация: 0

Цитата:

Muxtar сказал(а):

А учить Ассемблер не сложно?

Если прочтёте всю серию статей на этом форуме, даже без поисках на других форумах и даже без книг - будете знать на достаточном уровне, чтобы самостоятельно писать готовые, работающие программы. То есть, вот просто берёте и ищите самую раннюю статью (они ещё подряд в одном топике идут, так что не забывайте проматывать вниз) и читаете. Там от самых основ очень понятным языком, без мыла и воды, с примерами которые сразу компилируются в FASM. Особенно важно чувствовать это. Поэтому, возьмите скачайте компилятор, и для начала просто вставляйте готовые программы, компилируйте, балуйтесь. От части даже будет вам понятно интуитивно. А потом что нибудь меняйте. Если проникнитесь, если понравится - будете не только жонглировать битами и находить скрытые от глаз других программистов способы решения задач, но может и дойдёте до того уровня, когда сможете пользоваться дизассемблерами и дебаггерами для анализа уже существующих программ. Это многого стоит. Не ждите сразу результат, побалуйтесь с примерами в папке EXAMPLES, вдруг вам понравится как в своё время понравилось мне.

28.09.2021, 11:15

rusrst

Новичок

Регистрация: 18.04.2021

Сообщений: 0

Провел на форуме:
0

Репутация: 0

Классная статья. Like за возврат из call по jmp. Я похожее для avr реализовывал, но там возвращался не из функции, а из аппаратного прерывания, но принцип тот же. Надо было проверять событие и в зависимости от него прыгать в свою часть программы.

Цитата:

DragonFly сказал(а):

Все сложно, простого нет ничего))) Питон вроде не сложный, но там куча библиотек, каждая как отдельный язык. Вот Си взять, количество ключевых слов и операторов не большое, но считается, что он не легкий..
Я вот буду си учить, а там плюс минус с ассемблером надо будет сталкиваться, чтоб лучше все понимать . И вообще, надо учить компьютер сайенс, как можно сейчас называть, все сразу на места становится, имею в виду понимание процессов. Даже элементарное понятие, почему индексация с 0, а не 1
@Marylin , я прав?

Если вы пишете обычное ПО на си, то ассемблер вы будете видеть чуть реже чем никогда. А если для встраиваемых систем, то иногда (но не особо так то и часто) нужно будет смотреть сгенерированный код. Но там нюансы что архитектуры есть разные (arm, pic, avr, mcs-51) и у всех есть нюансы.