Техника незаметного искажения фотографий для нарушения работы систем распознавания лиц [Архив]

Просмотр полной версии : Техника незаметного искажения фотографий для нарушения работы систем распознавания лиц

Suicide

23.07.2020, 19:15

Исследователи из лаборатории SAND (http://sandlab.cs.uchicago.edu/) при Чикагском университете разработали инструментарий Fawkes (http://sandlab.cs.uchicago.edu/fawkes/) с реализацией метода (https://www.shawnshan.com/files/publication/fawkes.pdf) искажения фотографий, препятствующего их использованию для обучения систем распознавания лиц и идентификации пользователей. В изображение вносятся пиксельные изменения, которые незаметны при просмотре людьми, но приводят к формированию некорректных моделей при использовании для тренировки систем машинного обучения. Код инструментария написан на языке Python и опубликован (https://github.com/Shawn-Shan/fawkes) под лицензией BSD. Сборки подготовлены (http://sandlab.cs.uchicago.edu/fawkes/#code) для Linux, macOS и Windows.

https://www.opennet.ru/opennews/pics_base/0_1595481752.png

Обработка фотографий предложенной утилитой перед публикацией в социальных сетях и других публичных площадках позволяет защитить пользователя от использования данных фотографий в качестве источника для обучения систем распознавания лиц. Предложенный алгоритм предоставляет защиту от 95% попыток распознавания лиц (для API распознавания Microsoft Azure, Amazon Rekognition и Face++ эффективность защиты составляет 100%). Более того, даже если в будущем оригинальные, необработанные утилитой, фотографии будут использованы в модели, при обучении которой уже применялись искажённые варианты фотографий, уровень сбоев при распознавании сохраняется и составляет не менее 80%.

Метод основывается на феномене "состязательных примеров", суть которого в том, что несущественные изменения входных данных могут привести к кардинальным изменениям логики классификации. В настоящее время феномен "состязательных примеров" является одной из главных нерешённых проблем в системах машинного обучения. В будущем ожидается появление систем машинного обучения нового поколения, лишённых рассматриваемого недостатка, но эти системы потребуют значительных изменений в архитектуре и подходе к построению моделей.

Обработка фотографий сводится к добавлению в изображение комбинации пикселей (кластеров), которые воспринимаются алгоритмами глубинного машинного обучения как характерные для изображаемого объекта шаблоны и приводят к искажению признаков, применяемых для классификации. Подобные изменения не выделяются из общего набора и их чрезвычайно трудно обнаружить и удалить. Даже имея оригинальное и модифицированное изображения, проблематично определить, где оригинал, а где изменённая версия.

https://www.opennet.ru/opennews/pics_base/0_1595489876.png

Вносимые искажения демонстрируют высокую стойкость против создания контрмер, нацеленных на выявления фотографий, нарушающих корректное построения моделей машинного обучения. В том числе не эффективны методы на основе размытия, добавления шумов или наложения фильтров на изображение для подавления пиксельных комбинаций. Проблема в том, что при наложении фильтров точность классификации падает значительно быстрее, чем определимость пиксельных шаблонов, и на том уровне когда искажения будут подавлены, уровень распознавания уже нельзя считать приемлемым.

Отмечается, что как и большинство других технологий для защиты конфиденциальности, предложенная техника может использоваться не только для борьбы с неавторизированным использованием публичных изображений в системах распознавания, но и как инструмент для скрытия злоумышленников. Исследователи полагают, что проблемы с распознаванием в основном могут коснуться сторонних сервисов, бесконтрольно и без разрешения собирающих информацию для обучения своих моделей (например, сервис Clearview.ai предлагает БД распознавания лиц, построенную (https://www.nytimes.com/2020/01/18/technology/clearview-privacy-facial-recognition.html) на индексации около 3 миллиардов фотографий из социальных сетей). Если сейчас в коллекциях подобных сервисов находятся преимущественно достоверные изображения, но при активном использовании Fawkes, со временем, набор искажённых фотографий окажется больше и модель будет считать их более приоритетными для классификации. На системы распознавания спецслужб, модели которых строятся на основе достоверных источников, опубликованный инструментарий повлияет в меньшей степени.

Из близких по назначению практических разработок можно отметить проект Camera Adversaria (https://benswift.me/assets/documents/preprints/browne_et_al_2020_camera_adversaria.pdf), развивающий мобильное приложение (https://play.google.com/store/apps/details?id=com.kieranbrowne.cameraadversaria) для добавления на изображения шума Перлина (https://ru.wikipedia.org/wiki/%D0%A8%D1%83%D0%BC_%D0%9F%D0%B5%D1%80%D0%BB%D0%B8% D0%BD%D0%B0), мешающего корректной классификации системами машинного обучения. Код Camera Adversaria доступен (https://github.com/kieranbrowne/camera-adversaria) на GitHub под лицензией EPL. Другой проект Invisibility cloak (https://www.cs.umd.edu/~tomg/projects/invisible/) нацелен на блокирование распознавания камерами наблюдения через создание специальных узорчатых плащей, футболок, свитеров, накидок, плакатов или шляп.

23.07.2020

https://www.opennet.ru/opennews/art.shtml?num=53414

altblitz

24.07.2020, 01:05

Понасиловал оба полушария своих и... не постиг с первого раза чтения.

> Метод основывается на феномене "состязательных примеров", суть которого в том, что несущественные изменения входных данных могут привести к кардинальным изменениям логики классификации. В настоящее время феномен "состязательных примеров" является одной из главных нерешённых проблем в системах машинного обучения.

Теперь, суть статьи стала ближе и понятней. Лишь чуть.

https://i.imgur.com/PQ8y1CZ.jpg

- А вот Котёнка Кисс, - стоило лишь молвить Блиц

- Хватит! Мы давно знаем, что она спортивна, умна и красива, в свои 14 юных лет! - заорал Хор Мальчиков Алкоголиков Античат

- ... И опознаёт она Блиц - за 5-10 метров, в маскере на лецо и тёмных поляризованных вело-очочках, - на этом завершил препирательства Блиц

1. Завтрак позволяй принести в постель свою (соблюдения соц.-дистанции ради)

2. Позаботься о "время - для себя", выбрав, например, местечко под Солнцем

3. Мой часто и тщательно лапки

4. Играй со своим персоналом в игры. Для расслабления и релаксации своей

5. Не допусти Corona-килораммы, играйся в кормление-игры

6. Отдыхай продолжительными сеансами и не падай духом!

(c) Anneke Brandt - Majesteit Nr. 132 augustus-september 2020

DartPhoenix

24.07.2020, 01:26

↑ (https://antichat.live/posts/4401335/)
Понасиловал оба полушария своих и... не постиг с первого раза чтения.
> Метод основывается на феномене "состязательных примеров", суть которого в том, что несущественные изменения входных данных могут привести к кардинальным изменениям логики классификации. В настоящее время феномен "состязательных примеров" является одной из главных нерешённых проблем в системах машинного обучения.

Я и с третьего раза не постиг. Если они собираются внедрять кривые пиксели в физиономии - у меня для них плохие новости.

Нейронка вполне способна генерировать лица а не только убирать с них артефакты, родинки и прочие свистоперделки.

Я х/з конечно... но что-то оно как-то мне не понимается.

altblitz

24.07.2020, 01:47

↑ (https://antichat.live/posts/4401336/)
Я и с третьего раза не постиг. Если они собираются внедрять кривые пиксели в физиономии - у меня для них плохие новости.
Нейронка вполне способна генерировать лица а не только убирать с них артефакты, родинки и прочие свистоперделки.
Я х/з конечно... но что-то оно как-то мне не понимается.

КМК, reading of the very original article should and will be the eyes-opener.

(let's leave it close for this Friday morning)

Kevin Shindel

31.08.2020, 00:16

Мне кажется идея не взлетит ... просто системам понадобится чуть больше входных данных для тренировки.

DartPhoenix

31.08.2020, 00:32

Kevin Shindel said:
↑ (https://antichat.live/posts/4410748/)
Мне кажется идея не взлетит ... просто системам понадобится чуть больше входных данных для тренировки.

Человек не всегда может распознать лица. Систему порадовать всегда способ найдется пока она не научится думать.

А когда она научится думать - у нас появится больше поводов для беспокойств...