Тема
:
Другие Новости [Всё то, о чём Вы хотели сообщить..]
Показать сообщение отдельно
#
2211
13.06.2022, 10:00
alexzir
Постоянный
Регистрация: 29.10.2019
Сообщений: 473
С нами:
3444086
Репутация:
22
Российские энтузиасты создали своего «ИИ для ненависти» обученного на 2ch
Вдохновленные
работой Янника Килчера
,
который обучил машину «языку ненависти» используя 3
,
3 миллиона тредов с печально известной токсичной доски 4chan «Политически некорректно» /pol/ — российские энтузиасты
запустили Telegram бота обученного на отечественном 2ch
.
hk используя доску /b/
В качестве диалоговой модели
был использован GPT-2
,
обученный на датасете из постов анонов
.
Итоговый датасет
насчитывал порядка 60 тысяч диалогов
.
☝
Также
для повышения токсичности
данных данные были отфильтрованы с помощью модели классификатора
rubert-toxic-pikabu-2ch
.
Модель была создана для модерации токсичного контента
,
но никто не мешает использовать ее во зло
.
Весь код сбора данных
,
обучения модели и бота энтузиасты
выложили в открытый доступ на GitHub
.
Для простоты использования настроено поднятие бота с помощью docker-compose
.
Кроме того
,
они
оставили инструкцию на habr
.
================
Из
наблюдений пользователей
,
российский бот действительно получился токсичным
,
но не принимающий во внимание контекст сообщений
Бот:
https://t.me/toxic_ebanko_bot
Гыгыка
alexzir
Посмотреть профиль
Репутация
Найти все сообщения от alexzir
Добавить в друзья