ANTICHAT.XYZ    VIDEO.ANTICHAT.XYZ    НОВЫЕ СООБЩЕНИЯ    ФОРУМ  
Баннер 1   Баннер 2

ANTICHAT — форум по информационной безопасности, OSINT и технологиям

ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию. Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club, и теперь снова доступен на новом адресе — forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
Вернуться   Форум АНТИЧАТ > Оффтоп > Болталка
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

протестировать распознавалку текста
  #1  
Старый 08.04.2008, 11:10
imajo.ati
Участник форума
Регистрация: 21.02.2008
Сообщений: 255
Провел на форуме:
975514

Репутация: 177
По умолчанию протестировать распознавалку текста

сделал скрипт, который преобразовывает введенные символы, похожие на буквы, в русский текст. т.е. букву |/| в и, l3 в В и т.д.
так же преобразовывает англ. буквы, похожие на русские. т.е. букву g в д и т.д.
не путать с транслитом

мне нужно всё это протестировать, найти логические несоответствия (к примеру скрипт может неправильно распознать рядом стоящие буквы)
одному это делать очень трудно.

ну вот) если не затруднит прошу попробовать
http://pk.890m.com/ai.php
плюсы поставлю конечно же) ошибок должно быть много

особенно приветствуются от вас комбинации символов, похожие на буквУ, которые скрипт не видит.
 
Ответить с цитированием

  #2  
Старый 08.04.2008, 11:45
Lesnoy_chelovek
Постоянный
Регистрация: 06.12.2006
Сообщений: 321
Провел на форуме:
1536533

Репутация: 370
Отправить сообщение для Lesnoy_chelovek с помощью ICQ
По умолчанию

|-|-| , так-то Ж задумывалась, а выдало н-|
|-@ , так-то Ю задумывалсб, а выдало а
 
Ответить с цитированием

  #3  
Старый 08.04.2008, 12:38
imajo.ati
Участник форума
Регистрация: 21.02.2008
Сообщений: 255
Провел на форуме:
975514

Репутация: 177
По умолчанию

большое спасибо, добавил @ к кружочку от Ю и сделал ж с черточками) главное чтобы теперь не конфликтовало с остальными буквами.
 
Ответить с цитированием

  #4  
Старый 08.04.2008, 12:44
Isis
Флудер
Регистрация: 20.11.2006
Сообщений: 3,316
Провел на форуме:
16641028

Репутация: 2371


По умолчанию

Цитата:
'"/><script>alert(/1/)</script> (обычный текст)

'ухsсгiрт>аlегт(л/к/sсгiрт> (распознанный текст)

ухсгртаегтлксгрт (без лишних символов)
))
 
Ответить с цитированием

  #5  
Старый 08.04.2008, 13:01
imajo.ati
Участник форума
Регистрация: 21.02.2008
Сообщений: 255
Провел на форуме:
975514

Репутация: 177
По умолчанию

да, оно распознает символы, похожие на русские буквы. qwerty поймет как "шерту"

это можно так сказать будущий фильтр мата =)
только замена будет происходить не текста целиком, а каждого слова в отдельности. и не сошедшиеся с шаблоном преобразованные слова будут не тронуты и выведены в своем первонапечатанном виде)

Последний раз редактировалось imajo.ati; 08.04.2008 в 13:03..
 
Ответить с цитированием

  #6  
Старый 08.04.2008, 13:32
xXvladXx
Участник форума
Регистрация: 28.10.2007
Сообщений: 143
Провел на форуме:
913233

Репутация: 162
По умолчанию

Opy*ue (обычный текст)

ору*ие (распознанный текст)

оруие (без лишних символов)
а имелось в виду "оружие"
ЗЫ когда тестил вспомнил l2 и тупо убитые 1,5года, как там почти все писали на транслите
 
Ответить с цитированием

  #7  
Старый 08.04.2008, 13:37
xXvladXx
Участник форума
Регистрация: 28.10.2007
Сообщений: 143
Провел на форуме:
913233

Репутация: 162
По умолчанию

)(` (обычный текст)

)г (распознанный текст)

г (без лишних символов)
 
Ответить с цитированием

  #8  
Старый 08.04.2008, 13:40
xXvladXx
Участник форума
Регистрация: 28.10.2007
Сообщений: 143
Провел на форуме:
913233

Репутация: 162
По умолчанию

1—o (обычный текст)

1—о (распознанный текст)

1о (без лишних символов)
имелось в виду Ю
и вот
l° (обычный текст)

l° (распознанный текст)

(без лишних символов)
имелось в виду Р

Последний раз редактировалось xXvladXx; 08.04.2008 в 13:43..
 
Ответить с цитированием

  #9  
Старый 08.04.2008, 13:44
m9chik
Познающий
Регистрация: 20.06.2007
Сообщений: 99
Провел на форуме:
1129104

Репутация: 122
По умолчанию

извените конеша,но помойму албанский уже все знают :d
 
Ответить с цитированием

  #10  
Старый 08.04.2008, 13:44
imajo.ati
Участник форума
Регистрация: 21.02.2008
Сообщений: 255
Провел на форуме:
975514

Репутация: 177
По умолчанию

xXvladXx
за транслит будет отвечать отдельная функция, которая будет проверять нераспознанный текст.

за )(` спасибо! значит букве "х" нужен приоритет больше чем букве "г", сейчас исправлю)
и к ю добавил палочку)

Цитата:
l° (обычный текст)
да.. символы юникода я не учел..
некоторые программы их на вопросы заменяют, или если ос их не поддерживает, она их заменяет на квадратики.

Последний раз редактировалось imajo.ati; 08.04.2008 в 13:49..
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
перегон текста в транслит и в RuEn vp$ PHP, PERL, MySQL, JavaScript 2 07.03.2008 12:56



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ