![]() |
протестировать распознавалку текста
сделал скрипт, который преобразовывает введенные символы, похожие на буквы, в русский текст. т.е. букву |/| в и, l3 в В и т.д.
так же преобразовывает англ. буквы, похожие на русские. т.е. букву g в д и т.д. не путать с транслитом мне нужно всё это протестировать, найти логические несоответствия (к примеру скрипт может неправильно распознать рядом стоящие буквы) одному это делать очень трудно. ну вот) если не затруднит прошу попробовать http://pk.890m.com/ai.php плюсы поставлю конечно же) ошибок должно быть много особенно приветствуются от вас комбинации символов, похожие на буквУ, которые скрипт не видит. |
|-|-| , так-то Ж задумывалась, а выдало н-|
|-@ , так-то Ю задумывалсб, а выдало а |
большое спасибо, добавил @ к кружочку от Ю и сделал ж с черточками) главное чтобы теперь не конфликтовало с остальными буквами.
|
Цитата:
|
да, оно распознает символы, похожие на русские буквы. qwerty поймет как "шерту"
это можно так сказать будущий фильтр мата =) только замена будет происходить не текста целиком, а каждого слова в отдельности. и не сошедшиеся с шаблоном преобразованные слова будут не тронуты и выведены в своем первонапечатанном виде) |
Opy*ue (обычный текст)
ору*ие (распознанный текст) оруие (без лишних символов) а имелось в виду "оружие" ЗЫ когда тестил вспомнил l2 и тупо убитые 1,5года, как там почти все писали на транслите |
)(` (обычный текст)
)г (распознанный текст) г (без лишних символов) |
1—o (обычный текст)
1—о (распознанный текст) 1о (без лишних символов) имелось в виду Ю и вот l° (обычный текст) l° (распознанный текст) (без лишних символов) имелось в виду Р |
извените конеша,но помойму албанский уже все знают :d
|
xXvladXx
за транслит будет отвечать отдельная функция, которая будет проверять нераспознанный текст. за )(` спасибо! значит букве "х" нужен приоритет больше чем букве "г", сейчас исправлю) и к ю добавил палочку) Цитата:
некоторые программы их на вопросы заменяют, или если ос их не поддерживает, она их заменяет на квадратики. |
Код:
nomer1 (обычный текст) |
Цитата:
если испытания пройдут успешно, выложу уже рабочий скрипт фильтра) а пока это только тест отдельной функции |
Цитата:
IIAHbI4 (обычный текст) IIаны4 (распознанный текст) аны4 (без лишних символов) Antichat (обычный текст) аптiспат (распознанный текст) аптспат (без лишних символов) |
IIAHbI4
не путай с транслитом. а за II = П спасибо =) и за 4 сейчас нормально читается ник =) |
/7 - или Л или П.
]=|=[ }-|-{ }=|={ - Ж (|) - типа Ф |
кароче молодец, правда насколько это актуально яе*у :\
|
|*$i}{ (обычный текст)
р$iх (распознанный текст) рх (без лишних символов) |
Цитата:
а для ж похоже придется добавлять отдельные буквы а не править регулярку. жаль только +1 могу поставить Цитата:
но я учту доллар при транслитерации, спасибо! Цитата:
|
с человеческой точки зрения: если в слове больше английских букв, то H будет восприниматься как "аш", а не как "эн", правильно? стоит ли перебирать слова, в которых некоторые буквы должны читаться как английские, а некоторые - как русские?
|
думаю нет
|
пока что можно потестить на слово из 3х букв)
только комбинации вроде туева хуча пока не распознаются - для этого нужно искать все слова русского алфавита) |
| Время: 20:24 |