Показать сообщение отдельно

  #7  
Старый 28.01.2010, 17:09
m0Hze
Он хакер.
Регистрация: 01.11.2008
Сообщений: 1,756
Провел на форуме:
6462214

Репутация: 3171


По умолчанию

Цитата:
Сообщение от m0Hze  
Что бы распознать сложную каптчу,даже без мусора,просто с помехами, нужно очень много ресурсов и времени.
Пока что я смог собрать небольшую базу символов,только в 18к символов,то есть - обучил своего дешифровщика распознавать 18к сиволов в такой каптче.Пока что результат неплохой,в среднем 3 варианта на 1 каптчу,где1 в всегда верный.Но мучений конечно слишком много,непонятно как делить на символы,приходиться тпо руками обучать
Простой перевод картинки в байтовое представление.
Вот тута
Пока что на основе этого,могу распознать каптчу от дле как я говорил,с 33% удачи.Давно этим не занимался =)
То есть, я смог полностью очистить каптчу от ненужных мне вещей,и оставить только буквы.Можно обучить построчно искать буквы,можно по рядам.
Стоит сказать,что проще всего распознать такие символы как 5,0\о,l,1.так как они ну хоть как,но всегда идут по одному алгоритму,например петелька + палочка,просто "побайтово" считываем изображение,и например регулярками построчно проходим по единицам.Ну а далее сравниваем с уже обученым ботом,на наличие сходства +\-10 "байтов" в стороны, на счет искожения.
 
Ответить с цитированием