Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   Социальные сети (https://forum.antichat.xyz/forumdisplay.php?f=133)
-   -   Шрифт каптчи ВК (https://forum.antichat.xyz/showthread.php?t=178309)

PabloPicasso 12.02.2010 18:28

Шрифт каптчи ВК
 
Как вы думаете какой шрифт более близкий к тому который генерится в каптче ВК?
вот 3 ВК каптчи:
http://img692.imageshack.us/img692/2724/captcha1.pnghttp://img6.imageshack.us/img6/2724/captcha1.pnghttp://img205.imageshack.us/img205/2724/captcha1.png

мне кажется эт Times New Roman

FEV 12.02.2010 21:32

Убран волновой фоновый шум и произведена элементарная бинаризация изображения.
Боюсь, что для распознавания этого не достаточно)
Лучше попробуй решить следующие проблемы:
1) удаление 2х пересекающих капчу линий, которые существенно мешают распознаванию
2) сегментация символов
А распознать уже разрезаные символы - это элементарно)

PabloPicasso 12.02.2010 22:29

я для четкости бинаризировал, отсекание линий я нашел в одном из алгоритмов определения градиентных областей, символы у меня разделяет с 70% точностью

я просто со шрифтом определится хочу, хотя уже не нужно, нашел оптимальный =)

советую почитать:
http://www.cognitive.ru/innovation/sbornic4/doc10.doc
и здесь
http://openocr.org/forum/viewtopic.php?f=5&t=15

Whois 13.02.2010 13:12

Цитата:

Сообщение от PabloPicasso
я для четкости бинаризировал, отсекание линий я нашел в одном из алгоритмов определения градиентных областей, символы у меня разделяет с 70% точностью

я просто со шрифтом определится хочу, хотя уже не нужно, нашел оптимальный =)

советую почитать:
http://www.cognitive.ru/innovation/sbornic4/doc10.doc
и здесь
http://openocr.org/forum/viewtopic.php?f=5&t=15

отпишись если чтото получиться.... довольно актуальная тема

P.A.U.L 13.02.2010 14:02

Сменят вид капчи, и все, трындец)

PabloPicasso 13.02.2010 19:37

с антикапчей они нечего менаять не будут

PabloPicasso 15.02.2010 10:32

ВК могут не волноваться, даже с полной оптимизацией капчу разбирает 30 сек и 10 распознает )))

самая быстрая система получается при распознавании слегка очищенной каптчи полным перебором средним размером шрифта, в этом случае примерно 10% правильных ответов и 20 сек на каждую каптчу.

с полным разбором до 60% правильных и 40 сек на шт.

dvion 22.02.2010 06:02

PabloPicasso,
40 сек - много.

60% - мало.

Шрифт, ближе B52 - не нашёл. Но с B52 у меня процентов 95 есть, думаю.

actralus 25.02.2010 21:47

программистом россии жалко заплатить бакс за 1000 капч а не жалко убить всю жизнь способом распознованием xD

Tigger 25.02.2010 22:13

Цитата:

Сообщение от actralus
программистом россии жалко заплатить бакс за 1000 капч а не жалко убить всю жизнь способом распознованием xD


Это спортивный интерес.
Видимо не понять.

[Soulfly] 25.02.2010 23:23

Цитата:

Это спортивный интерес.
Можно даже сказать - научный.

GeraMon 25.02.2010 23:57

я тысячи баксов уже на эти капчи потратил так что автоматическая распознавалка окупаться будет )

Fliplab 26.02.2010 12:42

Подскажи как отсек пересекаемые линии.

dvion 27.02.2010 13:12

Цитата:

Подскажи как отсек пересекаемые линии.
Как уже понятно, нету как бе идеального.

У меня вот так высекается (вторичный главный фильтр, убирает основное говно и каку)

x := InThesePixelsQa(i,j); <- стандартный пейнтовский алгоритм (забирает кусок образца и вычисляет куб MaxX, MinX, MaxY, MinY
pe := (x*100)/(((MaxX-MinX)+1)*((MaxY-MinY))+1); процент информативности

if ( ( x/pe ) > gMinSymbHele

где gMinSymbHele - мнимальное, для символа, собсно, значение. у линий и всякого мусора - оно слишком низкое.

ну где-то 0.8 - единичка.


- но это всё при условии, что у вас заранее символы отделены от линий (работа со слоями)

у меня сделано именно так)



Шрифт, как оказалось, дисительна нью тайм роман)
токо, кажись, лапаются там и другие чары - а возможно искривление высокое)

ну, в общем, я лично матрицы не юзаю - я пользуюсь формулой: число совпавших пикселей отнять модуль разницы числа пикселей сравниваемого символа со сравнимым.

ну чё, работает кое-как, тема интересная, можно покопаться для фана :)

ПС кому интересно, дабы базар не лить) slil. ru /28713027

derrekes 27.02.2010 21:57

Цитата:

я тысячи баксов уже на эти капчи потратил так что автоматическая распознавалка окупаться будет )
Поддерживаю. Предлагаю закрытый клуб борцов против капчи сделать. Кто за? Думаю те кто в теме понимают какие это расходы несмотря на низкую стоимость капчи. все инвайтеры как минимум

dvion 27.02.2010 22:14

Кодом не поделюсь, он дорогой сильна :х ))

Могу подсказать кому интересно интересующие вещи, так сказать - это без проблем)

-Straniks- 27.02.2010 22:31

dvion, Какой процент распознания у тебя? И какая скорость разгадывания? тестил на инвайте?

dvion 27.02.2010 22:55

Процент распознавания зависит от режима, я думаю что процентов 30-40, не более. Скорость распознавания - ~200 MS (по возможности тут ускоряю, можно значительно меньше, но либо перекатывать вообще на асму или иные компоненты).
Пс а сразу перекатыать не вариант - так как ещё "в доработке" )

Инвайтинг - всё норм. В инвайтинге по моим наблюдениям всё зависит от скорости ответа на капчу.

Такие дела.

FEV 27.02.2010 23:24

Можно ставить счетчик, сколько кодерам ВК потребуется времени для того, чтоб переделать капчу)

Vald 28.02.2010 00:43

Если бы так открыто в паблике не обсуждали...

WanSider 28.02.2010 07:08

Помучался немножко сегодня с этой капчей, получилось лишь слегка расчистить. С линиями еще побьюсь, но вопрос:

Как организовать сравнение с эталоном? Буквы выкручены волнами и совпадать будут на малый процент. А все образцы насколько я понимаю собрать почти нереально.

Может кто-то механизм объяснить?

P.s.: пока у меня получилось вот так очистить. Надеюсь дальше больше.
http://dump.ru/viewer/preview/biggest/4374722.jpg

Скачать файл VkCapcha-Looker.exe

Syslik56 28.02.2010 07:19

не гоните.)) Хватит это обсуждать))) Они же все читают и видят)) Это же как война. У них тут шпионы есть.

Soldier 28.02.2010 16:25

согласен, в паблике тему обсуждать нельзя

dvion 28.02.2010 17:04

Да не, никто ничё менять не будет (в плане каптч), тем более, что каптча не ихняя, а слямженная откуда-то.

У слямженой этой каптчи подефолту не были использованы те параметры, которые ща юзаются. Ввиду этого пришлось сделать алгоритм, который более сложную задачу решает.

Кроме того, сделал алгоритм распознавания 1 раз - сделать можно и второй. На мой взгляд, читать можно всё, что может человек читать. Но, тем не менее, подумать, конечно, надобно :)

[Soulfly] 28.02.2010 17:45

Цитата:

Да не, никто ничё менять не будет (в плане каптч), тем более, что каптча не ихняя, а слямженная откуда-то.
Еще как будут, когда припрет.

dvion 28.02.2010 17:53

Цитата:

Еще как будут, когда припрет.
Не, они скорее привязки к мобилам оформят и т.д. А так - ничто не спасёт, как мне кажется.

min7 28.02.2010 23:31

WanSider, Trojan-PSW.Win32.VKont.hf в твоём ехе какбе

WanSider 28.02.2010 23:42

Цитата:

Сообщение от min7
WanSider, Trojan-PSW.Win32.VKont.hf в твоём ехе какбе


Там есть функция запроса капчи с сайта. Наверно поэтому так определяется. Если хотите можете проверить, запрос только на VK.


Время: 14:51