Имя: Пароль:
1C
1С v8
Украина. Реестр плательщиков НДС (sts.gov.ua) - победа над капчей!
0 Rolex
 
17.01.13
02:37
Я просто оставлю это здесь...

http://towcoder.blogspot.com/2013/01/project-ocr-teaser_16.html

Лично бы посчитал это фейком... Если бы не был автором ;)
1 Rolex
 
17.01.13
02:58
Да, оформлено все это в виде Web-сервиса, и NativeAPI компоненты (работающей в продакшн-режиме с сентября 2012 года, которую, по ряду причин опубликовать не могу). Сейчас заканчиваю подготовку к бета-тестированию Web-сервиса (работает под Linux-ом на Apache Tomcat внутри компьютера, собранного буквально из найденных в гараже запчастей). В  перспективе - при наличии интереса со стороны общественности - планирую перенос на полноценный хостинг.
2 Стрелок
 
17.01.13
03:01
а зачем это?
3 Митор
 
17.01.13
03:03
мать моя... Дитер
4 Злопчинский
 
17.01.13
03:10
(2) а чтобы СМС отправлять нафиг без всяких телефонов...
5 Rolex
 
17.01.13
03:30
Нет, с СМС-спамерами и прочими спамерами принципиально не связывался и не собираюсь. Просто как-то некрасиво выходит, что на деньги налогоплательщиков создаются сервисы для этих самых налогоплательщиков, которыми невозможно нормально пользоваться. Просто полгода назад так почти случайно вышло - почти что на-спор, что я смогу реализовать распознавалку капчи украинской налоговой с результативностью более 75%, уложившись в 64 килобайта на код + все возможные данные. А проблемами распознавания образов я интересуюсь довольно давно, и довольно плотно. И кстати, (дикий спойлер) - следующие на очереди - "Почта России" (сервис трекинга посылок). Но об этом - уже наверное прочитаете на Хабре.
6 Rolex
 
17.01.13
03:58
Митор, кстати о Дитере, т.е. Dithering. Я так понял, чтот имелся в виду именно шум на картинке. Так вот, он почти полностью убирается совершенно тривиально, там всего 14 строк кода. Идея такая: если цвет пиксела не равен цвету фона, и вокруг пиксела нет ни одного пиксела такого же цвета, то мы тупо устанавливаем для него цвет фона. А для капчи sts.gov.ua цвет фона не изменяется, что дополнительно упрощает задачу. Правда для того, чтобы сделать картинку пригодной к передаче на этап распознавания, она проходит еще через 5 подобных маленьких, но хитрых фильтров.

А вот для IRC-шной этот прием не канает, ибо там JPEG, причем дико пожатый. Там был использован другой подход - но даже еще проще. Впрочем, секреты фокусов пока раскрывать не буду )
7 Митор
 
17.01.13
04:01
(6) несколько имен собственных я понял... Дружище может тебе почь чем? А ? Наркотики зло...
8 Rolex
 
17.01.13
04:10
Митор, наркотики - зло, согласен :) Ладно, технических деталей внутренней реализации больше не будет.
9 Митор
 
17.01.13
04:20
(8) насколько я понял вы из Украины? террасофт о чем нибудь говрит Вам
10 Rolex
 
17.01.13
04:28
Митор, да, Украина, Киев. Terrasoft - да, говорит. Я правда по основному роду занятий не с CRM связан, а с Business Intelligence. Но в целом это довольно близкие направления.
11 Митор
 
17.01.13
04:34
(10) печаль. была надежа "А вдруг ?"