Доброго времени суток, уважаемые форумчане!
Делаю интеграцию одного сайта с 1С. Хочу всех пользователей из 1С создать на сайте. Но есть проблема, что в 1С ФИО хранились как попало, иногда не полностью, в одной строке со всяким мусором, а в БД сайта должно быть в разных полях и с минимумом ошибок. Пример строк:
1.
[email protected] Гадя Петрович (мед.сестра)
2.
[email protected] Иванов должен 1000р Иван Иванович
3. Лена Головач
[email protected]
Емайл можно выделить регулярным выражением, отчества по окончанию с 99% точностью, но фамилия и имя - это геморрой.
Есть ли в природе публичный веб-сервис, которые может распознавать имена? Или справочники всех возможных русских фамилий, имен и отчеств. Понятно что будет много мусорных слов и придется загрузку делать интерактивной, но хотелось бы сократить участие пользователя до минимума.