Сориентироваться на рынке технологий распознавания документов – задача непростая. А отнестись к выбору системы стоит, между тем, ответственно: от надежности разработчика ПО зависит, будет ли решение функционировать без сбоев и будет ли работать вообще.
Чтобы в дальнейшем дорогостоящее IT-решение не разочаровало – мы, Smart Engines, подготовили универсальный чек-лист. Он поможет вам минимизировать риски (спойлер: их немало) при выборе разработчика системы оптического распознавания текста и подобрать оптимальное решение.
Вот как он выглядит:
Профиль компании-разработчика:
У компании-разработчика официально трудоустроены более 20 человек?
Отзывы на продукты компании в основном положительные?
Среди клиентов разработчика - крупные банки, операторы связи или другие крупные компании?
Средняя зарплата сотрудников компании составляет более 200 тыс. рублей?
Компания-разработчик патентует свои изобретения?
Сотрудники компании регулярно публикуют научные статьи и участвуют в научных конференциях?
У разработчика российское юридическое лицо?
Компания-разработчик принадлежит гражданам РФ?
Программные продукты разработчика входят в реестр российского ПО?
Технологические аспекты решений:
В софте используется только собственная технология распознавания текста OCR разработчика?
Решения компании-разработчика работают без GPU? И какие ОС поддерживают?
Распознавание документов осуществляется в контуре вашей компании?
Изображения документов не передаются на обработку в облачные сервисы?
Возможности систем распознавания:
Программные продукты разработчика умеют обнаруживать и обрабатывать таблицы, печати и штрихкоды?
Решение обеспечивает распознавание документов других стран, когда вам, например, нужно не только распознавание паспорта РФ, но и удостоверения личности СНГ, ЕАЭС и всего мира?
Программные продукты разработчика обеспечивают распознавание неструктурированных документов?
Решение умеет находить документ на фотографии или скане и распознавать его?
Решение распознает не только печатный текст, но и рукописный?
Поддерживается ли распознавание документов прямо на мобильном телефоне?
Проверка решения "собственными силами":
Разработчик согласен предоставить исходный код своих программных продуктов для аудита?
Проверка компании-разработчика начинается с поиска ее профиля в Rusprofile или иных сервисах статистики. Там размещена проверенная информация о деятельности компании, которая необходима для оценки различных рисков. Среди основных аспектов, на которые необходимо обратить внимание:
Численность сотрудников и их средняя зарплата. Для стартапа, разрабатывающего системы распознавания, необходимо иметь минимум один или два десятка работников - для непрерывной разработки решений, поставки софта и его дальнейшей технической поддержки. Как правило, у IT-специалистов, задействованных в создании систем распознавания, средняя зарплата в Москве равняется примерно 200 тысяч. Если в стартапе работают всего 3-5 человек и, например, за 40 тысяч рублей, то это может свидетельствовать, в частности, об использовании чужих технологий - если у вас есть все готовое, то для переупаковки ПО в свой программный продукт понадобится не так много работников (и не обязательно с высокой квалификацией).
Отзывы и кейсы клиентов. Обычно IT-стартапы активно информируют о своих клиентах: на сайтах под них выделен специальный раздел, и там указывается, кто интегрировал решения разработчика и какие именно; в пресс-релизах и новостях упоминаются случаи нового внедрения и тому подобное. То же касается и отзывов - они или размещены на сайте производителя систем распознавания, или без труда находятся на различных агрегаторах. Если записи о клиентах отсутствуют или они имеются, но среди них нет ведущих банков, операторов связи или крупных предприятий, то это тоже является поводом выбрать другого разработчика. Нужно обращаться внимание, что логотипы на сайте могут быть связаны с прохождением конкурса, хакатона или проведением пилотного проекта.
Среди условных “красных флагов” можно выделить также, например, наличие арбитражных дел, связанных с ненадлежащим исполнением обязательств договора по оказанию услуг со стороны разработчика; резкое или продолжающееся снижение показателей прибыли и выручки; наличие сведений о непредставлении налоговой отчетности более года на сайте ФНС и так далее. Вся эта информация может свидетельствовать о финансовой неустойчивости компании, низком качестве ее программных продуктов и их невостребованности на рынке систем распознавания.
Научная деятельность компании. Смотрим сайт компании и любые открытые источники. Если сотрудники IT-фирмы постоянно публикуют статьи в научных журналах (особенно в таких, которые индексируются в WoS и Scopus - то есть являются “элитой” научных изданий), регулярно получают патенты на изобретения и участвуют в конференциях, включая международные, то это знак того, что решения компании основаны на собственных разработках, которые к тому же получают признание научного сообщества. Если о статьях и патентах компании ничего не известно, то это может означать, что она пользуется чужими технологиями и не является разработчиком в полном смысле этого слова.
После того, как вы просмотрели профиль компании, следует изучить юридические аспекты ее деятельности. Для этого уделите внимание тому:
Есть ли у компании российское юридическое лицо. Важно, чтобы разработчик был полностью отечественной компанией. Иностранный владелец может в любой момент покинуть российский рынок, и тогда пользователи продукта могут столкнуться или с нестабильной работой систем, или остановкой многих бизнес-процессов. Чтобы избежать это, рекомендуется зайти на сайт разработчика или сервисы проверки юридических лиц. Если структура компании скрыта (или в качестве формы собственности у нее указано, например, LLP - Limited Liability Partnership), это повод усомниться в долгосрочных перспективах ее работы на российском рынке.
Входят ли программные продукты разработчика в реестр российского ПО. Ситуации 2022 года, когда многие зарубежные IT-стартапы ушли с российского рынка и перестали поддерживать свои корпоративные продукты на территории нашей страны, отчетливо показала, что в нынешних реалиях следует полагаться на отечественные, а не зарубежные решения. Это особенно актуально для объектов критической инфраструктуры, поскольку с 1 января 2025 года вводится запрет на использование там иностранного ПО. В свою очередь для попадания в реестр необходимо соответствовать ряду строгих требований (большая часть компании-производителя должна быть в собственности россиян; ПО не должно принудительно обновляться и управляться из-за рубежа; софт и его компоненты не должны иметь ограничений на использование на территории России или некоторых регионов и так далее), и если программный продукт успешно прошел все необходимые проверки, то это значит, что ему доверяет Минцифры.
Отсутствие подобной проверки чревато для компании-заказчика огромными штрафами. Так, в России действует Федеральный закон "О персональных данных" от 27.07.2006 N 152-ФЗ. В нем, частности, регулируется трансграничная передача данных - если вы работаете с иностранными партнерами или пользуетесь зарубежным сервисом, обрабатывающим персональные данные, об этом необходимо сообщать Роскомнадзору. В случае несоблюдения этого требования оператор может быть привлечен к административной ответственности: за трансграничную передачу данных без надлежащего правового основания – до 300 000 рублей (ч. 1 ст. 13.11 КоАП РФ); за неуведомление Роскомнадзора о ТПД – до 5000 рублей (ст. 19.7 КоАП РФ), за невыполнение предписания Роскомнадзора об устранении нарушений – до 20 000 рублей (ч. 1, ст. 19.5 КоАП РФ). Так что если вы пользуетесь иностранным ПО, то будете вынуждены регулярно отчитываться перед Роскомнадзором, который к тому же имеет право запретить передачу данных. Все это тормозит работу компании и в ряде случаев может привести к ее частичной или полной парализации.
После того, как все юридические тонкости были улажены, разработчика необходимо расспросить о всех технических нюансах его решений. Для этого прежде всего узнайте:
OCR-система, используемая в решении, является собственной разработкой компании? Оптическое распознавание символов (optical character recognition - OCR) - технология, отвечающая за создание цифровой копии напечатанных или написанных от руки символов. Она является ключевым элементом систем распознавания, а потому важно, чтобы поставщик ПО имел свою собственную OCR, а не пользовался чужой. Вендор (или сообщество, если речь идет о бесплатном или открытом ПО) может в один момент ограничить работоспособность своих программных продуктов, и тогда под ударом окажутся и компания-разработчик, использовавшая стороннюю систему оптического распознавания, и ее клиенты.
С какими операционными системами и архитектурами совместимо OCR-решение? Например, с процессорами x86 и ARM. Если это не уточнить, то есть риск того, что вы приобрете решение, а оно не будет запускаться на вашем компьютере или планшете. Соответственно, вы зря потратите деньги. То же касается мощных графических процессоров (GPU) - разработчики обещают высокое качество распознавания с не менее впечатляющей скоростью, но для этого требуется мощное оборудование, на которое у организации может не быть средств. Если поставщик решения заявляет, что программа будет обеспечивать высокое качество и скорость без GPU, то это можно считать хорошим знаком — технология OCR аппаратно-независимая, а потому ее можно спокойно запускать на всех своих устройствах.
Отдельно необходимо остановиться на том, где происходит обработка информации. Решения для распознавания бывают on-premise и on-cloud. В первом случае обработка документов осуществляется в локальной оперативной памяти на сервере, компьютере, телефоне, планшете и на ином устройстве; во втором - изображения документов, паспортов, квитанций и тому подобного пересылаются на обработку в облачные сервисы. On-cloud является гораздо менее надежным, чем on-premise, так как высок риск того, что при пересылке данных туда и обратно, как бы их не защищали, они могут быть случайно (или намеренно) слиты в сеть.
Напомним, что в последнее время Государственная Дума стремится усилить наказание для компаний, допустивших утечки персональных данных граждан, и в январе 2024 года в первом чтении был принят закон об оборотных штрафах. Согласно ему, взыскиваемые суммы для юридических лиц могут составлять от 0,1% до 3% выручки за календарный год или за часть текущего года - не менее 15 млн рублей и не более 500 млн рублей. Более того, в России планируют ввести специальные требования к квалификации и деловой репутации заместителей глав финансовых организаций, ответственных за информационную безопасность. В частности, при участии ЦБ был разработан законопроект, включающий положение о запрете для ответственных за информационную безопасность замглав организаций занимать подобную должность в течение 10 лет, если в период их работы в другом учреждении допускались нарушения требований к защите информации. Так что в результате утечек персональных данных клиентов (а фактически - выбора on-cloud решений) компании могут столкнуться и с миллионными штрафами, и с репутационными потерями, и даже риском для некоторых сотрудников лишиться возможности занимать свою должность в течение ряда лет.
Помимо этого, облачные сервисы распознавания к работе привлекают краудсорсинговые платформы, операторы которых проверяют качество распознавания и в ряде случаев набирают тексты со сканов или фотографий документов. При этом оператором может стать буквально любой желающий - достаточно зарегистрироваться в сервисе. Другими словами, к данным ваших документов, паспортов или доверенностей ваших клиентов получают доступ совершенно посторонние люди, которые могут распорядиться подобной информацией по своему усмотрению - поскольку в краудсорсинге задействованы тысячи людей, компания-разработчик или облачный провайдер не могут чисто физически контролировать действия каждого из них. При этом некоторые сервисы не скрывают, что применяют полученные данные в обучении своих нейросетей. Соответственно, любая организация, которая воспользовалась on-cloud решениями, рискует впоследствии столкнуться с возмущениями и исками от клиентов, ставших жертвами пиратского метода обучения ИИ.
Напоследок упомянем, что недавний сбой в работе Microsoft, затронувший авиакомпании, банки, службы спасения и даже рестораны быстрого питания по всему миру, наглядно показал всю ненадежность модели on-cloud. Если компания не хочет, чтобы из-за ошибки в обновлении облачной платформы была остановлена часть ее бизнес-процессов, ей лучше выбрать on-premise.
Проверив юридический статус поставщиков, удостоверившись, что в ПО используются собственные технологии компании, и расспросив о технической стороне решений, далее клиенту при выборе системы распознавания стоит ориентироваться на то, в каких бизнес-процессах и для чего будет использоваться софт.
Например, для банков, страховых компаний и ритейла, получающих каждый день тысячи и десятки тысяч документов, будет крайне важно, чтобы решение работало с высокой скоростью (например, распознавало 15 документов в секунду на сервере), обладало комплектом документов, чье распознавание уже настроено (и дизайнер для настройки форм для распознавания, что может пригодиться в случае неструктурированных или редких типов документов) и умело обнаруживать и корректно обрабатывать таблицы, печати и штрихкоды.
Для компаний, которым нужно удостоверить личность клиентов, посетителей, работников и др. желательно, чтобы программный продукт поддерживал распознавание паспортов и других удостоверяющих личность документов не только РФ, но и всех стран мира для ускорения обслуживания иностранных граждан.
Для банков и других компаний, которые используют цифровые каналы обслуживания, необходимо, чтобы решение умело находить на фотографиях документ и распознавать его, поскольку часто именно в таком виде изображения паспорта и других документов загружаются клиентами. Помимо этого, для оформления кредитов или проведения иных операций требуются данные прописки, которая в паспорте РФ может быть печатной и рукописной, и потому программный продукт должен распознавать не только машинописный текст. Также для банковской сферы актуально, чтобы система распознавания могла быть запущена на мобильных устройствах, в том числе бюджетных. Это может пригодиться как при выездном обслуживании, так и в онлайн-банкинге: у клиентов есть возможность вместо того, чтобы посещать отделение, быстро отправлять денежные переводы, обновлять паспортные данные или оформлять кредиты в мобильном приложении или интернет-браузере без необходимости вручную вбивать все необходимые данные.
Напоследок упомянем, что перед приобретением системы распознавания у разработчика стоит уточнить, можно ли получить исходный код программного решения. Так удастся провести аудит программного продукта, проверить работу алгоритмов, оценить их уязвимости и решить, подходит данное решение под нужды компании или нет.
Если на подобную просьбу следует отказ, то к этому стоит относиться с подозрением: не означает ли нежелание делиться кодом то, что решение в действительности не обладает всем тем функционалом, обещанном разработчиком? В таком случае лучше обратиться к другому вендору, который уверен в своих программных продуктах и готов дать их протестировать.
На этом наша методичка, которая построена на основе юридических заключений и системного анализа, подходит к концу (очень надеемся, вас она впечатлила!). Конечно, это всего лишь дружеские рекомендации, а при желании можно пропустить вообще все этапы. Разумеется, можно не утруждать себя долгими интервью, можно выбрать первую попавшуюся систему распознавания. И даже может быть повезет - может быть!
Только не стоит забывать: при таком сценарии компания-клиент в самом лучшем случае рискует не справиться с возложенным на нее объемом работ и впустую потратить свои деньги. А уж что включает в себя негативный сценарий не стоит и напоминать - слышали же про утечки персональных данных, скандалы, недовольство (и судебные иски) пользователей и многомиллионные штрафы.
Надо ли оно компании? Мы в Smart Engines этого не знаем, но убеждены, что перестраховаться всегда лучше. Тщательная проверка разработчика систем распознавания позволит избежать рисков и проблем в будущем. А уж финальный выбор - за вами. Надеемся, что он будет правильным! :)
Как работают наши системы распознавания и наша собственная фирменная OCR можно попробовать в наших демо-приложениях! Никаких GPU, мощных серверов, чужих OCR, облаков и тем более краудсорсинга c HITL-ми операторами. Только ИИ!