Как программные роботы с ИИ обрабатывают сканы документов и рассказывают о рисках в договорах

Игорь Сорочан
руководитель разработки Primo RPA AI Server
Обработка неструктурированной информации — одна из самых сложных задач в автоматизации бизнес-процессов. Компании часто сталкиваются с необходимостью извлечения данных из документов, анализа изображений или текстов, что требует значительных временных и человеческих ресурсов.

Чтобы справиться с такими вызовами, бизнес всё чаще обращается к современным решениям, способным не только выполнять стандартные рутинные задачи, как отправка накладных или ввод данных, но и работать с неструктурированной информацией. Такие технологии позволяют автоматизировать более сложные операции: распознавание изображений, анализ текстов, извлечение ключевой информации из документов.

В релизе 1.24.12 платформы Primo RPA мы представили обновления в AI Server — инструменте для решения сложных задач с помощью сверхточных нейронных сетей и больших языковых моделей. Этот продукт помогает программным роботам перейти на новый интеллектуальный уровень, открывая бизнесу новые возможности для автоматизации.

В этой статье мы разберем, как AI Server работает, какие задачи он решает и как может быть полезен вашему бизнесу.

Распознавание сканов и обработка естественного языка

Уже с августа этого года пользователям платформы Primo RPA в AI Server доступна функция распознавания сканов структурированных документов — паспорт, СНИЛС и Торг-12. В этом помогает компонент Умный OCR, который классифицирует документы и распознает данные в них, предоставляя результат в структурированном виде. Сервер поддерживает изображения в формате JPG, PNG, PDF.

С ноября Умный OCR работает в связке с новым компонентом — NLP (Natural Language Processing), который базируется на использовании больших языковых моделей (LLM, Large Language Models).
Этот компонент обрабатывает естественный язык, помогая компьютерам распознавать, анализировать и обрабатывать текст. Благодаря такому обновлению AI Server может обрабатывать любые неструктурированные документы — договоры, заявки, резюме, счета и т.д.. Это могут быть также сканы документов или файлы в формате Word, PDF и других, предварительно прошедших обработку в компоненте Умный OCR.

AI Server в такой связке не просто распознает, какой документ поступил ему в виде изображения и куда его отправить дальше. Теперь пользователь получает за несколько минут анализ многостраничного файла или сотен отдельных файлов.

Рассмотрим детальнее работу сервера в разных отраслях на начальном этапе и с внедрением NLP.
Умный OCR
Умный OCR+NLP
Финансовый сектор
  • Банки: автоматизация обработки сканов паспортов, СНИЛС и любых других структурированных документов при открытии счетов, оформлении кредитов, идентификации клиентов;
  • Страховые компании: быстрая верификация документов при оформлении полисов, регистрации страховых случаев.
  • Банки: обработка сканов запросов из госструктур и автоматическое извлечение необходимой информации;
  • Страховые компании: быстрое извлечение информации из страховых договоров (страховые случаи, сумма покрытия). Анализ текстов для выявления противоречий или несоответствий.
Логистика и склад
  • Управление поставками: распознавание счетов, актов и др. документов для автоматического ввода данных о грузах в систему управления складом;
  • Отчетность: автоматизация обработки товарных накладных для бухгалтерии.
  • Управление поставками: извлечение ключевых данных из крупных контрактов: сроки поставки, объемы, штрафные санкции за задержки;
  • Оптимизация запросов клиентов: NLP обрабатывает текстовые запросы в свободной форме («Хочу получить данные о товаре с накладной Торг-12 от 15.11.2024»).
Госуслуги и муниципальные сервисы
  • Цифровизация услуг: автоматизация обработки паспортов и СНИЛС при подаче заявлений на госуслуги;
  • Ускорение обработки заявок: например, в центрах «Мои документы» (МФЦ).
  • Запросы МВД в банки: NLP анализирует запросы от госорганов и формирует автоматические ответы на основе банковских данных. Например, извлечение информации о клиентских счетах или проведенных операциях;
  • Суммаризация сложных текстов: анализ многотомных контрактов между госструктурами и подрядчиками. Выделение ключевых условий — ответственность сторон или финансовые обязательства.
HR и управление персоналом
  • Трудоустройство: автоматизация заполнения анкет и проверка данных новых сотрудников;
  • Кадровый документооборот: распознавание документов, необходимых для оформления в штат.
  • Обработка резюме: на основании заданных критериев (опыт, навыки, уровень образования) NLP анализирует резюме и автоматически сортирует кандидатов. Например, в базе 100 резюме, и нужно выбрать тех, у кого опыт работы в продажах больше 3 лет;
  • Анализ трудовых договоров: автоматическое извлечение данных о сроках контракта, графике работы, условиях расторжения.
Розничная торговля
  • Управление закупками: автоматическое считывание данных из Торг-12 для учёта товаров и оплаты счетов;
  • Проверка контрагентов: ускорение обработки документов поставщиков.
  • Управление договорами франшизы: автоматическое создание выдержек из договоров: сумма франчайзингового взноса, срок действия договора, процент от продаж.
  • Обработка заявок на поставки: NLP анализирует заявки от клиентов или поставщиков, оформленные в произвольной форме.
Медицина
  • Медицинские учреждения: автоматизация ввода паспортных данных и СНИЛС пациентов при оформлении карт или предоставлении услуг;
  • Страховые медицинские компании: ускорение обработки документов для получения выплат.
  • Договоры с пациентами: саммаризация контрактов на оказание медицинских услуг: срок действия, возможные риски, стоимость лечения.
  • Обработка данных страховых случаев: NLP анализирует описания страховых случаев, предоставленные клиентами, и классифицирует их по категориям.

Как работает Primo RPA AI Server

Разработчики платформы подготовили для пользователей Primo RPA AI Server встроенные проекты. Это готовые сценарии использования платформы вместе с ИИ для распознавания и классификации типовых документов: паспорт, СНИЛС и т.д..
Для старта работы пользователям достаточно создать необходимый шаблон сценария для своей компании.

Также в сервере можно создать новый проект с нуля с другими документами. Для этого пользователям надо, следуя инструкции в документации, создать шаблон проекта, провести обучение ИИ-модели на уникальных документах и запустить процесс инференса — процесса, когда искусственный интеллект применяет свои знания, чтобы ответить на вопрос или выполнить задачу.

Все проекты выполняются автоматически по заранее заданным сценариям через Primo RPA Studio: робот сам знает, что ему нужно сделать с входящей информацией, как её обработать и куда направить дальше. Человек в этом процессе не участвует. Но для нестандартных сценариев пользователь может дать задачу AI Server в диалоговом окне.

Подписывайтесь
на нашу рассылку

Проверьте
Primo RPA в деле

Преимущества Primo RPA AI Server:

  • Роботы обрабатывают печатные многостраничные документы на русском и английском языке. При необходимости можно настроить работу с другими иностранными языками
  • Сервер работает в любом браузере
  • Всю настройку может провести сотрудник без технической подготовки с помощью понятного интерфейса
  • Система отвечает на вопросы пользователя только по документам, к которым он имеет доступ, что повышает кибербезопасность компании
  • Нет ограничений по количеству обрабатываемых страниц и развернутых моделей

Вам может быть интересно

  • /
  • /