Уже с августа этого года пользователям платформы Primo RPA в AI Server доступна функция распознавания сканов структурированных документов — паспорт, СНИЛС и Торг-12. В этом помогает компонент Умный OCR, который классифицирует документы и распознает данные в них, предоставляя результат в структурированном виде. Сервер поддерживает изображения в формате JPG, PNG, PDF.
С ноября Умный OCR работает в связке с новым компонентом — NLP (Natural Language Processing), который базируется на использовании больших языковых моделей (LLM, Large Language Models).
Этот компонент обрабатывает естественный язык, помогая компьютерам распознавать, анализировать и обрабатывать текст. Благодаря такому обновлению
AI Server может обрабатывать любые неструктурированные документы — договоры, заявки, резюме, счета и т.д.. Это могут быть также сканы документов или файлы в формате Word, PDF и других, предварительно прошедших обработку в компоненте Умный OCR.
AI Server в такой связке не просто распознает, какой документ поступил ему в виде изображения и куда его отправить дальше. Теперь пользователь получает за несколько минут анализ многостраничного файла или сотен отдельных файлов.
Рассмотрим детальнее работу сервера в разных отраслях на начальном этапе и с внедрением NLP.