В декабре компания выпустила новую версию Primo RPA AI Server. Теперь пользователи могут доверить программным роботам сложные аналитические задачи: суммаризация договоров, обработка и классификация неструктурированных документов, распознавание сканов и другие. Ключевые нововведения включают расширенные инструменты анализа данных, способные обрабатывать документы любого формата. Подробнее о новых возможностях в этой статье.
Компонент AI Текст
Это инструмент для работы с предобученными большими языковыми моделями (LLM), которые поставляются в составе нашего решения. С помощью NLP (Natural Language Processing) он обрабатывает естественный язык, помогая компьютерам распознавать, анализировать и обрабатывать текст. Решение обеспечивает защиту чувствительных данных, работая в закрытом контуре.
Возможности LLM-моделей:
- Извлечение информации: автоматический поиск ключевых данных — номеров договоров или дат в больших объемах текстов и т.д..
- Классификация текста: сортировка входящих писем, например, по темам или приоритету.
- Суммирование: создание кратких резюме из длинных отчетов или документов, подготовка информации о штрафных санкциях по договору, выделение ключевых условий и т.д..
- Создание текста: автоматическая генерация типовых документов, например, вакансий или коммерческих предложений.
Компонент легко встраивается в роботизированные процессы, что ускоряет и упрощает обработку текстов.
Новые инструменты в компоненте Умный OCR
- Any Text — новая модель, оптимизированная для распознавания текста из сканов документов произвольной формы. Модель подходит для распознавания договоров, актов и любых других неструктурированных документов на белом фоне. Результат распознавания в дальнейшем можно использовать в компоненте AI Текст.
- Автоматическая разметка данных — инструмент для ускорения разметки сканов документов. С его помощью пользователи могут создать несколько примеров размеченных изображений, а затем обучить модель автоматически размечать остальные сканы документов.
- Страница тестирования — новая функция для проверки качества распознавания и классификации текстов. Позволяет загружать тестовые сканы документов и анализировать результаты до начала работы модели на реальных данных. Это помогает выявить и устранить возможные проблемы на этапе настройки.