Повысилось качество детекции
Начнём с того, что влияет на результат работы мониторинга напрямую. В версии 4.0 мы обновили модели сразу в двух ключевых модулях.
В модуле очистки персональных данных DataClean заменили анализирующую модель: качество детекции сущностей выросло на 20%, а сам сервис стал работать в 5 раз быстрее. Это заметно и при обработке отдельных сообщений, и при высоких нагрузках. Дополнительно исправили логику приоритетов сущностей при пересечении фрагментов текста.
Также появилась новая модель Guardrail HiveTrace Pro — она лучше справляется с пограничными случаями и снижает количество ложных срабатываний.
Очереди и чёрные списки для ускорения обработки сообщений
Параллельно с улучшением качества мы серьёзно поработали над производительностью и стабильностью системы.
В политиках цензурирования добавили поддержку чёрных списков в рамках кастомных политик. Это отдельная линия обработки сообщений: если слово или фраза попадает в чёрный список, проверка проходит за несколько миллисекунд, без обращения к большой языковой модели.
Между модулями политик и анализирующей LLM добавили очереди.
Аналитика стала быстрее
Мы расширили детализацию в аналитике сессий и ускорили подсчёт аналитики за счёт добавления колоночной базы данных. Теперь можно тщательнее следить за всем, что происходит в системе.
Раньше сохранялся только очищенный текст, теперь сохраняем и исходный вариант, также показываем в детализации, что именно и на что было заменено.
Наблюдаемость в продакшене
Для команд, которые эксплуатируют HiveTrace в продакшене, добавили метрики Prometheus. Теперь состояние системы, задержки и узкие места можно отслеживать в привычном инструменте мониторинга. Не нужно строить отдельный дашборд — метрики встраиваются в существующий стек мониторинга.
Запустить пилот в вашей инфраструктуре
Также можно написать нам на sales@hivetrace.ru или в Telegram.