За 2024–2025 годы мы сделали четыре проекта в околостраховой нише с computer vision. Vision Language Models созрели достаточно, чтобы заменить классические CV-пайплайны во многих сценариях, но «универсального CV-решения» по-прежнему нет. Делимся опытом - где работает, где обманывает.
Кейс 1. Оценка повреждений автомобиля
Задача: пользователь снимает повреждение, система предлагает оценку ремонта. Сделали гибрид - VLM для классификации типа повреждения и затронутых деталей, отдельная модель для оценки степени. На датасете в 80k фото точность определения «затронут ли элемент» - 94%, оценка стоимости в пределах ±15% от мастер-приёмщика - 71%.
Поняли важное: модель с одинаковой точностью «находит» и реальные, и старые повреждения. Решали через инструкции пользователю по съёмке + автоматический детект «новизны» по характеру кромок. Точность отличия нового от старого пока 78% - недостаточно для авто-выплат, достаточно для предварительной оценки.
Кейс 2. Верификация документов
Старая, понятная задача: паспорт, водительское, страховка. Современный VLM решает её намного лучше классических OCR + правил. На шести документах из РФ и СНГ точность извлечения полей - 99.1%, время - 1.2 секунды. Заменили старый стек, сократили время онбординга клиента вдвое.
Где провалились: подделки. VLM хорошо извлекает данные, но плохо ловит фальшивки на уровне «фотошоп среднего качества». Для антифрода нужна отдельная модель и человек в петле.
Кейс 3. Ущерб имуществу
Подтопление, пожар, кража со взломом. Здесь VLM работает как умный помощник эксперта: размечает фото, классифицирует тип ущерба, считает повреждённые предметы. Полностью автоматическая оценка не получилась - слишком разнообразный контекст. Но время эксперта на один кейс упало с 45 минут до 12.
Кейс 4. Мошенничество в КАСКО
Здесь мы провалились. Пытались делать модель, которая отлавливает повторное использование одних и тех же фото повреждений в разных страховых случаях. На уровне perceptual hash + EXIF-анализа работало, на уровне VLM - нет. Модель регулярно «не видела» очевидных копий с обработкой. В итоге решение пересобрали без VLM, на классических CV-методах.
Что мы поняли в сумме
- VLM хороши там, где нужно понимание сцены: «что на фото и в каком состоянии».
- Классические CV-методы не умерли: для антифрода, дубликатов, точных измерений - лучше.
- Промпт-инжиниринг отдельной задачи - не «художественный» процесс, а инженерная работа: тестируем на 500+ эталонных кейсов.
- Человек в петле остаётся: AI снижает нагрузку, но не убирает её до нуля. Любое утверждение «полная автоматизация» в страховании в 2026 году - преувеличение.