Ошибки распознавания лиц на смешанном качестве фото в базе
Современная бизнес-практика большинства компаний включает в себя применение систем распознавания лиц, потому пользователи постепенно сталкиваются с определенными проблемами. В данной статье подробнее разберем проблему отсутствия возможности управлять вероятностями ошибок распознавания на смешанном качестве фото в базе.
В чем проблема?
Мы не можем понять, какие по качеству фотографии присутствуют в нашей базе сравнения, потому не можем адекватно выставить пороги принятия решений «да/нет». Эти пороги выставляются либо примерно, либо на основе определенных общих рекомендаций. Результатом данной проблемы становится неоптимальная работа систем распознавания, а также кратное увеличение ошибок первого и второго рода. Как следствие, появляются дополнительные затраты на обработку ошибочных сравнений.
Оценка потерь
Стоимость одного инцидента с ошибочным сравнением будет напрямую зависеть от бизнес-кейса. Если рассматривать СКУД, это будет потраченное службой безопасности время на повторную идентификацию в случае не пропуска правильной персоны или время, затраченное на локализацию последствий от проникновения «чужого».
В более сложных кейсах, например, при идентификации банковской транзакции, можно столкнуться с возможной потерей клиента, если он не будет распознан. Либо с допуском «чужого» к банковским счетам пользователя.
Пример
Поговорим подробнее про бизнес-кейс с контролем входа в банковское приложение через биометрию. Согласно данным статистики, среднее число входов одного пользователя в приложение – от 19 до 25 раз в месяц. Допустим, мы имеем банк с базой в 1 миллион клиентов – это как минимум 19 миллионов идентификаций в месяц.
Лучшие алгоритмы NIST по самому качественному датасету Visa Photos показывают FNMR = 0.0006 при FMR = 0,00001. На практике без контролируемого по качеству датасета в лучшем случае получится достичь показателя FNMR = 0.003 при FMR = 0,00001.
Таким образом, мы получаем более 45 000 «лишних» инцидентов в месяц. Если каждый такой инцидент будет стоить нам 1$, в год мы получим от 450 000$ «лишних» затрат. Данная сумма может сравниться с годовой стоимостью владения биометрической системой.
Как решить проблему?
Алгоритм контроля качества фотографий позволяет выстроить процедуру регулярной проверки датасета – некачественные фото будут убраны или заменены.
Какая выгода?
Алгоритм контроля качества фотографий поможет экономить «лишние» траты, соизмеримые со стоимостью владения биометрическим сервисом. На 1 транзакцию экономия на НЕ обработки ошибок составит 0,002$.