3DiVi Новости

Ошибки распознавания лиц на смешанном качестве фото в базе

Современная бизнес-практика большинства компаний включает в себя применение систем распознавания лиц, потому пользователи постепенно сталкиваются с определенными проблемами. В данной статье подробнее разберем проблему отсутствия возможности управлять вероятностями ошибок распознавания на смешанном качестве фото в базе.

В чем проблема?

Мы не можем понять, какие по качеству фотографии присутствуют в нашей базе сравнения, потому не можем адекватно выставить пороги принятия решений «да/нет». Эти пороги выставляются либо примерно, либо на основе определенных общих рекомендаций. Результатом данной проблемы становится неоптимальная работа систем распознавания, а также кратное увеличение ошибок первого и второго рода. Как следствие, появляются дополнительные затраты на обработку ошибочных сравнений.

Оценка потерь

Стоимость одного инцидента с ошибочным сравнением будет напрямую зависеть от бизнес-кейса. Если рассматривать СКУД, это будет потраченное службой безопасности время на повторную идентификацию в случае не пропуска правильной персоны или время, затраченное на локализацию последствий от проникновения «чужого».

В более сложных кейсах, например, при идентификации банковской транзакции, можно столкнуться с возможной потерей клиента, если он не будет распознан. Либо с допуском «чужого» к банковским счетам пользователя.

Пример

Поговорим подробнее про бизнес-кейс с контролем входа в банковское приложение через биометрию. Согласно данным статистики, среднее число входов одного пользователя в приложение – от 19 до 25 раз в месяц. Допустим, мы имеем банк с базой в 1 миллион клиентов – это как минимум 19 миллионов идентификаций в месяц.

Лучшие алгоритмы NIST по самому качественному датасету Visa Photos показывают FNMR = 0.0006 при FMR = 0,00001. На практике без контролируемого по качеству датасета в лучшем случае получится достичь показателя FNMR = 0.003 при FMR = 0,00001.

Таким образом, мы получаем более 45 000 «лишних» инцидентов в месяц. Если каждый такой инцидент будет стоить нам 1$, в год мы получим от 450 000$ «лишних» затрат. Данная сумма может сравниться с годовой стоимостью владения биометрической системой.

Как решить проблему?

Алгоритм контроля качества фотографий позволяет выстроить процедуру регулярной проверки датасета – некачественные фото будут убраны или заменены.

Какая выгода?