Системы распознавания лиц — явление отнюдь не новое. Исследования в этой сфере идут уже какое-то время, однако массовое применение подобных программ началось только недавно. Самым главным требованием к подобным системам до сих пор является качество получаемого изображения, ведь если на сделанном снимке не видно лица, то какой в нем смысл? Насколько далеко продвинулись подобные системы?

«Вы часто можете видеть в фильмах, как они увеличивают масштаб изображения, и все оно рассыпается на пиксели, а они говорят «улучшить», и получают хорошую картинку. Это не реально. Но с использованием глубокого обучения пытаются это сделать, и это получается неплохо. Некоторые системы распознавания лиц могут взять такое изображение и показать лицо с высоким разрешением», – говорит Том Хезелтин (Tom Heseltine), генеральный директор фирмы Aurora, разрабатывающей ПО для распознавания лиц.

Это звучит как выжимка из полицейского отчета, но благодаря усовершенствованиям технологии распознавания лиц настоящие сотрудники правоохранительных органов начали экспериментировать с ними. В Великобритании как столичная полиция Лондона, так и полиция Южного Уэльса использовали системы распознавания лиц, чтобы искать потенциальных нарушителей среди толпы в реальном времени на крупных мероприятиях. Например, в финале футбольной Лиги чемпионов 2017 года в валлийской столице Кардиффе, полиция совершила арест после того, как система нашла совпадение с базой данных разыскиваемых преступников.

системы распознавания лиц

Критики однако утверждают, что системы распознавания лиц неточны, а статистика полиции Южного Уэльса показала, что 92% из почти 2500 совпадений во время финала были «ложными срабатываниями». Однако многие говорят, что число бессмысленно само по себе и должно рассматриваться только в контексте того, как работает система. Итак, как работает технология? И почему, если она настолько продвинутая, количество ложных срабатываний является столь высоким?

Глубокое обучение

Самые продвинутые системы распознавания лиц работают с применением глубокого обучения – типа машинного обучения, который использует виртуальные нейронные сети для реконструкции симуляции человеческого мозга. Можно научить систему распознавать лица, показывая ей сотни тысяч пар лиц и сообщая, совпадают они или нет.

«Вы обучаете программу, говоря ей: эти двое – одни и те же люди, а эти двое – разные. Вы делаете это на больших мощных серверах, обычно оснащенных графическими процессорами для ускорения процесса обучения. Со временем она медленно учится, и как только процесс будет завершен, у вас появится способная распознавать лица нейронная сеть», – говорит Хезелтин.

Этот процесс обучения может занять несколько дней, или это может быть всего несколько часов для менее мощной системы. Все зависит от того, что требуется от программы. Если нужно, чтобы она распознала фотографии паспорта, ей просто показывают виды изображений, которые представляют собой высококачественные цветные фотографии стоящих напротив камеры людей.

системы распознавания лиц

Но если это все, что когда-либо видела нейронная сеть, это станет единственным, что она сможет сделать хорошо. Поэтому нельзя было бы использовать эту систему для распознавания лиц в записях с высокой зернистостью, например. Но зато можно обучать программу распознавать изображения более низкого качества, снятые с разных ракурсов.

Система распознавания лиц не может сказать вам, изображен ли на двух фотографиях один и тот же человек. Она просто присваивает оценку, основанную на сходстве их характеристик. Например, для снимающей видео в режиме реального времени камеры, система может смотреть на лицо в кадре и сравнивать его со всеми лицами в известной базе данных полиции. Затем она присваивает оценку сходства для каждого лица, генерируя длинный список чисел. Она по-прежнему полагается на человека, чтобы подтвердить, совпадают ли два лица.

системы распознавания лиц

Порог оценки схожести, выше которого нужно проверять потенциальное совпадение, значительно варьируется в зависимости от важности поиска соответствия, предпосылок для ложных срабатываний и доступности ресурсов. Например, если полиция хотела бы поймать мелкого преступника, они могли бы ориентироваться только на самые высокие оценки сходства. Но если они пытаются поймать серийного убийцу, то в таком случае можно снизить порог и следить за тем, кого система идентифицирует как потенциальное совпадение с учетом повышенной важности поимки этого человека.

Порог подобия

Лучшие системы распознавания лиц сегодня очень точны и почти всегда будут давать высокие оценки подобия соответствующим лицам, если качество изображения будет достаточно хорошим. Тогда почему полицейские программы имеют высокий процент ложных срабатываний? В игру вступает несколько факторов. Во-первых, процент ложных срабатываний, рассмотренных по отдельности, почти бессмыслен вследствие того, что он просто отражает «порог подобия», который полиция выбрала для записи потенциального совпадения. Они могли бы установить очень высокий порог и не иметь ложных срабатываний, но и ловить преступников при этом становится гораздо сложнее.

системы распознавания лиц

Если программа отрабатывает 200 ложных идентификаторов, это значит только что полиция установила порог таким образом, что он допускает 200 ложных идентификаторов. Они могут установить порог на нуле и получить фантастический отчет, лишь повысив этот порог на ступеньку. Но, с точки зрения полиции, при попытке найти серийного убийцу лучше просмотреть 200 срабатываний и выяснить, есть ли цель среди них.

Аналогичная ситуация и в аэропортах, где технология Aurora в основном используется. Изображения лиц пассажиров захватываются когда те входят в безопасную зону, и на это изображение ссылаются, когда тот же самый человек пытается сесть на самолет. Низкая оценка сходства может указывать на то, что кто-то еще занял место для пассажиров, и некоторые ложные срабатывания необходимы для обеспечения правильности выполнения алгоритмов. Аэропорты устанавливают порог исходя из количества пассажиров, за которыми они могут следить.

«Мы можем позволить себе остановить, расспросить и обыскать одного из сотни пассажиров, так что именно с такой границей обычно приходится иметь дело», – объясняет Хеселтин.

Проблема ложных срабатываний

Также ложные срабатывания часто возникают из-за большой базы данных, с которой приходится сличать большие объемы изображений, либо из-за большого количества камер или записей с высокой частотой кадров, или если система распознавания лиц активна в течение длительного периода времени. Но недостатки в технологии также отчасти сказываются.

системы распознавания лиц

Программное обеспечение работает очень хорошо на четко освещенных высококачественных изображениях, но оно может давать сбои, когда качество изображения оставляет желать лучшего. Системы Aurora в аэропортах используют специально разработанные для этой цели камеры, но другим системам видеонаблюдения может быть и пять, и десять лет.

Кроме этого системе может быть сложно идентифицировать людей, если их голова находится под углом, или если часть их лица закрыта тенью. И, в конечном счете, очень легко избежать распознавания камерами, если закрыть лицо бейсбольной кепкой, темными очками и рубашкой или курткой с высоким воротом.

В общественном месте сложно что-то с этим поделать, но разработчики программного обеспечения активно работают над улучшением идентификации фотографий низкого качества или с частично видимыми лицами. В дополнение к методу масштабирования и повышения качества другие инновации включают системы распознавания лиц, которые могут предсказать, как выглядит левая сторона лица при наличии в кадре правой, а также те, которые могут восстановить закрытые тенью области лица.

системы распознавания лиц

Кроме всего этого, стоит также учесть проблемы с конфиденциальностью, связанные с использованием полицией и другими организациями фотографий и других данных. Например, на этой неделе работники Amazon потребовали, чтобы компания прекратила продажу своего программного обеспечения для распознавания лиц под названием Rekognition правоохранительным органам. Но улучшение точности технологии и сокращение ложных срабатываний могут помочь убедить критиков. Оценка ежегодного исследования использования этой технологии полицией Южного Уэльса все еще продолжается, и результаты могут существенно повлиять на то, как системы распознавания лиц будут использоваться в Великобритании.