Читать "Журнал «Компьютерра» N 36 от 3 октября 2006 года" - Журнал Компьютерра - Страница 20

Вход

Войти на сайт

Я забыл пароль
Регистрация

Регистрация

Литмир - Электронная Библиотека > Журнал Компьютерра > Журнал «Компьютерра» N 36 от 3 октября 2006 года > Стр.20

Содержание

Сохранить

Настройки

...

В новых условиях решили изменить направление разработок. Биометрия была еще не в фаворе, поэтому попытались сделать приложение для пластической хирургии - субмиллиметровая точность «слепков» должна была привлечь хирургов, правящих носы и прочие части тела богатым клиентам. Хотя идея казалась вполне разумной, но и для нее покупателей не нашлось. Но им удалось заинтересовать гигантскую Logitech идеей автоматической фокусировки ее веб-камер на лице человека. В результате, A4Vision сделала программный продукт, который успешно начал продаваться, и Logitech стал первым стратегическим инвестором. А затем наступило 11 сентября 2001 года…

Скажем сразу, что сам по себе метод «сканирования с помощью проецирования шаблона» изобретен давно. Он хорошо известен среди специалистов и даже имеет историю успешного применения. В самом начале 90-х автору этих строк попалась фотография поросенка, освещенного сверху десятком ярких световых полос - это была разработка британских ученых, создавших систему быстрого и бесконтактного измерения свиней. Вроде бы в этом нуждались английские фермеры, но свиньи (чуя истинную цель затеи) отказывались сотрудничать, поэтому пришлось изобретать способ измерения объекта без его ведома. В конце концов установка вылилась в узкий коридор с темным полом, по которому «объекты» прогонялись и освещались сверху через подобие жалюзи. Камера делала снимок «полосатой» свиньи, по которому даже тогдашние компьютеры могли рассчитать ее охват «в плечах», «в талии», «в бедрах» и т. д.

Кстати

Ошибки распознавания «обознался» и «не признал» тесно связаны - закручивая чувствительность системы, одновременно повышаешь и вероятность ложных тревог. На сайте A4Vision указывается: Extremely low False Rejection Rates (FRR), even when the False Acceptance Rate (FAR) is set close to zero (.0001). В популярных статьях называются цифры «одна ошибка на сотню» для «не признала своего», «одна шибка на миллион» для «приняла чужого за своего» или более скромные «одна на сто тысяч».

Что в начале 90-х могли британские университеты, в конце 90-х смогли российские выпускники, причем лучше и дешевле - первый прототип своей системы, который демонстрировался инвесторам, был сделан из цифрового фотоаппарата Olympus, даже не «доработанного напильником». Как уже догадались проницательные читатели, процесс «сканирования» выглядел просто - объект освещался специальным источником света. Затем делался его снимок, который отправлялся в компьютер, где самое важное и трудное совершалось на программном уровне - из плоского изображения строилась трехмерная поверхность объекта. Судя по всему, строилась достаточно впечатляюще, чтобы идея получила финансирование.

Но давайте рассмотрим, как процесс опознания по лицу проходит в готовой системе A4Vision, испытанной и уже предлагаемой покупателям. Итак, настенный прибор под названием Vision Access 3D Face Reader работает в инфракрасном спектре. Он удобнее видимого, поскольку устойчивее к посторонней засветке, не привлекает внимания и просто не слепит глаза. Главный узел прибора состоит из двух блоков - излучателя и фотоприемника, способного делать качественные снимки со скоростью десятки кадров в секунду. Иногда его называют 3D-камерой, что может ввести в заблуждение. Камера там обычная - 2D, но ее снимки преобразуются в трехмерные поверхности. Естественно, для этого излучатель «структурированной подсветки» должен быть немного в стороне от камеры - ведь если подсвечивать лицо прямо через объектив, то на снимке не будет заметно искажений световой решетки. На некоторых моделях сканера отчетливо видны два «окна», и параллакс между ними составляет около 30 см.

Снимки, сделанные камерой, сначала обрабатываются алгоритмами первичной обработки. Компания рассказывает о них скупо, но известно, что, например, автоматически отбрасываются кадры, на которых нет человеческих лиц, а на тех, что есть, сами лица эффективно выделяются из окружающего их «шума». Слово «эффективно» значит, что эта фильтрация идет почти со скоростью съемки - десятки снимков в секунду. Это впечатляющее и важное достижение - выделение из видеопотока лица, подсвеченного световым шаблоном, прямо влияет на весь процесс опознания. Традиционные системы, работающие с плоскими снимками, проводят такое выделение с большим трудом, поскольку вынуждены работать, по сути, с комбинацией темных и светлых пятен - именно так машина «видит» обычную фотографию.

Новые горизонты

Рынок лицевой идентификации в США (тогда еще 2D) был занят несколькими известными компаниями, которые после терактов провели активную PR-компанию своих продуктов. Их акции пошли вверх, и даже были заключены крупные контракты, но затем Пентагон провел независимые испытания, которые все системы провалили. Например, известная Visionix дала 52,5% ошибок типа «не признал» на базе всего из пятнадцати человек-добровольцев (503 неудачных попытки на 958 распознаваний), а на полевых испытаниях в аэропорту Палм-Бич ошибки типа «обозналась» составили 31,3% от общего числа тревог (1081 ложная тревога из 3455).

В результате, когда A4Vision смогла сделать альфа-версию своего «опознавателя», сама идея face recognition была глубоко дискредитирована, и неизвестному стартапу пришлось доказывать, мол, «ваши старые большие компании ничего не умеют, а наша молодая и маленькая умеет гораздо больше их».

На сегодняшний день главный продукт A4Vision - набор алгоритмов и технических устройств, которые крупные интеграторы систем безопасности могут встраивать в свои приложения. Крупному банку такая система может обойтись даже дешевле стандартных смарт-карт при несравнимо большей надежности.

Меж тем своей главной целью компания видит национальные паспортные системы - самые глобальные и денежные из всех проектов идентификации. Участвовать в них самостоятельно бесполезно (слишком сильны местные лоббисты и соображения национальной безопасности), поэтому основной стратегией является наведение контактов с крупнейшими локальными интеграторами. Дела идут успешно, и вот уже алгоритмами A4Vision американцев будет опознавать Motorola, у нас - НПО «Информация», а кроме них в списке партнеров значатся Unisys, Bell, GE, Oracle, Siemens, Sagem, Samsung и прочая и прочая. А ИФ «Мехатрон» уже установил пробный аппарат на одном из контрольно-пропускных пунктов «Салаватнефтеоргсинтеза», планируя до конца года оснастить ими все проходные предприятия (www.metron.ru/ content/view/39/).

Далее на основе снимков создается предварительная 3D-модель лица, от которой отрезается все постороннее - прическа, усы, борода, шея… В получившейся модели заполняются возможные «дыры» и проводится сглаживание. Кстати, система легко «видит» очки на лице (как выступ перед глазами) и в зависимости от настроек может попросить их снять или, вырезав из модели этот участок, попытаться обработать то, что осталось.

В конечном счете модуль первичной обработки выдает оптимизированную трехмерную поверхность, оптимально подходящую для последующего распознавания.

После первичной обработки наступает черед «извлечения антропометрических особенностей лица». Разумеется, извлекаются не все особенности, а только индивидуальные и не меняющиеся из-за болезней, диет, пластических операций и т. д.

Кстати

Любопытно, что среди законодателей глобальных технологических изменений на Западе немало предпринимателей российского происхождения - Макс Левчин (основатель PayPal) и Сергей Брин (основатель Google), Алек Милославский (основатель Genesys) и Александр Степанов из Adobe…

По словам представителей компании, независимые испытания показали, что точность лицевой 3D-идентификации по ряду параметров превосходит точность идентификации по отпечатку пальца, который подделать несравнимо легче, чем лицо. Конечно, если сравнивать с идентификацией всех пяти пальцев, пока не превзойденной никакими другими системами (кроме ДНК), включая сканер радужки глаза, то возможности системы все же имеют ограничения по размеру базы. Поэтому, по данным НПО «Информация» (www.npo-inform.com), лучше применять комбинированный метод с использованием трехмерной технологии от компании A4Vision и двухмерной системы распознавания, обеспечивающей достаточную точность в режиме идентификации при базах данных размером до 10 000 лиц, а в перспективе - до 100 000 человек…".

Перейти к описанию Предыдущая страница Следующая страница

Войти на сайт

Регистрация