Стандарты идентификации, распознавании и детектировании людей | НПО "Инфотех" - Официальный дистрибьютор Hikvision в Украине.

Стандарты идентификации, распознавании и детектировании людей

05/09/2017

q1q2

В мире ежегодно устанавливаются миллионы камер наблюдения, но все чаще при изучении видеозаписей после тех или иных инцидентов их качество оказывается недостаточным для распознавания и идентификации людей или номерных знаков автомобилей, а это означает, что огромные средства и ресурсы были потрачены впустую.

Что общего у плохо спроектированной системы видеонаблюдения и у слабого антивирусного пакета? Ложное чувство защищенности, которые они дают пользователю. Ложное чувство безопасности сменяется разочарованием после первого инцидента. Чтобы не допускать слабых мест, проектировщику следует знать распространенные ошибки проектов видеонаблюдения.

Если в проекте системы видеонаблюдения требуется идентификация или распознавание людей, или нужно идентифицировать объекты - например, номерные знаки, то нужно не только получить изображение поля обзора с достаточным разрешением, но и принять во внимание такие факторы, как подсветка, расположение камеры и движение.

Порядок установки систем видеонаблюдения

Как минимум нужно соблюсти порядок установки для того чтобы в дальнейшем не возникало непредусмотренных ситуаций:

  • Анализ рисков и оценка степени каждого возможного риска;
  • Осмотр объекта или чертежа объекта;
  • Составление эксплуатационных требований;
  • Разработка проекта системы, включающая план местности или план помещения;
  • Разработка плана тестирования системы видеонаблюдения;
  • Установка системы и ее передача заказчику;
  • Документирование результатов.

Особенности выбора зоны обзора

Многие рекомендации выглядят продуманно, приведем наиболее важные моменты, которые требуется учитывать при планировании зоны обзора камеры. Факторы, которые нужно учесть при выборе места установки камеры:

  • Возможное появление другого количества листвы на деревьях в другое время года.
  • Возможное появление сторонних источников света.
  • В зависимости от времени суток и сезона солнечный свет может создавать блики или не обеспечивать достаточных условий освещенности.
  • Окна, здания, вода могут вызвать засветку и ухудшить качество изображения.
  • Активность сцены – требуется учитывать возможное появление временных или новых объектов в зоне обзора камеры.
  • Если камера устанавливается для идентификации людей, ее следует разместить примерно на высоте головы человека среднего роста.

Расчёт угла обзора видеокамеры

Расчёт угла обзора объектива производиться по формуле:

α = 2arctg(d/2F)

α - угол обзора объектива, (градусов) (без учёта сферической аберрации)

d - размер светочувствительного элемента (матрицы), (мм)

F – эффективное фокусное расстояние объектива, (мм) 

q3

Рис. 1. Угла обзора видеокамеры

При выборе фокусного расстояния объектива следует учитывать, что угол ясного зрения человека по горизонтали составляет примерно 36°, что соответствует фокусному расстоянию ~ 6,9 мм (для видеокамеры с размером матрицы 1/3"). Поэтому видеокамеры с фокусным расстоянием объектива менее 6,9 мм будут визуально отдалять изображение, более 6,9 мм – соответственно приближать.

Фокусное расстояние - это расстояние между линзой и матрицей видеокамеры. Стоит запомнить следующее правило: чем меньше фокусное расстояние, тем больше угол обзора видеокамеры и наоборот, чем больше фокусное расстояние, тем меньше угол обзора видеокамеры. Фокусное расстояние записывается как f= ... мм.

q4

Рис. 2. Зависимость расстояния до объекта от фокусного расстояния и угла обзора.

Из рисунка видно, что если требуется минимальным количеством обзорных камер видеонаблюдения следить за периметром, стоит установить видеокамеру с малым фокусным расстоянием и наоборот если требуется идентификация деталей: денежных купюр, автомобильных номеров, лиц, стоит подбирать фокусное расстояние объектива видеокамеры с большим значением.

 

Расчёт дистанций производится на основе требований европейских норм для CCTV:

·         линейное разрешение для обнаружения объекта - 20 пикселей/м;

·         линейное разрешение для распознавания - 100 пикселей/м;

·         линейное разрешение для идентификации - 250 пикселей/м;

при разрешении матрицы видеокамеры 1080 (2Мп Full HD), 700, 560, 480, и 380 Твл.

Таблица 0. Приблизительные дистанции для камер 

q5

Таблица 1. Размеры матриц, используемых в видеокамерах

q6

Следует учесть, что из-за наличия сильных искажений в короткофокусных объективах угол обзора может отличаться от расчётного.

Необходимое разрешение

Традиционно в аналоговых системах видеонаблюдения требования к разрешению формулировали исходя из того, какую долю кадра по вертикали должен занимать наблюдаемый объект. Для разных целей требуется разная величина объекта в кадре.

Например, для обнаружения человека в кадре может быть достаточно, чтобы его рост составлял 10% вертикального размера. В то же время для распознавания (идентификации) человека может потребоваться, чтобы его рост составлял 50% вертикали кадра, а для тщательной идентификации - до 120% и более. 

q7

Рис. 3. Один и тот же тестовый манекен, снятый так, что его рост занимает 10%, 50% и 120% от высоты изображения.

С появлением IP-камер, и особенно в связи с разработкой мегапиксельных и HDTV-камер возникла необходимости найти новые способы установления соответствия эксплуатационным требованиям. Изложенные ниже позволяет соотнести эксплуатационные требования с характеристиками современных видео- и IP-камер.

Вырабатывая рекомендации по выбору камер и обсуждая, какая камера из представленных на рынке лучше, можно легко опуститься на уровень технических описаний и спецификаций. В результате многие интеграторы упускают из вида одно из ключевых требований любой системы видеонаблюдения - эксплуатационные требования, или фактическую цель видеонаблюдения.

В прошлом, когда видеонаблюдение было полностью аналоговым, подбор камеры под конкретные эксплуатационные требования сводился в сущности к выбору подходящего объектива, так как выбор разрешений камер был очень невелик. Большинство аналоговых систем видеонаблюдения предназначено для слежения за поведением людей, поэтому в качестве эталонного объекта в них используется тело человека. Для разных сценариев видеонаблюдения были сформулированы различные категории, различающиеся тем, какую часть кадра занимает человек в полный рост. Хотя это и не стало глобальным стандартом, принято различать потребности в обнаружении, распознавании и идентификации.

Таблица 2. Требования научно-исследовательского отдела МВД Великобритании, 2009

q7

 Значения, приведенные в таблице 2, хорошо работают для стандартных аналоговых разрешений, однако для разрешений, свойственных IP-камерам, они не подходят. Хотя разрешение в телевизионных строках можно пересчитать в пиксели (см. табл. 3), для реальных ситуаций это слишком сложно. Разумеется, должен быть лучший способ.

Таблица 3. Вертикальное представление процента высоты тела для идентификации

q8

 

q9

Рис. 4. Один и тот же человек, снятый так, что его рост занимает 20%, 40% и 140% от высоты изображения.

Современные сетевые IP видеокамеры охватывают широкий диапазон разрешений. Процентные соотношения больше не используются; и теперь требования к разрешающей способности указываются в пикселях и дополнено альтернативным параметром: количеством миллиметров цели, приходящихся на один пиксель изображения, полученного с камеры видеонаблюдения. В литературе по системам видеонаблюдения более распространена обратная характеристика – "плотность пикселей", или количество пикселей изображения на 1 м на расстоянии наблюдения цели.

Таблица 4. Требования европейского стандарта EN 50 132-7 для обнаружения, распознавания и идентификации 

q10

Для других объектов применяются другие критерии. Например, для читаемости номерных знаков высота букв должна составлять примерно 15 пикселей (что соответствует примерно 200 пикселям/м).

Практически это означает, что проектировщик и заказчик должны определиться с целью установки каждой камеры (распознавание людей, идентификация, детектирование, наблюдение). И при подборе зоны обзора камеры следует рассчитать, при каких параметрах камеры и объектива в зоне обзора камеры будет достаточная плотность пикселей для выбранной для камеры задачи.

Проектировщику надо найти золотую середину между большей плотностью пикселей, позволяющей увидеть больше деталей при меньшем угле обзора, и большей шириной зоны обзора камеры при большем угле обзора, позволяющей уменьшить число камер в проекте.

Во многих случаях, чтобы обеспечить выполнение задач распознавания или идентификации людей, проектировщику нужно будет выбирать объективы с большим фокусным расстоянием или камеры с большей разрешающей способностью или менять место и высоту установки камеры.

Если видеозаписи с камер предполагается использовать в качестве судебных доказательств, при выборе разрешения необходимо также учитывать законодательные и нормативные требования.

Таблица 5. Требования, рекомендованные компанией Hikvision для обнаружения, распознавания и идентификации.

q11

 

q12

Рис. 5. Как три варианта эксплуатационных критериев могут выглядеть на практике.

Разрешение полученного изображения определяется разрешением камеры и размером зоны наблюдения. Например, если ваша камера имеет разрешение 4CIF (704 x 576 пикселей), то при линейном разрешении 500 пикселей/м и выше ширина возможной зоны наблюдения будет составлять не более 1,4 м. Необходимо выбрать камеру и объектив так, чтобы можно было получить нужное поле обзора при желаемом расстоянии от камеры до зоны наблюдения.

Таблица 6. Примеры максимальных расстояний при идентификации (500 пикс./м или 80 пикс./лицо).

й13

 При выборе камеры и фокусного расстояния также могут быть полезны калькулятор объективов Hikvision и каталог продукции HIKVISION. Для квалифицированных пользователей также имеется электронная таблица для расчета плотности пикселей и дальности.

q14

Рис. 6. Сравнение изображений при разных разрешениях.

1: 4 CIF (704x576)
2: SVGA (800x600)
3: HDTV 720p (1280x720)
4: HDTV 1080p (1920x1080)
5: 3 Мп (2048x1536)
6: 5 Мп (2592x1944)
7: 4K (3840x2160) 

Чем больше глубина резкости, тем больше область, в пределах которой люди или объекты будут в фокусе. Вероятность идентификации повышается с увеличением глубины резкости, которая определяется степенью открытия диафрагмы, фокусным расстоянием и расстоянием до камеры.

q15q16

Рис. 7. Глубина резкости.

Глубина резкости возрастает при уменьшении диафрагмы, а это означает, что для увеличения глубины резкости необходимо хорошее освещение. В некоторых камерах Hikvision есть функция P-Iris, с помощью которой диафрагма устанавливается таким образом, чтобы получить оптимальную глубину резкости для разных условий освещения.

Относительное отверстие ирисовой диафрагмы определяет количество света, попадающего через объектив на матрицу. Меньшее значение F - числа соответствует наибольшему раскрытию диафрагмы и наоборот большее значение, соответствует минимальному раскрытию диафрагмы. Соответственно, чем меньше F - число тем картинку лучшего качества можно получить в условиях плохой видимости и чем больше F - число, тем лучше изображение можно корректировать в условиях фоновой засветки. При минимальном F - числе достигается большее значение глубина резкости.

Способ корректировки диафрагмы:

·         Вручную. Данный тип объективов применяется в закрытых помещениях с фиксированным освещением.

·         Автоматическая диафрагма. Объектив автоматически подстраивается под текущий уровень освещенности.

q17

Рис. 8. Яркость и чёткость в зависимости од диафрагмы.

Глубина резкости также увеличивается при использовании более короткого фокусного расстояния. Камеры с более высокими разрешениями позволяют вести съемку, используя более короткие фокусные расстояния, но при этом все равно соблюдаются требования к разрешению.

При использовании большинства объективов возникают некоторые искажения, зачастую приводящие к бочкообразной форме объектов. Это происходит из-за того, что увеличение объектива на краях области обзора несколько меньше, чем в центре изображения. В результате объекты, расположенные по краям, кажутся ближе к центру, чем на неискаженном изображении. Объекты одинакового размера будут занимать меньшее количество пикселей, если они находятся вблизи от края, по сравнению со случаем, когда они находились бы примерно в центре изображения.

q18q19

Рис. 9. Эффект бочкообразных искажений.

Это означает, что объекты, расположенные по краям поля обзора, должны быть ближе к камере, чтобы выполнялись требования минимально допустимого разрешения.

Эффект бочкообразных искажений обычно намного сильнее проявляется при более коротких фокусных расстояниях, что делает широкоугольные объективы менее пригодными для целей идентификации.

Освещение

На возможности идентификации людей и объектов очень сильно влияет освещение. Тени, высокий контраст и контровая подсветка затрудняют идентификацию и распознавание по сравнению с более благоприятными условиями освещения. В следующих примерах мы сравниваем хорошие условия освещения вне помещений с более сложными.

На расстояниях 15-20 м для того, чтобы на ширину лица приходилось около 80 пикселей, требуется объектив с фокусным расстоянием 50 мм. Однако, как хорошо видно из примеров, даже при таком разрешении уверенная идентификация не гарантируется, если освещенность составляет 100-150 люкс - значение, типичное для коридора офисного здания или станции метро. В такой ситуации могут помочь специальные функции камеры, такие как широкий динамический диапазон и матрицы с хорошей светочувствительностью, но наилучшие результаты получаются, когда эти функции сочетают с дополнительным освещением и выбором положения камеры, исключающим контровую подсветку.

При видеонаблюдении вне помещений важно помнить о том, что интенсивность и направление солнечного света меняется в течение дня. На освещенность и отражения также влияют погодные условия. Например, снежный покров сильно отражает свет, в то время как дождь и мокрый асфальт поглощают свет и снижают отражение. Для идентификации человеческого лица рекомендуется равномерное освещение интенсивностью 300-500 люкс. Для идентификации номерного знака может быть достаточно 150 люкс.

q20

Рис. 10. Примеры влияния освещения на возможность идентификации. Изображение A) получено при освещенности на уровне 1600 лк и благоприятном направлении света. В случае В) освещенность составляет 350 лк, но имеется фоновая засветка. Изображение С) получено при освещенности 7 лк и благоприятном направлении света. Для варианта D) освещенность составляет 1,5 лк. 

При слабой освещенности светочувствительная матрица камеры создает значительный шум, который негативно сказывается на качестве изображения. Это может затруднить идентификацию. При любой освещенности приходится искать компромисс между шумом, выдержкой и глубиной резкости, но чем лучше условия освещения, тем более благоприятное сочетание этих параметров можно выбрать.

q21

Рис. 11.  Шум.

 

Точность цветопередачи

Цвет может быть важным фактором для идентификации. Для точной цветопередачи необходимо отрегулировать баланс белого камеры в соответствии с цветовой температурой используемого источника света. При наружном видеонаблюдении цветовая температура меняется в течение дня, поэтому для поддержания точной цветопередачи требуется автоматическая регулировка баланса белого.
Видеокамеры, соответствующие требованиям стандартов SMPTE (Society of Motion Picture and Television Engineers) для HDTV отвечают строгим требованиям в отношении цветопередачи.

Расположение камеры

Расположение и направление объектива камеры являются критически важными параметрами для успешной идентификации. Связано это не только с предотвращением сложных ситуаций с освещением, но также обеспечением съемки людей или объектов под правильным углом. Если, к примеру, камера установлена высоко над землей, изображение будет иметь вид с высоты птичьего полета, что будет искажать людей и объекты, осложняя их распознавание.

 

q22

А)                                      Б)                                    В)

А) – изображение слишком мало для распознавания

Б) – лицо повернуто в сторону от камеры

В) - лицо повернуто в сторону камеры

Рис. 12. Расположение камеры

Четкость картинки может быть достаточно сложной задачей, если видеокамера установлена на высоком столбе, в таком случае даже относительно малая вибрация будет вызывать значительную размытость изображения.

При проектировании системы также необходимо учитывать движение и его скорость. Для целей идентификации обычно рекомендуют иметь частоту кадров не менее 5 - 8 кадров в секунду. Для ваших целей видеонаблюдения может потребоваться и более высокая частота кадров, например, если вам нужно точное понимание последовательности событий. Если в поле обзора встречаются люди и объекты, пересекающие его с большой скоростью или близко к камере, вам может потребоваться увеличить частоту кадров, чтобы камера не пропустила каких-то важных моментов.

Также для получения резкого изображения быстро движущихся людей и объектов необходима короткая выдержка. Камеры, поддерживающие прогрессивную развертку, свободны от размытия движущихся объектов, которое возникает на видео с чересстрочной разверткой.

q23

Рис. 13. Изображение, полученное при хорошей освещенности — как по интенсивности, так и по направлению падающего света. Камера располагается на том же уровне, что и люди; объектив обеспечивает фокусировку и глубину резкости.

Сжатие может значительно ухудшать пригодность записанного материала для идентификации и распознавания, если это делается не самой камерой, как у Hikvision, а программно по уже отснятому материалу или на потоке. Сильное сжатие ведет к размытию или пикселизации, затрудняя идентификацию. Если алгоритм сжатия использует установленный лимит битрейта, коэффициент сжатия может возрастать при интенсивном движении в кадре, в результате чего даже четкое изображение может оказаться непригодным для применения. Наоборот, при использовании переменного битрейта коэффициент сжатия остается неизменным, но при наличии движения в кадре возрастает нагрузка на сеть.

Испытания

Чтобы гарантировать достижение поставленных целей идентификации и распознавания, важно испытать установленные камеры в реалистичных условиях. Проверьте работу камер при разной освещенности и просмотрите записи, чтобы удостовериться, что вы получаете изображение желаемого качества. Типичные проблемы, о которых следует помнить: 

  • Искажение лиц в результате неправильного размещения камеры или выбора объектива
  • Сложные условия освещения, приводящие к появлению глубоких теней или пересвеченных областей
  • Настройки сжатия, вызывающие размытие или пикселизацию изображения
  • Размытие движущихся объектов из-за длительной выдержки или низкой частоты кадров
  • Избыточный шум при плохой освещенности
  • Наложенный текст, закрывающий ключевую часть зоны наблюдения

Для проверки выполнения требований к разрешению также существуют различные тестовые мишени, которые можно помещать в поле зрения камеры. Одну такую мишень можно скачать ниже и по ссылке.

q24q25

Рис. 14.  Примеры тестовой мишени.

Мишень SKL

Для более точной калибровки можно использовать специальный вращающийся манекен Rotakin, который имитирует движение объекта, позволяя оценить возникающее при этом размытие изображения.

q26

Рис.15.  Манекен Rotakin

Кроме того, применяется методика тестирования системы видеонаблюдения с помощью изображений девяти тестовых лиц по стандарту
EN 50 132-7. Для выполнения теста определенным образом подбираются девять лиц трех категорий: три схожих лица восточной внешности, три схожих лица европейской внешности и три схожих лица темнокожих людей (рис. 16).

q27

 

Рис.16. Примеры шаблонов лиц для тестирования систем видеонаблюдения по EN 50 132-7

 

Для выполнения тестирования потребуются:

·         9 изображений тестовых лиц на отдельных листах формата А4;

·         2 человека – оператор системы видеонаблюдения и проверяющий со средствами связи;

·         шест 1,7 м для измерения высоты;

·         лист с образцами лиц для сравнения (лица на листе с образцами пронумерованы по категориям (A, B, C) и номерам – A1, A2, A3, B1, B2 … С3);

·         таблица для занесения результатов.

При тестировании проверяющий перемещается по объекту и перед каждой камерой показывает два любых изображения тестовых лиц, а оператор должен опознать лица и записать номера лиц, которые он увидел, в таблицу результатов, в строку с названием зоны обзора, например B2, C1 или A?, ??, если он не смог распознать лицо. Помимо опознавания лиц в режиме живого видео следует осуществить распознавание лиц на видеозаписи. По окончании тестирования для каждой камеры подсчитываются очки. Если оператор распознал категорию А, B или С – 3 очка, если распознал точно лицо – 6 очков. Если не распознал – 0 очков. Очки суммируются по двум тестам для каждой камеры. Если количество очков меньше двух, то тест не пройден. Предполагается переделка системы видеонаблюдения.

Такое тестирование позволяет выявить самые часто встречающиеся проблемы, вызванные:

·         неправильным подбором объектива;

·         выбором камеры с низким разрешением;

·         неудачным размещением видеокамер.

Стандарт не предлагает проведение тестирования до установки системы наблюдения.

Заключение

Возможность идентификации или распознавания людей, или объектов зависит от ряда факторов. К наиболее важным факторам относятся следующие:

·         разрешение камеры и размер области обзора;

·         условия освещения;

·         положение камеры;

·         движение;

·         сжатие.

Для целей видеонаблюдения определено количество пикселей, которое в отснятом видеоматериале должно приходиться на человека или объект. Компания Hikvision рекомендует величину не менее 80 пикселей для идентификации в неблагоприятных условиях. Для номерных знаков автомобилей размер текста по вертикали должен составлять 15 пикселей. Следует узнать, какие требования законодательно установлены для видеоматериала, используемого в качестве доказательства.

Разрешение камеры определяет максимальный размер области наблюдения. Чем больше количество пикселей, тем больше может быть размер наблюдаемой области. Глубина резкости камеры является важным фактором, который определяет возможность идентификации в том или ином диапазоне расстояний.

Калькулятор объективов Hikvision полезно использовать при выборе камер, удовлетворяющих требованиям, установленным для идентификации и распознавания.

Идентификация может оказаться невозможной в неблагоприятных условиях освещения, несмотря на достаточно высокое разрешение. В этом случае могут помочь высокочувствительные датчики и такие функции как, например, широкий динамический диапазон, но также не следует забывать о возможностях улучшить освещенность и расположить камеру так, чтобы не было фоновой засветки.

Правильное положение камеры играет важную роль для получения неискаженных изображений.

Выберите частоту кадров и выдержку в зависимости от интенсивности движения объектов в зоне видеонаблюдения.

Протестируйте свою систему в реальных условиях эксплуатации, чтобы убедиться в том, что установка способна решать поставленные задачи видеонаблюдения. Просмотрите отснятый видеоматериал для проверки того, что сжатие не повлияло на качество изображения и что полученное качество отвечает вашим требованиям. 

q28

 q29

q30

Архив статей
Добавлено пользователем
Submitted by editor on 05/09/2017.
Поле поиска

Последние публикации: