Стандарти ідентифікації, розпізнавання та детектування людей
У світі щорічно встановлюються мільйони камер спостереження, але все частіше при вивченні відеозаписів після тих чи інших інцидентів їх якість виявляється недостатньою для розпізнавання та ідентифікації людей або номерних знаків автомобілів, а це означає, що величезні кошти та ресурси були витрачені даремно.
Що спільного у погано спроектованої системи відеоспостереження та слабкого антивірусного пакета? Хибне почуття захищеності, що вони дають користувачеві. Хибне почуття безпеки змінюється розчаруванням після першого інциденту. Щоб уникнути слабких місць, проектувальнику слід знати поширені помилки проектів відеоспостереження.
Якщо проект системи відеоспостереження потребує ідентифікації або розпізнавання людей, або потрібно ідентифікувати об'єкти - наприклад, номерні знаки, то потрібно не тільки отримати зображення поля огляду з достатньою роздільною здатністю, але й взяти до уваги такі фактори, як підсвічування, розташування камери і рух.
Порядок встановлення систем відеоспостереження
Як мінімум потрібно дотриматися порядку встановлення для того, щоб надалі не виникало непередбачених ситуацій:
- Аналіз ризиків та оцінка ступеня кожного можливого ризику;
- Огляд об'єкта чи креслення об'єкта;
- Упорядкування експлуатаційних вимог;
- Розробка проекту системи, куди входять план місцевості чи план приміщення;
- Розробка плану тестування системи відеоспостереження;
- Установка системи та її передача замовнику;
- Документування результатів.
- Особливості вибору зони огляду
Багато рекомендацій виглядають продумано, наведемо найважливіші моменти, які потрібно враховувати під час планування зони огляду камери. Чинники, які потрібно врахувати при виборі місця встановлення камери:
- Можлива поява іншої кількості листя на деревах в іншу пору року.
- Можлива поява сторонніх джерел світла.
- Залежно від часу доби та сезону сонячне світло може створювати відблиски або не забезпечувати достатніх умов освітленості.
- Вікна, будівлі, вода можуть викликати засвічення та погіршити якість зображення.
- Активність сцени – потрібно враховувати можливу появу тимчасових чи нових об'єктів у зоні огляду камери.
- Якщо камера встановлюється для ідентифікації людей, її слід розмістити приблизно на висоті голови середнього зросту.
- Розрахунок кута огляду відеокамери
Розрахунок кута огляду об'єктива проводиться за формулою:
α = 2arctg(d/2F)
α - кут огляду об'єктива, (градусів) (без урахування сферичної аберації)
d - розмір світлочутливого елемента (матриці), (мм)
F – ефективна фокусна відстань об'єктива, (мм)
Рис. 1. Угла обзора видеокамеры
При выборе фокусного расстояния объектива следует учитывать, что угол ясного зрения человека по горизонтали составляет примерно 36°, что соответствует фокусному расстоянию ~ 6,9 мм (для видеокамеры с размером матрицы 1/3"). Поэтому видеокамеры с фокусным расстоянием объектива менее 6,9 мм будут визуально отдалять изображение, более 6,9 мм – соответственно приближать.
Фокусное расстояние - это расстояние между линзой и матрицей видеокамеры. Стоит запомнить следующее правило: чем меньше фокусное расстояние, тем больше угол обзора видеокамеры и наоборот, чем больше фокусное расстояние, тем меньше угол обзора видеокамеры. Фокусное расстояние записывается как f= ... мм.
Рис. 2. Залежність відстані до об'єкта від фокусної відстані та кута огляду.
З малюнка видно, що якщо потрібно мінімальною кількістю оглядових камер відеоспостереження стежити за периметром, варто встановити відеокамеру з малою фокусною відстанню і навпаки, якщо потрібна ідентифікація деталей: грошових купюр, автомобільних номерів, осіб, варто підбирати фокусну відстань об'єктива відеокамери з великим значенням.
Розрахунок дистанцій здійснюється на основі вимог європейських норм для CCTV:
· Лінійний дозвіл для виявлення об'єкта - 20 пікселів/м;
· Лінійний дозвіл для розпізнавання - 100 пікселів/м;
· Лінійний дозвіл для ідентифікації - 250 пікселів/м;
при роздільній здатності матриці відеокамери 1080 (2Мп Full HD), 700, 560, 480, і 380 Твл.
Таблиця 0. Приблизні дистанції для камер
Таблиця 1. Розміри матриць, що використовуються у відеокамерах
Слід врахувати, що через наявність сильних спотворень короткофокусних об'єктивах кут огляду може відрізнятися від розрахункового.
Необхідна роздільна здатність
Традиційно в аналогових системах відеоспостереження вимоги до роздільної здатності формулювали виходячи з того, яку частку кадру по вертикалі повинен займати об'єкт, що спостерігається. Для різних цілей потрібна різна величина об'єкта у кадрі.
Наприклад, виявлення людини у кадрі може бути достатньо, щоб його зростання становив 10% вертикального розміру. У той самий час для розпізнавання (ідентифікації) людини може знадобитися, щоб його зростання становив 50% вертикалі кадру, а ретельної ідентифікації - до 120% і більше.
Рис. 3. Один і той же тестовий манекен, знятий так, що його зростання займає 10%, 50% та 120% від висоти зображення.
З появою IP-камер, і особливо у зв'язку з розробкою мегапіксельних та HDTV-камер виникла потреба знайти нові способи встановлення відповідності експлуатаційним вимогам. Наведені нижче дозволяють співвіднести експлуатаційні вимоги з характеристиками сучасних відео- та IP-камер.
Виробляючи рекомендації щодо вибору камер та обговорюючи, яка камера з представлених на ринку краще, можна легко опуститися на рівень технічних описів та специфікацій. В результаті багато інтеграторів упускають з уваги одну з ключових вимог будь-якої системи відеоспостереження - експлуатаційні вимоги, або фактичну мету відеоспостереження.
У минулому, коли відеоспостереження було повністю аналоговим, підбір камери під конкретні експлуатаційні вимоги зводився, по суті, до вибору відповідного об'єктива, оскільки вибір дозволів камер був дуже невеликий. Більшість аналогових систем відеоспостереження призначене для стеження за поведінкою людей, тому як еталонний об'єкт у них використовується тіло людини. Для різних сценаріїв відеоспостереження були сформульовані різні категорії, що відрізняються тим, яку частину кадру займає людина на повне зростання. Хоча це не стало глобальним стандартом, прийнято розрізняти потреби у виявленні, розпізнаванні та ідентифікації.
Таблиця 2. Вимоги науково-дослідного відділу МВС Великобританії, 2009
Значення, наведені в таблиці 2, добре працюють для стандартних аналогових дозволів, проте для дозволів, властивих IP-камер, вони не підходять. Хоча роздільну здатність телевізійних рядків можна перерахувати в пікселі (див. табл. 3), для реальних ситуацій це занадто складно. Зрозуміло, має бути найкращий спосіб.
Таблиця 3. Вертикальне уявлення відсотка висоти тіла для ідентифікації
Рис. 4. Одна і та сама людина, знята так, що її зростання займає 20%, 40% і 140% від висоти зображення.
Сучасні мережеві IP відеокамери охоплюють широкий діапазон дозволів. Процентні співвідношення не використовуються; і тепер вимоги до роздільної здатності вказуються в пікселях та доповнено альтернативним параметром: кількістю міліметрів мети, що припадають на один піксель зображення, отриманого з камери відеоспостереження. У літературі систем відеоспостереження найбільш поширена зворотна характеристика – "щільність пікселів", або кількість пікселів зображення на 1 м на відстані спостереження мети.
Таблиця 4. Вимоги європейського стандарту EN 50 132-7 для виявлення, розпізнавання та ідентифікації
Для інших об'єктів використовуються інші критерії. Наприклад, для читання номерних знаків висота букв повинна становити приблизно 15 пікселів (що відповідає приблизно 200 пікселів/м).
Практично це означає, що проектувальник та замовник повинні визначитися з метою встановлення кожної камери (розпізнавання людей, ідентифікація, детектування, спостереження). І при підборі зони огляду камери слід розрахувати, за яких параметрів камери та об'єктива в зоні огляду камери буде достатня щільність пікселів для обраної для камери завдання.
Проектувальнику треба знайти золоту середину між більшою густиною пікселів, що дозволяє побачити більше деталей при меншому куті огляду, і більшою шириною зони огляду камери при більшому куті огляду, що дозволяє зменшити кількість камер у проекті.
У багатьох випадках, щоб забезпечити виконання розпізнавання чи ідентифікації людей, проектувальнику потрібно буде вибирати об'єктиви з великою фокусною відстанню або камери з більшою роздільною здатністю або змінювати місце і висоту установки камери.
Якщо відеозаписи з камер передбачається використовувати як судові докази, при виборі дозволу необхідно також враховувати законодавчі та нормативні вимоги.
Таблиця 5. Вимоги, рекомендовані Hikvision для виявлення, розпізнавання та ідентифікації.
Рис. 5. Як три варіанти експлуатаційних критеріїв можуть бути на практиці.
Роздільна здатність отриманого зображення визначається роздільною здатністю камери та розміром зони спостереження. Наприклад, якщо ваша камера має роздільну здатність 4CIF (704 x 576 пікселів), то при лінійній роздільній здатності 500 пікселів/м і вище ширина можливої зони спостереження становитиме не більше 1,4 м. Необхідно вибрати камеру та об'єктив так, щоб можна було отримати потрібне поле огляду за бажаної відстані від камери до зони спостереження.
Таблиця 6. Приклади максимальних відстаней під час ідентифікації (500 пікс./м або 80 пікс./особа).
При виборі камери та фокусної відстані також можуть бути корисними калькулятор об'єктивів Hikvision та каталог продукції HIKVISION. Для кваліфікованих користувачів також є електронна таблиця для розрахунку щільності пікселів та дальності.
Рис. 6. Порівняння зображень за різних роздільних здатностей.
1: 4 CIF (704x576)
2: SVGA (800x600)
3: HDTV 720p (1280x720)
4: HDTV 1080p (1920x1080)
5: 3 Мп (2048x1536)
6: 5 Мп (2592x1944)
7: 4K (3840x2160)
Чим більша глибина різкості, тим більше область, в межах якої люди або об'єкти будуть у фокусі. Імовірність ідентифікації підвищується зі збільшенням глибини різкості, що визначається ступенем відкриття діафрагми, фокусною відстанню та відстанню до камери
Рис. 7. Глибина різкості.
Глибина різкості зростає при зменшенні діафрагми, а це означає, що для збільшення глибини різкості потрібне гарне освітлення. У деяких камерах Hikvision є функція P-Iris, за допомогою якої встановлюється діафрагма таким чином, щоб отримати оптимальну глибину різкості для різних умов освітлення.
Відносний отвір ірисової діафрагми визначає кількість світла, що потрапляє через об'єктив на матрицю. Найменше значення F - числа відповідає найбільшому розкриттю діафрагми і навпаки більше значення відповідає мінімальному розкриттю діафрагми. Відповідно, чим менше F - число тим картинку кращої якості можна отримати в умовах поганої видимості і чим більше F - число, тим краще можна коригувати зображення в умовах фонової засвітки. При мінімальному F - числі досягається більшого значення глибина різкості.
Спосіб коригування діафрагми:
· Вручну. Цей тип об'єктивів застосовується у закритих приміщеннях з фіксованим освітленням.
· Автоматична діафрагма. Об'єктив автоматично підлаштовується під поточний рівень освітлення.
Рис. 8. Яскравість і чіткість залежно від діафрагми.
Глибина різкості також збільшується при використанні більш короткої фокусної відстані. Камери з більш високими роздільними здатностями дозволяють вести зйомку, використовуючи більш короткі фокусні відстані, але при цьому все одно дотримуються вимоги щодо роздільної здатності.
При використанні більшості об'єктивів виникають деякі спотворення, що часто призводять до бочкоподібної форми об'єктів. Це відбувається через те, що збільшення об'єктива на краях області огляду дещо менше, ніж у центрі зображення. В результаті об'єкти, розташовані з обох боків, здаються ближче до центру, ніж на неспотвореному зображенні. Об'єкти однакового розміру займатимуть меншу кількість пікселів, якщо вони знаходяться поблизу краю, порівняно з випадком, коли вони знаходилися б приблизно в центрі зображення.
Рис. 9. Ефект бочкоподібних спотворень.
Це означає, що об'єкти, розташовані по краях поля огляду, повинні бути ближчими до камери, щоб виконувати вимоги мінімально допустимої роздільної здатності.
Ефект бочкоподібних спотворень зазвичай набагато сильніше проявляється при більш коротких фокусних відстанях, що робить ширококутні об'єктиви менш придатними для цілей ідентифікації.
Освітлення
На можливості ідентифікації людей та об'єктів дуже сильно впливає освітлення. Тіні, високий контраст та контрова підсвічування ускладнюють ідентифікацію та розпізнавання в порівнянні з більш сприятливими умовами освітлення. У таких прикладах ми порівнюємо хороші умови освітлення поза приміщеннями з більш складними.
На відстані 15-20 м для того, щоб на ширину обличчя припадало близько 80 пікселів, потрібно об'єктив з фокусною відстанню 50 мм. Однак, як видно з прикладів, навіть при такому дозволі впевнена ідентифікація не гарантується, якщо освітленість становить 100-150 люкс - значення, типове для коридору офісної будівлі або станції метро. У такій ситуації можуть допомогти спеціальні функції камери, такі як широкий динамічний діапазон і матриці з хорошою світлочутливістю, але найкращі результати виходять, коли ці функції поєднують з додатковим освітленням та вибором положення камери, що виключає контрове підсвічування.
При відеоспостереженні поза приміщеннями важливо пам'ятати про те, що інтенсивність та напрямок сонячного світла змінюється протягом дня. На освітленість та відображення також впливають погодні умови. Наприклад, сніговий покрив сильно відбиває світло, тоді як дощ і мокрий асфальт поглинають світло і знижують відбиття. Для ідентифікації людини рекомендується рівномірне освітлення інтенсивністю 300-500 люкс. Для ідентифікації номерного знака може бути достатньо 150 люксів.
Рис. 10. Приклади впливу висвітлення можливість ідентифікації. Зображення A) отримано при освітленості на рівні 1600 лк та сприятливому напрямку світла. У разі В) освітленість становить 350 лк, але є фонове засвічення. Зображення С) отримано при освітленості 7 лк та сприятливому напрямку світла. Для варіанта D) освітленість становить 1,5 лк.
При слабкому освітленні світлочутлива матриця камери створює значний шум, який негативно позначається на якості зображення. Це може ускладнити ідентифікацію. При будь-якій освітленості доводиться шукати компроміс між шумом, витримкою та глибиною різкості, але чим кращі умови освітлення, тим сприятливіше поєднання цих параметрів можна вибрати.
Рис. 11. Шум.
Точність кольору
Колір може бути важливим фактором для визначення. Для точної передачі кольорів необхідно відрегулювати баланс білої камери відповідно до колірної температури використовуваного джерела світла. При зовнішньому відеоспостереженні колірна температура змінюється протягом дня, тому для підтримки точної передачі кольорів потрібне автоматичне регулювання балансу білого.
Відеокамери, що відповідають вимогам стандартів SMPTE (Society of Motion Picture and Television Engineers) для HDTV, відповідають суворим вимогам щодо кольору.
Розташування камери
Розташування та напрямок об'єктива камери є критично важливими параметрами для успішної ідентифікації. Пов'язано це не тільки із запобіганням складним ситуаціям з освітленням, але також забезпеченням зйомки людей або об'єктів під правильним кутом. Якщо, наприклад, камера встановлена високо над землею, зображення матиме вигляд з висоти пташиного польоту, що спотворюватиме людей та об'єкти, ускладнюючи їхнє розпізнавання.
А) Б) В)
А) – зображення надто мале для розпізнавання
Б) – обличчя повернене убік від камери
В) - обличчя повернене у бік камери
Рис. 12. Розташування камери
Чіткість картинки може бути досить складним завданням, якщо відеокамера встановлена на високому стовпі, у цьому випадку навіть відносно мала вібрація буде викликати значну розмитість зображення.
При проектуванні системи також необхідно враховувати рух та його швидкість. Для цілей ідентифікації зазвичай рекомендують мати частоту кадрів щонайменше 5 - 8 кадрів на секунду. Для ваших цілей відеоспостереження може знадобитися і більш висока частота кадрів, наприклад, якщо вам потрібне розуміння послідовності подій. Якщо в полі огляду зустрічаються люди та об'єкти, що перетинають його з великою швидкістю або близько до камери, вам може знадобитися збільшити частоту кадрів, щоб камера не пропустила якихось важливих моментів.
Також для отримання різкого зображення людей і об'єктів, що швидко рухаються, необхідна коротка витримка. Камери, що підтримують прогресивну розгортку, вільні від розмиття об'єктів, що рухаються, яке виникає на відео з черезрядковою розгорткою.
Рис. 13. Зображення, отримане при хорошій освітленості - як за інтенсивністю, так і за напрямом падаючого світла. Камера знаходиться на тому ж рівні, що й люди; об'єктив забезпечує фокусування та глибину різкості.
Стиснення може значно погіршувати придатність записаного матеріалу для ідентифікації та розпізнавання, якщо це робиться не самою камерою, як у Hikvision, а програмно за відзнятим матеріалом або на потоці. Сильне стиск веде до розмиття або пікселізації, ускладнюючи ідентифікацію. Якщо алгоритм стиснення використовує встановлений ліміт бітрейту, коефіцієнт стиснення може зростати за інтенсивного руху в кадрі, внаслідок чого навіть чітке зображення може виявитися непридатним для застосування. Навпаки, з використанням змінного бітрейту коефіцієнт стиснення залишається незмінним, але за наявності руху на кадрі зростає навантаження на мережу.
Випробування
Щоб гарантувати досягнення поставленої мети ідентифікації та розпізнавання, важливо випробувати встановлені камери в реалістичних умовах. Перевірте роботу камер під час різного освітлення та перегляньте записи, щоб переконатися, що ви отримуєте зображення бажаної якості. Типові проблеми, про які слід пам'ятати:
- Спотворення осіб внаслідок неправильного розміщення камери або вибору об'єктива
- Складні умови освітлення, що призводять до появи глибоких тіней або пересвічених областей
- Налаштування стиснення, що викликають розмиття або пікселізацію зображення
- Розмиття об'єктів, що рухаються, через тривалу витримку або низьку частоту кадрів
- Надмірний шум при поганому освітленні
Накладений текст, що закриває ключову частину зони спостереження
Для перевірки виконання вимог до дозволу також існують різні тестові мішені, які можна поміщати у поле зору камери. Одну таку мету можна завантажити нижче і за посиланням.
Рис. 14. Приклади тестової мішені.
Для більш точного калібрування можна використовувати спеціальний манекен Rotakin, що обертається, який імітує рух об'єкта, дозволяючи оцінити розмиття зображення, що при цьому виникає.
Рис.15. Манекен Rotakin
Крім того, застосовується методика тестування системи відеоспостереження за допомогою зображень дев'яти тестових осіб за стандартом
EN 50 132-7. Для виконання тесту певним чином підбираються дев'ять осіб трьох категорій: три подібні особи східної зовнішності, три подібні особи європейської зовнішності і три подібні особи темношкірих людей (рис. 16).
Рис.16. Приклади шаблонів осіб для тестування систем відеоспостереження EN 50 132-7
Для виконання тестування знадобляться:
· 9 зображень тестових осіб на окремих аркушах формату А4;
· 2 особи – оператор системи відеоспостереження та перевіряючий із засобами зв'язку;
· жердина 1,7 м для вимірювання висоти;
· аркуш із зразками осіб для порівняння (особи на аркуші із зразками пронумеровані за категоріями (A, B, C) та номерами – A1, A2, A3, B1, B2…С3);
· Таблиця для занесення результатів.
При тестуванні перевіряючий переміщається по об'єкту і перед кожною камерою показує два будь-які зображення тестових осіб, а оператор повинен упізнати особи та записати номери осіб, які він побачив, у таблицю результатів, у рядок з назвою зони огляду, наприклад, B2, C1 або A?, ??, якщо він не зміг розпізнати обличчя. Крім розпізнавання облич у режимі живого відео, слід здійснити розпізнавання облич на відеозаписі. Після закінчення тестування кожної камери підраховуються окуляри. Якщо оператор розпізнав категорію А, B або С – 3 очки, якщо розпізнав особу – 6 очок. Якщо не розпізнав – 0 очок. Окуляри підсумовуються двома тестами для кожної камери. Якщо кількість очок менше двох, то тест не пройдено. Передбачається переробка системи відеоспостереження.
Таке тестування дозволяє виявити найпоширеніші проблеми, викликані:
· Неправильним підбором об'єктива;
· Вибором камери з низькою роздільною здатністю;
· Невдалим розміщенням відеокамер.
Стандарт не пропонує проведення тестування до встановлення системи спостереження.
Висновок
Можливість ідентифікації чи розпізнавання людей, чи об'єктів залежить від низки чинників. До найважливіших факторів належать такі:
· Роздільна здатність камери та розмір області огляду;
· Умови освітлення;
· Положення камери;
· Рух;
· Стиснення.
Для цілей відеоспостереження визначено кількість пікселів, які у знятому відеоматеріалі повинні припадати на людину чи об'єкт. Компанія Hikvision рекомендує розмір не менше 80 пікселів для ідентифікації в несприятливих умовах. Для номерних знаків автомобілів розмір тексту по вертикалі має становити 15 пікселів. Слід дізнатися, які вимоги законодавчо встановлені для відеоматеріалу, який використовується як доказ.
Роздільна здатність камери визначає максимальний розмір області спостереження. Чим більше кількість пікселів, тим більше може бути розмір області, що спостерігається. Глибина різкості камери є важливим фактором, який визначає можливість ідентифікації у тому чи іншому діапазоні відстаней.
Калькулятор об'єективів Hikvision корисно використовувати при виборі камер, які відповідають вимогам, встановленим для ідентифікації та розпізнавання.
Ідентифікація може бути неможливою у несприятливих умовах освітлення, незважаючи на досить високу роздільну здатність. У цьому випадку можуть допомогти високочутливі датчики і такі функції, як, наприклад, широкий динамічний діапазон, але також не слід забувати про можливості покращити освітленість і розташувати камеру так, щоб не було фонового засвічення.
Правильне положення камери відіграє важливу роль для отримання неспотворених зображень.
Виберіть частоту кадрів та витримку залежно від інтенсивності руху об'єктів у зоні відеоспостереження.
Протестуйте свою систему в реальних умовах експлуатації, щоб переконатися, що установка здатна вирішувати поставлені завдання відеоспостереження. Перегляньте відзнятий відеоматеріал для перевірки того, що стиснення не вплинуло на якість зображення та що отримана якість відповідає вашим вимогам.