ЗАХИСТ.com.ua

Статьи 

Метод сжатия видео потока в системах охранного телевидения (метод декораций)

Стремление повысить качество видеоизображения, получаемого цифровой системой CCTV, приводит к росту объема оцифрованной видеоинформации - это происходит при попытке увеличить скорость обновления информации и при желании повысить разрешающую способность получаемого изображения. В свою очередь, увеличение объема оцифрованной информации входит в противоречие с физическими ограничениями современных компьютеров и компьютерных сетей как по пропускной способности, так и по емкости жестких дисков, а также усложняет поиск видеоинформации в архиве.

Для снижения трафика при передаче видеоизображений и уменьшения занимаемого дискового пространства используют различные виды компрессии, уровень которой определяется компромиссом между ее эффективностью и приемлемостью качества изображения. Вместе с тем, несмотря на бурное развитие цифровых технологий и обновление элементной базы компьютеров, едва ли следует ожидать, что подобный путь позволит радикально решить указанную проблему.

"Ребята, давайте снизим потребности"

Осознание сказанного подталкивает некоторых специалистов к тому, что они "снижают планку", утверждая, что для CCTV и не требуется высокое качество (низкое разрешение камер, или записанной информации). К сожалению, анализ записанных во время происшествий видеоизображений нередко показывает бесполезность подобной "видеорегистрации" (слишком мало информативных кадров за счет низкой скорости записи, невозможно увеличить изображения из-за их низкой разрешающей способности).

Более плодотворной представляется идея записывать на диск не все кадры подряд, а только те, при которых срабатывает детектор движения (motion detector). При этом следует помнить, что в этом случае мы перекладываем ответственность за возможные пропуски важных событий на "интеллект" детектора движения. Естественно, далеко не во всех случаях можно использовать детектор движения, но, главное, что даже в этом случае проблема со сжатием всего изображения остается.

Чтобы попытаться разрешить указанную проблему, разумно взглянуть на нее несколько по-другому, точнее, с другой точки зрения.

"Что он Гекубе, что ему Гекуба..."

Оператор на посту охраны в каждое свое дежурство постоянно смотрит один и тот же многосерийный фильм под названием "Двор" (или "Улица", или "Стоянка", или "Лестничная площадка" и т.п.).

Иначе говоря в течение многих месяцев и даже лет всё действие (если вообще что-то происходит) разыгрывается в одних и тех же декорациях. Иногда меняется освещение на сцене "Лестничная площадка", иногда появляются облака над сценой "Парковка автомобилей", день сменяет ночь, после лета бывает осень, потом зима ... Все это уже не раз было, охранник эти декорации много раз видел. Но ведь не только охранник – видеокамера тоже все это много раз видела, и на диске все это записывалось!

Охранник на эти декорации практически не обращает внимания (ну, если уж произойдет что-то из ряда вон...), а вот видеосистема тупо оцифровывает весь кадр… Ну да, используется условное обновление (межкадровая разность, MPEG)... так обновляются ведь все изменения, в том числе и несущественные. А потом мы сетуем, мало места на диске. Посмотрите изображение помещения, освещаемого люменисцентными лампами – оно "дышит", потому что освещенность все время меняется, а значит, все время происходит оцифровка. Но ведь для охранника эти изменения совершенно несущественны, тогда зачем ему все это предъявлять, зачем портить его зрение, зачем зря увеличивать трафик?!

Или видеонаблюдение за трассой, по которой мчатся автомобили. Формат кадра в CCTV 3 : 4, поэтому нередко значительную часть изображения занимает небо. Если в этом случае мы будем реже видеть верхнюю часть кадра, мы потеряем информацию? Конечно, например, не увидим мгновенно, как над дорогой летает, например, дельтоплан со злоумышленником. Однако весь вопрос в том, какова вероятность его появления в этой области и какова плата за подобное постоянное наблюдение "лишней" области?

Так, может, CCTV не следует обращать внимания, на несущественные изменения несущественных зон?!

Как это? А так:

Запомнить декорации

Да, запомнить малоинформативные декорации и вводить их один раз (в секунду, в минуту, в час, а может быть, даже в месяц... ). А существенные изменения микшировать с декорациями и предъявлять охраннику на экране монитора. Можно вообще на сервере и клиентском компьютере создать базу данных декораций и их возможных вариаций. В этом случае с передающей стороны можно передавать не все изображение декорации, а только код, соответствующий номеру этой декорации в базе данных – наверное, трафик в этом случае будет несколько меньше, не так ли? Но ведь это "ненастоящие" декорации? Конечно, не настоящие. А охраннику это важно?

- Ну, знаете, а вдруг... и вообще... как-то необычно...

- Так ли?

Вспомнить все

Вспомните, как Вы сегодня добирались до дома. Вы не заметили женщину, что попалась Вам навстречу? Какого цвета сумочка была у нее в руке? А дверь соседнего подъезда была открыта или закрыта? Не помните, а ведь Вы на все это смотрели, все это видели, просто Вы шли задумавшись, и эта информация была для Вас несущественной. Задумавшись, человек может добраться до дому, удивившись, как же это он дошел "на автопилоте" – потому что человека интересует только существенная информация, только ее он обрабатывает, только ее запоминает – остальное он не воспринимает.

Вспомните случай - на вас на улице несется, злобно лая, собака. В этот момент Вам ведь не столь важны детали декора соседнего дома - Ваше внимание сосредоточено на собаке, оно повторяет траекторию ее движения, выделяет ее из всего видимого.

Ну, хорошо, предположим, передаем "декорации" очень редко или даже передаем только код "декорации".

А как же отделить существенную информацию от несущественной?

А вот здесь на помощь и должен прийти

Детектор движения

Во-первых, можно маскировать от передачи те зоны, в которых в нормальной ситуации движения не должно быть: вариации сигналов, соответствующих пикселям такой зоны должны анализироваться по принципу дежавю (такое изображение когда-нибудь уже было?). Если да, то эту часть изображения передавать не следует. Если же в базе данных декорации, близкой к такой "декорации" нет, то это событие следует рассматривать как информацию об опасности, и эта часть видеополя становится важной, требующей запоминания.

Во-вторых, детектор движения должен выявлять на изображении контуры тех областей, в которых обнаружено движение. Именно эти области являются той информацией, которая интересует охранника, именно ее следует передавать и записывать на диск.

Сидящие во мне атавизмы аналогового телевидения подсказывают очевидное решение. Надо выделять существенную информацию с помощью растрового представления видеополя, когда при движении по строке опускается вся информация до тех пор, пока детектор движения не укажет первый на данной строке пиксел, принадлежащий контуру области с движением. Все последующие пиксель по строке являются информативными до тех пор, пока детектор не укажет пиксел контура, закрывающего область с движением. Ясно, что могут быть совершенно другие методы выделения активной области, которая и несет существенную информацию.

Суть предложения

Суть моего предложения – использование статистики (априорной информации о зоне наблюдения) с целью уменьшения избыточности передаваемой и запоминаемой информации. Существующая в настоящее время запись по таймеру или с использованием детектора движения, или датчика тревоги – это ведь та же самая попытка уменьшить объем записываемой/передаваемой информации. Однако выбор количества информации в этом случае осуществляется с точностью до целого поля, а я предлагаю выбор осуществлять по информативности части видеополя.

Конечно, идеально было бы записывать подряд всё и всегда, но реально ли это? Все живое в природе организовано на использовании приоритетов, на компромиссах. Идеально было бы, например, чтобы у человека спектральная чувствительность глаза был бы равномерной, однако ее график имеет явный максимум. Или чтобы кости были сплошными, а не трубчатыми и пр. В конечном итоге выживает тот, кто осознает необходимость разумного компромисса, в том числе, и в технике.

Информационный подход

Информация - это когда появляется что-то новое (например, когда на экране монитора никого не было видно и неожиданно появился человек). В CCTV велика корреляция передаваемых/запоминаемых изображений, то есть велика априорная информация об объекте. То, что делается сейчас при обработке видеоинформации - это нерациональное использование ресурсов (которые всегда, при любом уровне развития техники, ограничены): производится запись кадров не несущих новизны, неинформативных, и за счет этого в некоторых случаях происходит даже увеличение энтропии вместо ее уменьшения.

Предлагаемая идея заключается в использовании априорной информации о зоне наблюдения для того, чтобы уменьшить количество избыточной информации для запоминания и передачи видеоизображений зоны наблюдения.

Если с помощью интеллектуального детектора движения можно с высокой степенью вероятности выделить в кадре зоны с существенной и несущественной информацией, то и передавать их следует по-разному: с учетом статистики декорации можно передавать реже и даже с меньшим разрешением по сравнению с теми областями кадра, в которых обнаружено движение. Например, декорации можно передавать со скоростью 4 кадра в сек. (pps), а области с движением 25 pps. В этом случае выигрыш в трафике можно использовать для передачи движущихся объектов в реальном времени для большего числа каналов.

Еще больший выигрыш может быть, если вместо сравнительного редкой передачи изображений декораций передавать только их адреса в базе данных.

Рекомендуем:

 

 

Интернет-проект ЗАХИСТ.com.ua