ВЫБОР ПРИЗНАКОВ ИЗОБРАЖЕНИЯ ДЛЯ СЛЕЖЕНИЯ ЗА ОБЪЕКТОМ

Шувалова И. В., Литвинская О.С.

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Данная статья посвящена анализу одного из аспектов проблемы выбора признаков изображения для слежения за объектом. Существуют различные алгоритмы слежения (трекинга), оценивающие положение одного или нескольких объектов на кадрах видеопоследовательности, которые входят в многочисленные приложения компьютерного зрения в робототехнике и видеонаблюдении.Выбор подходящих признаков изображения может сыграть критическую роль при реализации алгоритмов трекинга. Очень важно правильно выделить характерную особенность изображения на ранних этапах реализации подобных методов, которая позволит объектам быть легко различимыми среди множества других [1].

Представим набор признаков изображения как: ∀D∈D1, D2, D3, D4, где D1 - цветовая модель, D2 - оптический поток, D3 - границы, D4 - текстура.

Каждому признаку изображения соответствуют различные методы его нахождения:

D1 = {dRGB, dHSV, dLuv, dLab}, где dRGB - цветовая модель RGB, dHSV - цветовая модель HSV, dLuv - цветовая модель Luv, dLab - цветовая модель Lab;
D2 = {dLK, dHS, dF, dSF}, где dLK- определение оптического потока по методу Лукаса-Канаде (Lucas-Kanade), dHS - определение оптического потока по методу Хорна-Шанка (Horn-Schunck), dF - определение оптического потока по методу Фернебака (Farneback), dSF - определение оптического потока по методу SimpleFlow;
D3 = {dCED}, где dCED - оператор обнаружения границ изображения Кэнни (Canny edge detector);
D4 = {dGLCM, dLTEM, dw, dsp}, где dGLCM- матрицы сходимости GLCM (Gray-Level Cooccurrence Matrices), dLTEM- двадцать 2D фильтро образованных из пяти 1D фильтров (Laws Texture Energy Measures), dw - вейвлет, dsp - управляемый фильтр (Steerable filter).
Аналитическая модель. В рамках анализа рассмотрим метод определения оптического потока, позволяющий вычислить, на сколько тот или иной объект сместился по отношению к его же положению на предыдущем кадре за то время, которое прошло между фиксацией кадров. Рассмотрим один из классических методов нахождения оптического потока - метод Лукаса-Канаде. Вычислительная сложность этого алгоритма - O(Nnm), где N - количество признаков, n - число уровней пирамиды, m - среднее число итераций. В основе классического метода Лукаса-Канаде лежит предположение, что значения интенсивностей пикселей не изменяются во времени:
I(x + u, y + v, t + 1) = I(x, y, t), (1)
где I(x, y, t) - функция интенсивности пикселя x =(x, y)^T в кадре t и u = (u, v)^T - смещение пикселя между последовательными кадрами t и t + 1. При малом смещении, линейное разложение в ряд Тейлора дает следующее уравнение оптического потока:
f(u, v; I) = I_xu + I_yv + I_t= 0, (2)
где индексы обозначают частные производные. При этом возникает проблема апертуры [3] из-за того, что этого одного уравнения (2) недостаточно для определения двух неизвестных u и v.
Метод Лукаса-Канаде [4] для решения этой проблемы предполагает, что неизвестное смещение пикселя u постоянно в пределах некоторой окрестности. В результате этого, смещение может быть вычислено путем минимизации:
E_LK (u, v) = K_ρ*((f(u, v; I))²), (3)
где K_ρ* ( ∙ ) - свертка с окном интеграции размера ρ. После дифференциации уравнения по параметрам u и v и приравнивания частных производные к нулю, получаем следующую линейную систему:
Zi=Kρ×Ix2Kρ×Ix Iy Kρ×Ix Iy Kρ×Iy2uv=-Kρ×Ix It Kρ×Iy It . (4)
Диаграмма алгоритма Лукаса-Канаде представлена на рис.1.
Алгоритм Лукаса-Канаде:
Для каждого признака i:
1. Инициализировать u_i← (0, 0)^T
2. Задать λ_i ← 0
3. Для уровня пирамиды от n − 1 до 0 с шагом −1:
(a) Вычислить Z_i(4)
(b) Повторить до сходимости:
i. Вычислить разницу I_tмежду первым изображением и смещенным вторым:
I_t (x, y) = I₁ (x, y) − I₂ (x + _ui, y + _vi)
ii. Вычислить e_i(3)
iii. Решить_{Ziu'i = ei}для увеличивающегося движения_u'i iv. Добавить увеличивующееся движение для общей оценки: _{ui←ui+ u'i}
(c) Перейти на следующий уровень: _ui←αu'i, где α - коэффициент масштабирования пирамиды
Рисунок 1 - Диаграмма алгоритма Лукаса-Канаде
В заключение констатируем, что существуют различные варианты модификации метода Лукаса-Канаде, позволяющие улучшить его производительность и уменьшить количество ошибок, например, совмещение метода Лукаса-Канаде с методом Хорна-Шанка [5]. Дальнейшая работа в этом направлении имеет определенные перспективы.
Литература
[1] Shi J. and Tomasi C. Good features to track // IEEE Conference on Computer Vision and Pattern Recognition,1994. P. 593–600.
[2] Bouguet J.-Y. Pyramidal implementation of the Lucas-Kanade feature tracker. // OpenCV documentation, Intel Corporation, Microprocessor Research Labs, 1999.
[3] Horn Berthold K.P., Schunck Brian G. Determining Optical Flow // Artificial Intelligence, vol.17, 1981. P. 185-203.
[4] Lucas B. D. and Kanade T. An iterative image registration technique with an application to stereo vision. // 7th International Joint Conference on Artificial Intelligence, 1981. P. 674–679.
[5] Bruhn Andres and Weickert Joachim, Lucas/Kanade Meets Horn/Schunck: Combining Local Global Optic Flow Methods // International Journal of Computer Vision, vol. 61, no. 3, 2005. P. 211-231.

Просмотров работы: 1336

Код для цитирования:

VI Международная студенческая научная конференция Студенческий научный форум - 2014

ВЫБОР ПРИЗНАКОВ ИЗОБРАЖЕНИЯ ДЛЯ СЛЕЖЕНИЯ ЗА ОБЪЕКТОМ

Студенческий научный форум - 2014
VI Международная студенческая научная конференция