Новое машинное зрение использует всего один пиксель

Мария Самсонова26.06.2024Обновлено: 26.06.2024

0 440 2 минут(ы) на чтение

Более быстрое машинное зрение использует всего один пиксель

Беспилотные автомобили зависят от сложных датчиков, подкрепленных большой вычислительной мощностью. Исследовательские усилия, проводимые китайским университетом Циньхуа, сокращают требования к вычислительным ресурсам с помощью системы отслеживания, которой для выполнения работы требуется всего один пиксель.

Когда инженеры впервые задумались о таких вещах, как автономные автомобили и интеллектуальные системы безопасности, системы компьютерного зрения, необходимые для их поддержки, казались простым делом. Подключите камеру к процессору, напишите несколько алгоритмов и она заработает. В конце концов, люди справляются с обработкой изображений без каких-либо усилий, используя только глаза (биокамеры) и мозг (программное обеспечение). Что может быть проще?

Оказывается, это крайне сложно. Человеческий глаз может быть оптически проще, чем камера (хотя и не все так просто), но обработка картинки, лежащая в его основе, ошеломляюще сложна. Добавьте к этому то, как люди используют информацию и реагируют на нее чисто рефлекторно, и имитация этой способности окажется практически невыполнимой задачей.

Достижение команды ученых Циньхуа включает разработку 3D-метода для отслеживания быстродвижущихся объектов с беспрецедентной скоростью, с одновременным снижением требований к вычислительным ресурсам. Хитрость заключается в том, чтобы сделать это не с полным изображением, а с использованием одного пикселя.

Экспериментальный стенд для однопиксельного метода 3D-слежения.

«Наш подход не требует реконструкции изображения объекта для расчета его положения, что значительно снижает затраты на хранение данных и вычислительные затраты», — сказал руководитель исследовательской группы Зихан Гэн. «В частности, для получения трехмерных координат требуется всего шесть байт памяти и 2,4 микросекунды времени. За счет сокращения вычислительных затрат и повышения эффективности это может снизить стоимость оборудования, необходимого для высокоскоростного отслеживания, что сделает технологию более доступной».

По словам исследователей, с помощью одного детектора их метод может отслеживать объект в 200 раз быстрее, чем традиционные методы на основе видео, без какой-либо предварительной информации и с минимальной вычислительной мощностью. Для этого он проецирует геометрические световые узоры на объект и измеряет интенсивность одного пикселя. Используя чрезвычайно сложную математику, можно рассчитать положение и траекторию объекта.

Пока что этот метод используется для отслеживания одного объекта, но следующим шагом будет переход к множеству объектов.

«Наше открытие может улучшить восприятие таких технологий, как беспилотные автомобили, улучшить системы наблюдения за безопасностью и предложить более эффективный мониторинг и контроль качества для промышленного контроля», — сказал Зихан Гэн. «Кроме того, метод высокоскоростной локализации можно использовать в научных исследованиях, таких как изучение траектории полета насекомых».

Исследование было опубликовано в журнале Optics Letters.

Ваша реакция?

Метки