Искусственный интеллект в усовершенствованных датчиках изображения: глаза, которые никогда не моргают

Adam J. Fleischer
|  Создано: 18 Ноября, 2024
Изображающие датчики с искусственным интеллектом

Эпоха, когда камеры использовались только для съемки, осталась позади. Теперь датчики изображения с усилением ИИ оснащают машины глазами, которые никогда не моргают, не устают и могут видеть за пределами человеческих возможностей. Эти датчики не просто захватывают изображения – интегрируя высокоразрешающую съемку с обработкой ИИ на чипе, они понимают и интерпретируют их в реальном времени.

Новая эра машинного зрения и восприятия

Датчики изображения с усилением ИИ представляют собой сдвиг парадигмы в обработке и использовании визуальных данных. Они интерпретируют визуальные данные с беспрецедентной точностью и эффективностью, обеспечивая инструменты, такие как распознавание объектов в реальном времени и анализ лиц. Эти датчики обрабатывают данные непосредственно на чипе, что делает возможным почти мгновенный анализ и принятие решений. 

Они обеспечивают прорывные возможности во всем, начиная от автономных транспортных средств, перемещающихся по сложным городским улицам, до систем безопасности, способных обнаруживать преступления по мере их совершения. В таких областях, как медицинская визуализация, датчики изображения с усилением ИИ предоставляют детализированные изображения высокого разрешения и точное обнаружение, которые могут улучшить точность диагностики. Возможно, скоро они даже смогут распознавать наши эмоции.

Искусственный интеллект, улучшающий работу датчиков изображения, может быть объединен с другими технологиями, такими как спектральное сенсирование, для повышения функциональности. Например, интеграция ИИ с электро-оптическими датчиками позволяет автоматически распознавать цели и улучшать разрешение изображения.

Сосредоточим наше внимание на заслуживающих внимания датчиках

Вот пять датчиков изображения с улучшением за счет ИИ, которые заслуживают вашего внимания: 

  1. Samsung ISOCELL HP2: Эти датчики оснащены 200-мегапиксельной камерой с передовыми двойными затворами и алгоритмами глубокого обучения для превосходной детализации и цветопередачи. Они отлично работают в условиях слабого освещения, быстро фокусируясь даже в темноте. 
  2. Omnivision OX03C10: Этот автомобильный датчик изображения класса ASIL-C предлагает 140 дБ HDR и лучшую производительность по снижению мерцания светодиодов, а также встроенный ИИ-движок для систем помощи водителю (ADAS).
  3. Canon Dual Pixel CMOS AF: Известные технологией двойного пиксельного автофокуса, улучшенной с помощью ИИ для повышения точности и скорости фокусировки, эти датчики выделяются в цифровых камерах и профессиональном видеооборудовании.
  4. IMX500 от Sony с интеллектуальным зрением: IMX500 обладает структурой стекированного сенсора, который включает в себя датчик изображения, мощный DSP и выделенное встроенное SRAM для обеспечения высокоскоростной обработки AI на периферии. 
  5. Prophesee Metavision®: Эти сенсоры зрения, вдохновленные нейроморфными технологиями и работающие на основе событий, захватывают только изменения в сцене, а не полные кадры. Это обеспечивает сверхнизкую задержку и крайне высокую энергоэффективность для робототехники и автономных транспортных средств.
Self-Driving 3D Car Concept

Эффект волны технологических достижений

Эти сенсоры стимулируют волну технологических инноваций, которые выходят за рамки только изображений. Они открывают новые возможности в архитектуре систем, обработке сигналов и вычислениях на периферии. Получаемые прорывы создают возможности в различных отраслях, от мобильных устройств до автономных систем.

3D стекированные архитектуры: Делаются достижения в стекировании множества слоев для создания 3D архитектур. Этот подход направлен на улучшение производительности без увеличения размера устройства, что является бесконечной целью для компактных приложений, таких как смартфоны и портативные медицинские устройства. 3D стекированные архитектуры также способствуют интеграции передовых функций – таких как высокоскоростная захват изображений, обработка AI на чипе и улучшенная энергоэффективность – создавая возможности для приложений изображений следующего поколения.

Продвинутая обработка сигналов: Интеграция продвинутой обработки сигналов позволяет этим датчикам выполнять сложную обработку изображений и их улучшение на лету. Такой подход снижает нагрузку на внешние устройства и неоценим для приложений, требующих низкой задержки или обработки в реальном времени, таких как системы безопасности автомобилей.

Обработка на основе Edge AI: Эти датчики могут выполнять сложный анализ данных и принятие решений непосредственно на устройстве за счет интеграции обработки на основе Edge AI. Обработка на краю сети может оптимизировать энергоэффективность, снизить задержку и позволить интеллектуально фильтровать данные.

Технические вызовы

Хотя датчики изображения с улучшением за счет ИИ представляют собой значительный прогресс в технологии машинного зрения, инженеры сталкиваются с несколькими техническими вызовами, которые необходимо учитывать при проектировании системы, включая: 

Потребление энергии остается основным ограничением: Интеграция возможностей обработки ИИ с традиционными функциями изображения значительно увеличивает энергопотребление датчика. Это может привести к проблемам с тепловым управлением, особенно в компактных устройствах, где варианты рассеивания тепла ограничены. Например, непрерывная обработка ИИ может привести к повышению температуры датчика, потенциально влияя на качество изображения и требуя сложных техник теплового управления.

Ограничения производительности существуют в различных условиях эксплуатации и при воздействии окружающей среды: Эти датчики могут испытывать трудности в экстремальных световых условиях. Очень низкая освещенность может вносить шум, влияющий на точность обработки ИИ, в то время как сцены с высоким динамическим диапазоном могут ставить перед датчиком задачу поддержания постоянного обнаружения и классификации объектов. Также на возможности съемки и обработки этих датчиков могут влиять факторы окружающей среды, такие как вибрация, электромагнитные помехи и колебания температуры. 

Необходимо принимать сложные решения по разрешению и обработке: Хотя эти датчики могут выполнять впечатляющий анализ прямо на чипе, им необходимо находить баланс между требованиями к качеству изображения, скорости обработки и потреблению энергии. Это часто приводит к компромиссам – например, для достижения обработки в реальном времени может потребоваться снижение разрешения или ограничение сложности алгоритмов ИИ.

Ограничения моделей ИИ представляют собой еще одну проблему: Вычислительные ресурсы, доступные на чипе, ограничивают размер и сложность нейронных сетей, которые могут быть развернуты, часто требуя значительного сжатия модели и оптимизации. Инженерам необходимо находить баланс между сложностью модели, скоростью вывода и требованиями к точности – например, модель, оптимизированная для обнаружения пешеходов в реальном времени, может потребоваться жертвовать способностью классифицировать тонкие особенности. Кроме того, обновление моделей ИИ в уже развернутых датчиках должно укладываться в существующие ограничения памяти и обработки, сохраняя при этом надежность.

Размер пикселя и квантовая эффективность создают свои собственные проектные задачи: По мере того, как производители стремятся к повышению разрешения и увеличению возможностей обработки ИИ, уменьшение размера пикселей может снижать светочувствительность и динамический диапазон, в то время как увеличение размера пикселей ограничивает общее разрешение датчика. Квантовая эффективность – то, насколько эффективно пиксели преобразуют свет в электрические сигналы – становится критически важной в условиях низкой освещенности или когда требуется точная цветопередача. Улучшения в одной области часто достигаются за счет других, например, увеличение размера пикселя для лучшей светочувствительности и уменьшение пространства, доступного для на-чиповых схем обработки ИИ.

Ограничения по обработке и хранению данных добавляют еще больше сложности: Эти датчики генерируют огромные объемы данных, которые требуют эффективных решений для обработки и хранения. Высокоскоростные, непрерывные потоки данных от датчиков, улучшенных ИИ, могут перегружать традиционные системы передачи данных и иногда требуют специализированных архитектур оборудования и оптимизированных систем управления данными. Инженерам необходимо проектировать архитектуры, способные обрабатывать эти потоки данных, сохраняя при этом обработку в реальном времени. Это может означать внедрение сложных техник сжатия данных и фильтрации для эффективного управления требованиями к пропускной способности.

Machine vision AI artificial intelligence concept

Перспективы на будущее

Искусственно усиленные сенсоры изображения представляют собой значительный скачок вперед в технологии машинного зрения, и данная область развивается стремительно. По мере того как производители совершенствуют техники миниатюризации и повышают энергоэффективность, эти сенсоры будут продолжать становиться более сложными и доступными. Хотя текущие применения варьируются от точного сельского хозяйства до консервации искусства, полный потенциал технологии остается в значительной степени неисследованным, с новыми случаями использования, возникающими ежедневно в различных отраслях.

Профессионалы в области электроники должны внимательно следить за этими разработками, чтобы сохранять свое конкурентное преимущество. Те, кто понимает как технические ограничения, так и выдающиеся возможности этих сенсоров, будут лидировать в следующей волне инноваций, создавая системы, которые сужают разрыв между человеческим и машинным зрением. По мере созревания этих технологий они обещают решать сложные задачи реального мира способами, о которых сегодняшние инженеры только начинают задумываться.

Об авторе

Об авторе

Adam Fleischer is a principal at etimes.com, a technology marketing consultancy that works with technology leaders – like Microsoft, SAP, IBM, and Arrow Electronics – as well as with small high-growth companies. Adam has been a tech geek since programming a lunar landing game on a DEC mainframe as a kid. Adam founded and for a decade acted as CEO of E.ON Interactive, a boutique award-winning creative interactive design agency in Silicon Valley. He holds an MBA from Stanford’s Graduate School of Business and a B.A. from Columbia University. Adam also has a background in performance magic and is currently on the executive team organizing an international conference on how performance magic inspires creativity in technology and science. 

Связанные ресурсы

Вернуться на главную
Thank you, you are now subscribed to updates.