Нейросети учатся видеть мир

Нейросети учатся видеть мир

27.05.2021

Время прочтения - 7 мин.

Одним из активно развивающихся направлений технологии искусственного интеллекта (ИИ) является компьютерное зрение (Computer vision, CV), успешно внедряемое в медицину, промышленность и финансовую сферу. К 2025 году эксперты предсказывают рост этого рынка до $33 млрд.

Все начинается с понимания сути

Компьютерное зрение — это фиксация, обработка и распознавание изображений с помощью ПК. Первые попытки помочь машине увидеть и понять картинку предпринимались еще в 70-х годах прошлого века. Но только сейчас CV-технологии нашли практическое применение в различных отраслях промышленности и быту — прежде всего благодаря появлению техники с высокими характеристиками:

  • вычислительной мощности;
  • объема памяти;
  • разрешающей способности видеокамер;
  • ширины каналов связи.

Разработки машинного обучения и искусственного интеллекта на базе мощной компьютерной техники дали серьезный толчок в развитии CV-продуктов.

Существует несколько ключевых факторов, влияющих на рост интереса к этому направлению:

  • Ужесточение требований к безопасности труда, организации охраны и контролю качества на производстве и в сфере услуг.
  • Оптимизация деловых процессов.
  • Внедрение автоматизации во всех аспектах бизнес-деятельности для повышения продуктивности труда.
  • Постепенное удешевление продуктов на основе CV-технологий.
  • Увеличение скорости анализа изображений.
  • Быстрая адаптация CV-разработок под конкретные практические нужды.
  • Более качественная работа алгоритмов распознавания и идентификации объектов.
  • Наступление пандемии, значительно ускорившей интегрирование новых технологий в различные сферы.

Однако существуют и обстоятельства, препятствующие проникновению компьютерного зрения в производственные процессы, бизнес и повседневную жизни. К ним относят:

  • Недооценка необходимости. Многие специалисты, ответственные за интеграцию инноваций, не понимают, зачем компьютеру зрение, и как его можно использовать.
  • Отсутствие нормального ценообразования. Эта сфера находится в самом начале своего пути, рынок появился всего несколько лет назад. Многие разработчики не имеют возможности правильно оценить стоимость своего продукта и, соответственно, создать успешную бизнес-модель для его продвижения.
  • Отсутствие специалистов. Технология CV требовательна к квалификации работника для правильной настройки, запуска и масштабирования. Нехватка таких кадров приводит к печальным последствиям — у бизнеса есть желание использовать технологию, но нет того, кто подскажет, как.
  • Высокие затраты на разработку персонализированных решений. Дороговизна не дает шансов на внедрение CV в малый и средний бизнес. Пока только крупные корпорации могут финансировать научные изыскания в этой области.
  • Требования к оборудованию. Для работы большинства CV-решений в режиме реального времени необходима высокоскоростная помехоустойчивая линия связи, создание которой не всегда финансово оправдано.

Поле применения — необъятно

Наибольшее применение технологии компьютерного зрения сегодня находят в производстве, медицине, продажах и финансовой сфере.

В промышленности это направление интересно тем, что способно без усталости и гораздо быстрее человека выполнять рутинные операции. Например, отбраковывать детали прямо на конвейере. Конечно, на первых порах использование компьютерного зрения не дает 100% гарантии определения всех дефектных изделий. Возможны ошибки. Человек сделает такую работу качественнее, но это займет намного больше времени. При использовании самообучающейся нейросети со временем качество «машинного глаза» будет улучшаться.

Еще одной важной областью применения CV в промышленности является надзор за соблюдением установленных норм и предписаний. Например, в строительстве. Если рабочий выйдет на объект без защитной каски, система подаст предупреждающий сигнал не только такому сотруднику, но и его непосредственному начальству. Или контроль за соблюдением определенного алгоритма действий при каких-либо операциях. При пропуске процедуры, находящейся в чек-листе, машина предупредит о наступлении потенциальных негативных последствий.

Задачи учета и логистики также успешно решаются с помощью CV. Уже сегодня готовые программы для распределения товара по его маркировке предлагают на рынке сразу несколько разработчиков.

В медицине тоже присутствует множество рутинных операций, которые требуют однообразных и часто повторяющихся действий. Например, распределение пациентов или первичная обработка снимков компьютерной томографии. Так, продукт Microsoft — Inner Eye — предназначен для быстрого поиска новообразований по результатам МРТ.

А вот в Gauss Surgical создали другую систему. С помощью анализа наполняемости медицинских губок она сообщает о необходимости переливания крови при серьезной кровопотере. CV ведет и подсчет использованных медицинских материалов. Это не позволит хирургу оставить их в операционной ране пациента.

С помощью технологий компьютерного зрения, когда действия людей дополняют роботы, развивается и телемедицина.

Продажи. Крупные поставщики продукции в розничные сети взяли на вооружение технологии CV для повышения качества работы торговых представителей. Компьютерное зрение контролирует расположение товара, его количество и наличие информации об актуальных ценах и акциях. И на все это уходит пара минут. Мерчендайзер только фотографирует витрину специальным прибором, и система сама сравнивает данные с эталоном и дает рекомендации относительно ассортимента для следующего заказа. Так, компания Mars использовала VC в тестовом режиме в некоторых супермаркетах в Казахстане. После оценки полученных результатов было принято решение о запуске аналогичных проектов в других странах.

Компьютерное зрение в ритейле может также анализировать посещаемость торговой точки, искать «места притяжения» покупателей, оценивать среднее время пребывания их в очереди. Все это дает возможность понять, что интересует клиентов, и с помощью оптимизации процесса уменьшить время обслуживания.

Не отстает и финансовая сфера. В США сразу несколько банков (Chase, City National Bank of Florida, Wells Fargo) сообщили о подключении CV-технологий. Финансисты используют возможности компьютера для анализа предпочтений клиентов, контроля за действиями сотрудников, отслеживанием подозрительных личностей у банкоматов.

«Мы уже используем распознавание лиц в своих смартфонах. Почему бы не перенести эту возможность в реальный мир?» — говорит директор по информационной безопасности City National Bank of Florida Бобби Домингес.

По его словам, компания уже в следующем году протестирует CV-комплекс для идентификации клиентов в филиалах. Это позволит уйти от менее безопасных и популярных способов аутентификации. Бобби Домингес считает, что когда-нибудь система сможет самостоятельно выявлять людей, находящихся в розыске.

Несмотря на многочисленную критику подобной практики, банки планируют по крайней мере изучать в тестовом виде ее специфику. Основное недовольство вызывают угрозы гражданским правам и свободам. Противники приводят в пример несколько случаев ареста невиновных людей, личности которых были идентифицированы ошибочно.

Серьезные вопросы вызывают и другие факторы:

  • избирательность по отношению к социальному статусу и цвету кожи человека;
  • потеря конфиденциальности частной жизни граждан.

Банкиры утверждают, что эти нюансы учтены.

«Мы никогда не ставим под угрозу конфиденциальность клиентов, а приступаем к пробному тестированию технологий, уже используемых в других странах. Можно ожидать их скорейшей интеграции в банковскую сеть США», — говорит Домингес.

Еще один вариант применения CV заключается в анализе предпочтений клиентов, необходимом для изменения интерьера филиалов и распределения нагрузки среди сотрудников. Так посетители смогут чувствовать себя максимально комфортно.

Перспективным выглядит и использование компьютерного зрения для идентификации клиентов с целью предоставления им таргетированных финансовых услуг. Например, при достаточном уровне развития технологии станет возможным оформление займа без необходимости предъявлять бумажное удостоверение личности. Важной задачей при этом будет исключение возможности принятия ошибочных решений, например, при использовании чужой фотографии или 3D-маски злоумышленником.

Ожидаемые перспективы

Определить точно, каков объем рынка CV-систем, непросто. Каждая аналитическая компания считает его по-своему. Все дело в том, что нет единого мнения, какие же функции должны быть включены в обработку. Некоторые эксперты отдельно учитывают рынок распознавания образов, а другие включают его в общую картину. И подобных примеров много.

По оценке Market Research Future, объем мирового рынка технологий компьютерного зрения в 2017 году составлял $9 млрд. К 2023 году он превысит $40 млрд. Их коллеги по цеху Marketsandmarkets в оценках скромнее: в 2017 году показатель достиг $3,6 млрд, а в 2023 году приблизится к $25 млрд. При этом наибольшие темпы роста продемонстрируют

Азиатско-Тихоокеанский регион (8% в год), США (5%) и Европа (4%).

Аналогичный разброс наблюдается и в оценке региональных рынков CV-систем. Например, для России называют цифры от ₽1 до ₽30 млрд в 2020 году с ростом до ₽5–100 млрд к 2025 году.

 

 

Наибольшую долю рынка CV занимает сегмент видеонаблюдения и безопасности (32%). И только затем следует производство и медицина (17% и 14% соответственно). Но в абсолютных величинах эта сфера даже в РФ едва дотягивает до 1% от мирового уровня, не говоря уже про другие страны из бывшего СССР.

В любом случае рынок компьютерного зрения (да и вообще рынок ИИ) сегодня является одним из наиболее динамично развивающихся. Он интересен бизнесу, что позволяет рассчитывать на серьезное финансирование стартапов в этом направлении.

Подпишись на наш телеграм канал

только самое важное и интересное

Подписаться
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Читать также

Хроники Джи: часы с датчиком температуры и умные грузовики

Хроники Джи: часы с датчиком температуры и умные грузовики

Apple Watch Series 8 смогут определять, повышена ли у человека температура тела, Google удалит данные пользователей о посещениях клиник, делающих аборты, а на дорогах США появятся грузовики без водителей в салоне. «Доктор» Apple Watch  Apple Watch Series 8 будут оснащены датчиком температуры тела, который может определить, есть ли у владельца жар, говорится в отчете аналитика IT-сферы Марка Гурмана из Bloomberg.  Гурман считает, что вместо того, чтобы давать человеку точные показания, часы до...

вчера

Цукерберг и Meta отказываются от криптопроекта Novi

Цукерберг и Meta отказываются от криптопроекта Novi

Марк Цукерберг и его компания Meta Platforms решили закрыть с 1 сентября проект цифровых платежей Novi. Об этом сообщает The Street. Цукерберг удачно выбрал момент: криптосектор сейчас переживает беспрецедентный кризис доверия, отмеченный падением цен на цифровые валюты. Согласно данным CoinGecko, BTC потерял уже 71,3% своей стоимости с момента исторического максимума 10 ноября. ETH также упал на 78% по сравнению со своим максимумом ноября. В целом рынок криптовалют лишился более $2,1 трлн за в...

вчера

Хроники Джи: киберспорт, VR и первые злодеи метавселенной

Хроники Джи: киберспорт, VR и первые злодеи метавселенной

Рассказываем о новом бренде для кибергеймеров от Sony, новых возможностях для обладателей очков виртуальной реальности Quest 2 V, и о том, как владелец Meta — Марк Цукерберг хочет обложить обитателей метавселенной новыми налогами.  

1 июля 2022 г.

Облачный майнинг: как получить выгоду и избежать рисков

Облачный майнинг: как получить выгоду и избежать рисков

Cloud mining — процесс использования удаленного центра обработки данных для добычи криптовалют. В этом случае вы не сами им занимаетесь, а нанимаете для выполнения работы третьих лиц. И вам не нужно покупать и обслуживать специальные майнинговые установки или запускать блокчейн-узел. Разберемся в вопросе подробнее. Есть нюансы При облачном майнинге участники обычно арендуют либо оборудование, либо хеш-мощность. Владелец при этом должен иметь ферму или управлять ею. В идеале поставщик услуги и...

26 июня 2022 г.

Meta и другие IT-гиганты разрабатывают стандарты для метавселенных

Meta и другие IT-гиганты разрабатывают стандарты для метавселенных

Meta, Microsoft и другие технологические гиганты, стремящиеся создать новую концепцию метавселенной, сформировали группу содействия разработке отраслевых стандартов, которые сделают зарождающиеся цифровые миры компаний совместимыми друг с другом. Об этом сообщает Reuters.  В число участников форума по стандартам Metaverse входят многие крупнейшие компании, работающие в этой области. К ним относятся и производители чипов для игровых компаний, и признанные органы по установлению стандартов, такие...

22 июня 2022 г.

Как заработать на блокчейне?

Как заработать на блокчейне?

Блокчейн — это революционная технология, которая может улучшить такие сферы, как логистика, медицина, торговля и другие. В каких областях сегодня наиболее популярен заработок на блокчейне?

15 июня 2022 г.

{"type":"article","id":1705,"isAuthenticated":false,"user":null}