Нейросети учатся видеть мир

Нейросети учатся видеть мир

27.05.2021

Время прочтения - 9 мин.

Одним из активно развивающихся направлений технологии искусственного интеллекта (ИИ) является компьютерное зрение (Computer vision, CV), успешно внедряемое в медицину, промышленность и финансовую сферу. К 2025 году эксперты предсказывают рост этого рынка до $33 млрд.

Все начинается с понимания сути

Компьютерное зрение — это фиксация, обработка и распознавание изображений с помощью ПК. Первые попытки помочь машине увидеть и понять картинку предпринимались еще в 70-х годах прошлого века. Но только сейчас CV-технологии нашли практическое применение в различных отраслях промышленности и быту — прежде всего благодаря появлению техники с высокими характеристиками:

  • вычислительной мощности;
  • объема памяти;
  • разрешающей способности видеокамер;
  • ширины каналов связи.

Разработки машинного обучения и искусственного интеллекта на базе мощной компьютерной техники дали серьезный толчок в развитии CV-продуктов.

Существует несколько ключевых факторов, влияющих на рост интереса к этому направлению:

  • Ужесточение требований к безопасности труда, организации охраны и контролю качества на производстве и в сфере услуг.
  • Оптимизация деловых процессов.
  • Внедрение автоматизации во всех аспектах бизнес-деятельности для повышения продуктивности труда.
  • Постепенное удешевление продуктов на основе CV-технологий.
  • Увеличение скорости анализа изображений.
  • Быстрая адаптация CV-разработок под конкретные практические нужды.
  • Более качественная работа алгоритмов распознавания и идентификации объектов.
  • Наступление пандемии, значительно ускорившей интегрирование новых технологий в различные сферы.

Однако существуют и обстоятельства, препятствующие проникновению компьютерного зрения в производственные процессы, бизнес и повседневную жизни. К ним относят:

  • Недооценка необходимости. Многие специалисты, ответственные за интеграцию инноваций, не понимают, зачем компьютеру зрение, и как его можно использовать.
  • Отсутствие нормального ценообразования. Эта сфера находится в самом начале своего пути, рынок появился всего несколько лет назад. Многие разработчики не имеют возможности правильно оценить стоимость своего продукта и, соответственно, создать успешную бизнес-модель для его продвижения.
  • Отсутствие специалистов. Технология CV требовательна к квалификации работника для правильной настройки, запуска и масштабирования. Нехватка таких кадров приводит к печальным последствиям — у бизнеса есть желание использовать технологию, но нет того, кто подскажет, как.
  • Высокие затраты на разработку персонализированных решений. Дороговизна не дает шансов на внедрение CV в малый и средний бизнес. Пока только крупные корпорации могут финансировать научные изыскания в этой области.
  • Требования к оборудованию. Для работы большинства CV-решений в режиме реального времени необходима высокоскоростная помехоустойчивая линия связи, создание которой не всегда финансово оправдано.

Поле применения — необъятно

Наибольшее применение технологии компьютерного зрения сегодня находят в производстве, медицине, продажах и финансовой сфере.

В промышленности это направление интересно тем, что способно без усталости и гораздо быстрее человека выполнять рутинные операции. Например, отбраковывать детали прямо на конвейере. Конечно, на первых порах использование компьютерного зрения не дает 100% гарантии определения всех дефектных изделий. Возможны ошибки. Человек сделает такую работу качественнее, но это займет намного больше времени. При использовании самообучающейся нейросети со временем качество «машинного глаза» будет улучшаться.

Еще одной важной областью применения CV в промышленности является надзор за соблюдением установленных норм и предписаний. Например, в строительстве. Если рабочий выйдет на объект без защитной каски, система подаст предупреждающий сигнал не только такому сотруднику, но и его непосредственному начальству. Или контроль за соблюдением определенного алгоритма действий при каких-либо операциях. При пропуске процедуры, находящейся в чек-листе, машина предупредит о наступлении потенциальных негативных последствий.

Задачи учета и логистики также успешно решаются с помощью CV. Уже сегодня готовые программы для распределения товара по его маркировке предлагают на рынке сразу несколько разработчиков.

В медицине тоже присутствует множество рутинных операций, которые требуют однообразных и часто повторяющихся действий. Например, распределение пациентов или первичная обработка снимков компьютерной томографии. Так, продукт Microsoft — Inner Eye — предназначен для быстрого поиска новообразований по результатам МРТ.

А вот в Gauss Surgical создали другую систему. С помощью анализа наполняемости медицинских губок она сообщает о необходимости переливания крови при серьезной кровопотере. CV ведет и подсчет использованных медицинских материалов. Это не позволит хирургу оставить их в операционной ране пациента.

С помощью технологий компьютерного зрения, когда действия людей дополняют роботы, развивается и телемедицина.

Продажи. Крупные поставщики продукции в розничные сети взяли на вооружение технологии CV для повышения качества работы торговых представителей. Компьютерное зрение контролирует расположение товара, его количество и наличие информации об актуальных ценах и акциях. И на все это уходит пара минут. Мерчендайзер только фотографирует витрину специальным прибором, и система сама сравнивает данные с эталоном и дает рекомендации относительно ассортимента для следующего заказа. Так, компания Mars использовала VC в тестовом режиме в некоторых супермаркетах в Казахстане. После оценки полученных результатов было принято решение о запуске аналогичных проектов в других странах.

Компьютерное зрение в ритейле может также анализировать посещаемость торговой точки, искать «места притяжения» покупателей, оценивать среднее время пребывания их в очереди. Все это дает возможность понять, что интересует клиентов, и с помощью оптимизации процесса уменьшить время обслуживания.

Не отстает и финансовая сфера. В США сразу несколько банков (Chase, City National Bank of Florida, Wells Fargo) сообщили о подключении CV-технологий. Финансисты используют возможности компьютера для анализа предпочтений клиентов, контроля за действиями сотрудников, отслеживанием подозрительных личностей у банкоматов.

«Мы уже используем распознавание лиц в своих смартфонах. Почему бы не перенести эту возможность в реальный мир?» — говорит директор по информационной безопасности City National Bank of Florida Бобби Домингес.

По его словам, компания уже в следующем году протестирует CV-комплекс для идентификации клиентов в филиалах. Это позволит уйти от менее безопасных и популярных способов аутентификации. Бобби Домингес считает, что когда-нибудь система сможет самостоятельно выявлять людей, находящихся в розыске.

Несмотря на многочисленную критику подобной практики, банки планируют по крайней мере изучать в тестовом виде ее специфику. Основное недовольство вызывают угрозы гражданским правам и свободам. Противники приводят в пример несколько случаев ареста невиновных людей, личности которых были идентифицированы ошибочно.

Серьезные вопросы вызывают и другие факторы:

  • избирательность по отношению к социальному статусу и цвету кожи человека;
  • потеря конфиденциальности частной жизни граждан.

Банкиры утверждают, что эти нюансы учтены.

«Мы никогда не ставим под угрозу конфиденциальность клиентов, а приступаем к пробному тестированию технологий, уже используемых в других странах. Можно ожидать их скорейшей интеграции в банковскую сеть США», — говорит Домингес.

Еще один вариант применения CV заключается в анализе предпочтений клиентов, необходимом для изменения интерьера филиалов и распределения нагрузки среди сотрудников. Так посетители смогут чувствовать себя максимально комфортно.

Перспективным выглядит и использование компьютерного зрения для идентификации клиентов с целью предоставления им таргетированных финансовых услуг. Например, при достаточном уровне развития технологии станет возможным оформление займа без необходимости предъявлять бумажное удостоверение личности. Важной задачей при этом будет исключение возможности принятия ошибочных решений, например, при использовании чужой фотографии или 3D-маски злоумышленником.

Ожидаемые перспективы

Определить точно, каков объем рынка CV-систем, непросто. Каждая аналитическая компания считает его по-своему. Все дело в том, что нет единого мнения, какие же функции должны быть включены в обработку. Некоторые эксперты отдельно учитывают рынок распознавания образов, а другие включают его в общую картину. И подобных примеров много.

По оценке Market Research Future, объем мирового рынка технологий компьютерного зрения в 2017 году составлял $9 млрд. К 2023 году он превысит $40 млрд. Их коллеги по цеху Marketsandmarkets в оценках скромнее: в 2017 году показатель достиг $3,6 млрд, а в 2023 году приблизится к $25 млрд. При этом наибольшие темпы роста продемонстрируют

Азиатско-Тихоокеанский регион (8% в год), США (5%) и Европа (4%).

Аналогичный разброс наблюдается и в оценке региональных рынков CV-систем. Например, для России называют цифры от ₽1 до ₽30 млрд в 2020 году с ростом до ₽5–100 млрд к 2025 году.

 

 

Наибольшую долю рынка CV занимает сегмент видеонаблюдения и безопасности (32%). И только затем следует производство и медицина (17% и 14% соответственно). Но в абсолютных величинах эта сфера даже в РФ едва дотягивает до 1% от мирового уровня, не говоря уже про другие страны из бывшего СССР.

В любом случае рынок компьютерного зрения (да и вообще рынок ИИ) сегодня является одним из наиболее динамично развивающихся. Он интересен бизнесу, что позволяет рассчитывать на серьезное финансирование стартапов в этом направлении.

Подпишись на наш телеграм канал

только самое важное и интересное

Подписаться
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Читать также

ИИ в криптосфере: хороший помощник и плохой советчик

ИИ в криптосфере: хороший помощник и плохой советчик

Искусственный интеллект все более активно используется в различных сферах жизнедеятельности. Однако первые эксперименты на крипторынке уже показали несовершенство ИИ как прогнозиста...

29 июня 2023 г.

Мозговой пожар COVID, AI-топливо и лунный корабль Маска

Мозговой пожар COVID, AI-топливо и лунный корабль Маска

Выявлены повышенные риски для переболевших коронавирусом. Искусственный интеллект проектирует экологически чистое топливо. SpaceX готовит к своему первому орбитальному полету крупнейший в истории космический корабль Starship.   

2 ноября 2022 г.

Искусственный интеллект для банка: ТОП-5 сфер эффектного применения

Искусственный интеллект для банка: ТОП-5 сфер эффектного применения

На реальных примерах опишем 5 кейсов использования искусственного интеллекта в банковском секторе. Расскажем, какие блага ИИ может принести банкам, и почему иногда это не только большая выгода, но и огромные репутационные и финансовые риски.

1 ноября 2022 г.

Марсианские бактерии, магнитные импланты и аэротакси Аrcher

Марсианские бактерии, магнитные импланты и аэротакси Аrcher

Была ли жизнь на Марсе? Рано или поздно мы это обязательно узнаем. В США разработали новый тип управления бионическими протезами. Archer Aviation обещает заполонить рынок собственными аэротакси, но китайская XPeng может сделать это несколько раньше.

26 октября 2022 г.

Протокол Lightning Network: пустышка или реально полезное решение?

Протокол Lightning Network: пустышка или реально полезное решение?

Расскажем, как работает Lightning Network — протокол второго уровня для масштабирования биткоина. Проанализируем его метрики, оценим востребованность и перспективность. И ответим на главный вопрос — есть ли практическая польза в LN?

25 октября 2022 г.

Метавселенная на службе Интерпола

Метавселенная на службе Интерпола

Международная организация сообщила, что активно использует возможности метавселенной для взаимодействия между подразделениями и более эффективной борьбы с киберпреступностью. О том, что Интерпол запустил первую в истории метавселенную, специально разработанную для правоохранительных органов, представители ведомства сообщили на 90-й Генеральной ассамблее Интерпола в Нью-Дели.                                               Интерпол презентовал новую метавселенную. Источник — INTERPOL   Необхо...

21 октября 2022 г.

iPad Pro M2, энергия из космоса и победа NASA над звуковым ударом

iPad Pro M2, энергия из космоса и победа NASA над звуковым ударом

Apple хочет показать, что простота — обманчива. Ученые из Калифорнии готовят настоящую революцию в энергетике. А космические инженеры опустились на землю и работают над возобновлением сверхзвуковых перелетов.

19 октября 2022 г.

{"type":"article","id":1705,"isAuthenticated":false,"user":null}