Нейросети учатся видеть мир

Нейросети учатся видеть мир

27.05.2021

Время прочтения - 7 мин.

Одним из активно развивающихся направлений технологии искусственного интеллекта (ИИ) является компьютерное зрение (Computer vision, CV), успешно внедряемое в медицину, промышленность и финансовую сферу. К 2025 году эксперты предсказывают рост этого рынка до $33 млрд.

Все начинается с понимания сути

Компьютерное зрение — это фиксация, обработка и распознавание изображений с помощью ПК. Первые попытки помочь машине увидеть и понять картинку предпринимались еще в 70-х годах прошлого века. Но только сейчас CV-технологии нашли практическое применение в различных отраслях промышленности и быту — прежде всего благодаря появлению техники с высокими характеристиками:

  • вычислительной мощности;
  • объема памяти;
  • разрешающей способности видеокамер;
  • ширины каналов связи.

Разработки машинного обучения и искусственного интеллекта на базе мощной компьютерной техники дали серьезный толчок в развитии CV-продуктов.

Существует несколько ключевых факторов, влияющих на рост интереса к этому направлению:

  • Ужесточение требований к безопасности труда, организации охраны и контролю качества на производстве и в сфере услуг.
  • Оптимизация деловых процессов.
  • Внедрение автоматизации во всех аспектах бизнес-деятельности для повышения продуктивности труда.
  • Постепенное удешевление продуктов на основе CV-технологий.
  • Увеличение скорости анализа изображений.
  • Быстрая адаптация CV-разработок под конкретные практические нужды.
  • Более качественная работа алгоритмов распознавания и идентификации объектов.
  • Наступление пандемии, значительно ускорившей интегрирование новых технологий в различные сферы.

Однако существуют и обстоятельства, препятствующие проникновению компьютерного зрения в производственные процессы, бизнес и повседневную жизни. К ним относят:

  • Недооценка необходимости. Многие специалисты, ответственные за интеграцию инноваций, не понимают, зачем компьютеру зрение, и как его можно использовать.
  • Отсутствие нормального ценообразования. Эта сфера находится в самом начале своего пути, рынок появился всего несколько лет назад. Многие разработчики не имеют возможности правильно оценить стоимость своего продукта и, соответственно, создать успешную бизнес-модель для его продвижения.
  • Отсутствие специалистов. Технология CV требовательна к квалификации работника для правильной настройки, запуска и масштабирования. Нехватка таких кадров приводит к печальным последствиям — у бизнеса есть желание использовать технологию, но нет того, кто подскажет, как.
  • Высокие затраты на разработку персонализированных решений. Дороговизна не дает шансов на внедрение CV в малый и средний бизнес. Пока только крупные корпорации могут финансировать научные изыскания в этой области.
  • Требования к оборудованию. Для работы большинства CV-решений в режиме реального времени необходима высокоскоростная помехоустойчивая линия связи, создание которой не всегда финансово оправдано.

Поле применения — необъятно

Наибольшее применение технологии компьютерного зрения сегодня находят в производстве, медицине, продажах и финансовой сфере.

В промышленности это направление интересно тем, что способно без усталости и гораздо быстрее человека выполнять рутинные операции. Например, отбраковывать детали прямо на конвейере. Конечно, на первых порах использование компьютерного зрения не дает 100% гарантии определения всех дефектных изделий. Возможны ошибки. Человек сделает такую работу качественнее, но это займет намного больше времени. При использовании самообучающейся нейросети со временем качество «машинного глаза» будет улучшаться.

Еще одной важной областью применения CV в промышленности является надзор за соблюдением установленных норм и предписаний. Например, в строительстве. Если рабочий выйдет на объект без защитной каски, система подаст предупреждающий сигнал не только такому сотруднику, но и его непосредственному начальству. Или контроль за соблюдением определенного алгоритма действий при каких-либо операциях. При пропуске процедуры, находящейся в чек-листе, машина предупредит о наступлении потенциальных негативных последствий.

Задачи учета и логистики также успешно решаются с помощью CV. Уже сегодня готовые программы для распределения товара по его маркировке предлагают на рынке сразу несколько разработчиков.

В медицине тоже присутствует множество рутинных операций, которые требуют однообразных и часто повторяющихся действий. Например, распределение пациентов или первичная обработка снимков компьютерной томографии. Так, продукт Microsoft — Inner Eye — предназначен для быстрого поиска новообразований по результатам МРТ.

А вот в Gauss Surgical создали другую систему. С помощью анализа наполняемости медицинских губок она сообщает о необходимости переливания крови при серьезной кровопотере. CV ведет и подсчет использованных медицинских материалов. Это не позволит хирургу оставить их в операционной ране пациента.

С помощью технологий компьютерного зрения, когда действия людей дополняют роботы, развивается и телемедицина.

Продажи. Крупные поставщики продукции в розничные сети взяли на вооружение технологии CV для повышения качества работы торговых представителей. Компьютерное зрение контролирует расположение товара, его количество и наличие информации об актуальных ценах и акциях. И на все это уходит пара минут. Мерчендайзер только фотографирует витрину специальным прибором, и система сама сравнивает данные с эталоном и дает рекомендации относительно ассортимента для следующего заказа. Так, компания Mars использовала VC в тестовом режиме в некоторых супермаркетах в Казахстане. После оценки полученных результатов было принято решение о запуске аналогичных проектов в других странах.

Компьютерное зрение в ритейле может также анализировать посещаемость торговой точки, искать «места притяжения» покупателей, оценивать среднее время пребывания их в очереди. Все это дает возможность понять, что интересует клиентов, и с помощью оптимизации процесса уменьшить время обслуживания.

Не отстает и финансовая сфера. В США сразу несколько банков (Chase, City National Bank of Florida, Wells Fargo) сообщили о подключении CV-технологий. Финансисты используют возможности компьютера для анализа предпочтений клиентов, контроля за действиями сотрудников, отслеживанием подозрительных личностей у банкоматов.

«Мы уже используем распознавание лиц в своих смартфонах. Почему бы не перенести эту возможность в реальный мир?» — говорит директор по информационной безопасности City National Bank of Florida Бобби Домингес.

По его словам, компания уже в следующем году протестирует CV-комплекс для идентификации клиентов в филиалах. Это позволит уйти от менее безопасных и популярных способов аутентификации. Бобби Домингес считает, что когда-нибудь система сможет самостоятельно выявлять людей, находящихся в розыске.

Несмотря на многочисленную критику подобной практики, банки планируют по крайней мере изучать в тестовом виде ее специфику. Основное недовольство вызывают угрозы гражданским правам и свободам. Противники приводят в пример несколько случаев ареста невиновных людей, личности которых были идентифицированы ошибочно.

Серьезные вопросы вызывают и другие факторы:

  • избирательность по отношению к социальному статусу и цвету кожи человека;
  • потеря конфиденциальности частной жизни граждан.

Банкиры утверждают, что эти нюансы учтены.

«Мы никогда не ставим под угрозу конфиденциальность клиентов, а приступаем к пробному тестированию технологий, уже используемых в других странах. Можно ожидать их скорейшей интеграции в банковскую сеть США», — говорит Домингес.

Еще один вариант применения CV заключается в анализе предпочтений клиентов, необходимом для изменения интерьера филиалов и распределения нагрузки среди сотрудников. Так посетители смогут чувствовать себя максимально комфортно.

Перспективным выглядит и использование компьютерного зрения для идентификации клиентов с целью предоставления им таргетированных финансовых услуг. Например, при достаточном уровне развития технологии станет возможным оформление займа без необходимости предъявлять бумажное удостоверение личности. Важной задачей при этом будет исключение возможности принятия ошибочных решений, например, при использовании чужой фотографии или 3D-маски злоумышленником.

Ожидаемые перспективы

Определить точно, каков объем рынка CV-систем, непросто. Каждая аналитическая компания считает его по-своему. Все дело в том, что нет единого мнения, какие же функции должны быть включены в обработку. Некоторые эксперты отдельно учитывают рынок распознавания образов, а другие включают его в общую картину. И подобных примеров много.

По оценке Market Research Future, объем мирового рынка технологий компьютерного зрения в 2017 году составлял $9 млрд. К 2023 году он превысит $40 млрд. Их коллеги по цеху Marketsandmarkets в оценках скромнее: в 2017 году показатель достиг $3,6 млрд, а в 2023 году приблизится к $25 млрд. При этом наибольшие темпы роста продемонстрируют

Азиатско-Тихоокеанский регион (8% в год), США (5%) и Европа (4%).

Аналогичный разброс наблюдается и в оценке региональных рынков CV-систем. Например, для России называют цифры от ₽1 до ₽30 млрд в 2020 году с ростом до ₽5–100 млрд к 2025 году.

 

 

Наибольшую долю рынка CV занимает сегмент видеонаблюдения и безопасности (32%). И только затем следует производство и медицина (17% и 14% соответственно). Но в абсолютных величинах эта сфера даже в РФ едва дотягивает до 1% от мирового уровня, не говоря уже про другие страны из бывшего СССР.

В любом случае рынок компьютерного зрения (да и вообще рынок ИИ) сегодня является одним из наиболее динамично развивающихся. Он интересен бизнесу, что позволяет рассчитывать на серьезное финансирование стартапов в этом направлении.

Подпишись на наш телеграм канал

только самое важное и интересное

Подписаться
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Читать также

Шопинг в прямом эфире: магазины на диване — в тренде?

Шопинг в прямом эфире: магазины на диване — в тренде?

Для новых экономических реалий хороши все способы продаж — даже почти забытые live-commerce. Новый формат в этом направлении — привлечение лидеров мнений. Какие перспективы развития индустрии прогнозируют эксперты?

18 октября 2021 г.

Игла Амура: как приложения для знакомств способствуют вакцинации

Игла Амура: как приложения для знакомств способствуют вакцинации

Вакцинироваться или нет? На решение этого вопроса активно влияют различные факторы. К убеждению в необходимости прививок подключились даже сайты знакомств и авиаперевозчики. Чем прогрессивнее страна, тем ощутимее давление. Какие же «плюшки» предлагают за укол? Читайте в нашем материале.

12 октября 2021 г.

Ядерное перевооружение энергетики

Ядерное перевооружение энергетики

Чуть более полувека назад на атомную энергетику множество людей во всем мире возлагали большие надежды. Казалось, что цепная ядерная реакция открывает человечеству неисчерпаемый источник сравнительно дешевой энергии, при этом не будет ни затопления огромных территорий, ни углеродного загрязнения атмосферы... Но с тех пор иллюзии развеяны. Что же предлагает ядерная энергетика сегодня?

9 октября 2021 г.

Поколение 6G: техногиганты нацелены на будущее

Поколение 6G: техногиганты нацелены на будущее

Пока во всем мире полным ходом идет освоение пятого поколения мобильной связи, крупные корпорации уже ставят на следующий стандарт. Его появление будет реальностью в конце текущего десятилетия.

8 октября 2021 г.

Урожай: шесть букв по вертикали

Урожай: шесть букв по вертикали

Рост населения Земли влечет увеличение спроса на продовольствие. Поэтому в последние годы остро встал вопрос эффективности земель аграрного назначения. В результате появились и стали внедряться новые технологии, в числе которых — гидропоника и вертикальное земледелие.

7 октября 2021 г.

Возвращение авосек: Украина вступила в беспластиковую эру

Возвращение авосек: Украина вступила в беспластиковую эру

Полиэтиленовые пакеты в XXI веке получили такое широкое хождение, что начали представлять серьезную проблему для окружающей среды. По данным ООН, если ничего не предпринимать, к середине века человечество будет производить 33 млрд тонн синтетической продукции в год, что в 110 раз превышает сегодняшний объем.

13 июля 2021 г.

Исчезающие татуировки пойдут по рукам

Исчезающие татуировки пойдут по рукам

Стартап Ephemeral Tattoo, разработавший технологию исчезающих со временем татуировок, уже через 4 месяца после открытия первой студии собрал $20 млн и стремится расширить географию на 10–20 локальных рынков. Об этом сегодня, 7 июля, сообщает Bloomberg. Для временных татуировок используются такие же иглы, что и для настоящих. Сама технология нанесения тату не очень отличается от традиционной. Ее изюминкой являются полимерные биорассасывающиеся чернила, которые полностью выцветают за 9–15 месяцев...

7 июля 2021 г.

{"type":"article","id":1705,"isAuthenticated":false,"user":null}