Нажмите "Enter", чтобы перейти к контенту

Студенты научатся распознавать – Наука – Коммерсантъ

Университет ИТМО вместе с компанией-разработчиком ПО Napoleon IT запустил специализацию в магистратуре по компьютерному зрению. Выпускники этого профиля смогут работать в проектах, связанных с распознаванием лиц и объектов на фото и видео.

Сложно придумать область, в которой сейчас бы не велись эксперименты с внедрением технологий компьютерного зрения. Спрос на специалистов в области компьютерного зрения постоянно растет: для отрасли нужны не только те, кто способен решать научные задачи, но и может «упаковывать» результаты лабораторных экспериментов в коммерческие продукты. Именно поэтому Университет ИТМО и компания Napoleon IT открыли специализацию «Компьютерное зрение» в магистерской программе «Инфокоммуникации и цифровые медиа».

Поскольку компьютерное зрение основано на машинном обучении, то подготовка будет вестись именно по этому направлению. Базовые дисциплины посвящены глубокому обучению, нейросетевым моделям, их архитектуре. Студенты научатся решать задачи по анализу изображения, распознаванию объектов на статичных фотографиях и их отслеживанию на видео. Отдельный блок занятий посвящен IT-проектам — студентам расскажут о принципах управления командой разработчиков. Выпускники программы смогут построить карьеру в области Data Science, машинного обучения, компьютерного зрения и претендовать на позиции аналитика данных, бэкенд-разработчика в этой сфере. Технологии компьютерного зрения активно используются в системах распознавания лиц, объектов, контроля качества на предприятиях и генерации изображений и видео — именно такие программы позволяют заменять лица актеров в кино.

Об особенностях обучения и карьерных перспективах для студентов нового профиля рассказывают Дмитрий Ботов, руководитель специализации «Компьютерное зрение» на магистерской программе ИТМО, и Павел Подкорытов, СЕО Napoleon IT.


— Компьютерное зрение (или машинное зрение) — это направление искусственного интеллекта, в котором методы и алгоритмы машинного обучения применяют к задачам распознавания, отслеживания и классификации объектов на изображениях или в видеопотоке. В 2010-х годах произошла революция в этой области, когда глубокие нейронные сети в задачах распознавания объектов превзошли по точности человека. Машинное зрение в отдельных задачах и областях превзошло биологические возможности людей, что предопределило бум применения технологий в различных отраслях.

— На основе технологий компьютерного зрения создаются системы видеоаналитики — например, для распознавания лиц, подсчета посетителей, отслеживания и контроля применения средств индивидуальной защиты на производстве. Метод может упростить управление технологическими процессами на предприятиях, к примеру, при выявлении брака производимых деталей на конвейере, подсчете и сортировке деталей.

Компьютерное зрение применяется в интеллектуальных геоинформационных системах: с его помощью можно распознавать объекты на спутниковых снимках, анализировать автомобильный трафик на дорожных перекрестках.

Не менее популярна эта технология в сферах творчества и развлечений. И речь не только про восстановление изображений и раскрашивание черно-белых фильмов. Картины, «нарисованные» алгоритмами искусственного интеллекта, уже продаются за миллионы долларов на аукционах, очевидно, тренд набирает обороты. А различные фильтры и маски для фото и видео в социальных сетях применял, пожалуй, каждый владелец смартфона.

— В области безопасности как один из важных инструментов контроля доступа и определения потенциально опасных действий. Уже сейчас тысячи преступлений оперативно раскрыты благодаря внедрению решений с компьютерным зрением в системы видеонаблюдения.

В сфере медицины — для помощи в МРТ-диагностике аномалий на рентгеновских снимках.

В области синтетических медиа нейронные сети позволяют генерировать уникальные лица, имитировать человеческие эмоции, создавая эффект общения с живым человеком, твоим персональным аватаром, созданным для конкретного пользователя.

В ритейле, логистике и промышленности технология компьютерного зрения используется для распознавания товаров на полках, контроля заполнения складов, управления конвейером.

— В основе образовательного процесса — неразрывное применение изученной теории и фундаментальных принципов на практике в реальных кейсах из индустрии.

Формат перевернутого обучения позволяет избавиться от скучных лекций и максимально эффективно использовать время в аудитории за разбором практических аспектов применения технологий и погружения в нюансы алгоритмов и методов вместе с ведущими специалистами от компании и исследователями Университета ИТМО.

Обучение в ИТМО совмещается с работой по специализации в офисе компании в R&D-командах с дата-сайентистами и разработчиками. Это обеспечивает непрерывный обмен опытом и самыми актуальными знаниями в такой быстроразвивающейся технологической сфере, как искусственный интеллект.

Задача магистратуры — обучить полному циклу разработки систем на основе технологий компьютерного зрения: от сбора данных и предобработки изображений до обучения нейросетевых моделей и разработки бэкендов с машинным обучением на борту для мобильных и веб-приложений.

Студент сможет выбрать тему для научно-исследовательской работы в зависимости от собственных предпочтений, у него будет возможность реализовать прикладное решение с технологиями компьютерного зрения для реального бизнес-кейса либо принять участие в фундаментальном исследовании, чтобы создать собственный алгоритм или нейросетевую архитектуру для новой технологии, которая сможет стать основой для новых AI-продуктов одного из технологических гигантов IТ-отрасли.


— Огромную часть в цифровизации продуктов и услуг сыграет именно компьютерное зрение. Буквально все, что нас окружает, может стать эффективнее, безопаснее с помощью технологий машинного зрения. Представьте только, сколько освободится времени, когда нам не придется отдавать свой самый ценный ресурс, время, внимание на ежедневные пробки и рутинные дела. Большой потенциал машинного обучения может быть раскрыт в медицинских задачах: повышение точности диагностики медицинских снимков, думаю, может спасти миллионы жизней.

— Важное направление в IT-сфере связано с компрессией, то есть сжатием нейронных моделей. Здесь допустима аналогия с программой WinRAR для сжатия файлов. Самый простой пример — обработка технологии компьютерного зрения на «умных» устройствах без раскрытия информации с облачными сервисами.

Еще одним трендом станет генерация синтетических данных для обучения нейронных моделей компьютерного зрения, что позволит повысить скорость обучения и точность работы последних.

— Мы ориентируемся как раз в подготовке на глобальные тренды. Наша специализация открывает большие карьерные возможности для будущих экспертов в области анализа данных и компьютерного зрения. Студенты нашего профиля смогут во время учебы практиковаться на текущих задачах компании — от промышленной безопасности до контроля качества в процессах предоставления услуг.

Источник: Коммерсант