Продолжаем в ютубчег

Итак. Сегодня поговорим почему системы распознавания номеров не работают на практике. И ведь проблемы опять те же самые, что и всегда! Плохое качество картинки, люди пытаются использовать оценочные суждения, не понимая что они могут быть неправы.

Заказчики в CV, какие они бывают

Эта статья – некоторое обобщение опыта, который появился у меня за последние лет 10. Я не претендую что он однозначно правильный. Или на то, что наша стратегия единственная рабочая. Но для себя я его использую как некоторую априорную оценку того имеет шанс на жизнь договор или нет.

Continue reading “Заказчики в CV, какие они бывают”

Новый формат?

Решил сделать несколько видео на те темы, на которые всё не хватает времени написать нормальную статью. Начнём с банальной темы по распознаванию по лицам!
Почему они не работают?

Как стать DS’ом за пять минут?

Обилие курсов по машинному обучению в последнее время поражает. Разве что на заборах не пишут “стань ML экспертом за пять минут” . Есть реклама на Хабр, таргетированная реклама вконтакте. Крупные институты создают открытые курсы. Число online платных и бесплатных лекций зашкаливает. Но есть ли смысл в этом всем? Имеет ли смысл идти на эти курсы? Может ли информация которую там рассказывают принести пользу?

Continue reading “Как стать DS’ом за пять минут?”

И ещё раз про базы данных

Краткий обзор вещей по датасетам на которые я наталкивался в последний год.

Я думаю, что все прекрасно понимают, что в нормальной работе по ComputerVision 80% работы может занимать взаимодействие с базой (картинку с заглавия утащил отсюда).  Создание базы, разметка, выбор критериев, создание загрузки, модели зашумления, и.т.д. Конечно, я видел случаи, когда это и 95% занимает (медицина), и 20%(использование открытых датасетов). Всякое бывает.
Решил запечатлеть несколько вещей, на которые я натыкался в последний год.

Continue reading “И ещё раз про базы данных”

GAN и компьютерные игры

Натолкнулся на то, чем сам развлекался месяца три назад:
https://towardsdatascience.com/turning-fortnite-into-pubg-with-deep-learning-cyclegan-2f9d339dcdb0
Товарищ циклическим GAN’ом перетринировал видео Fortnit’a в PUBG. Я перетренировывал PUBG чтобы на картах был снег:



Про Fortnite я тоже подумал, но я его не так люблю чтобы собирать датасет подробный (кстати, если кому нужен датасет на ПУБГ/зиму – могу скинуть):


Мне кажется, что это интересное направление. Нейросети ещё не дошли до компьютерных игр и графики реального времени. Но рано или поздно они должны там быть.
Уже есть много проектов, которые улучшают разрешение. Добавляют ХДР на изображение. Конечно, в играх это проще делать другими способами. Но ведь очевидно, что рано или поздно появиться идея как можно в игры добавить какую-нибудь фишку с сетями которая зацепит. Главное найти какую:)
Мне нравиться что люди ищут. Может интересные карты научаться. Может более красивые изображения.

Про распознавание флюорограмм

В последнее время, как мне кажется, писать статьи по машинному обучению стало некоторой пошлостью. Раньше любая статья воспринималась как какая-то магия, а сейчас все более-менее устаканилось. Кто-то пишет статьи для новичков. Кто-то обзор технологий. Кто-то пытается написать специализированные статьи по новым разработкам. Но их читает полтора человека. Новизны практически нет.

Пожалуй единственный жанр, который мне остался интересен – статьи про то как на базе ML разрабатывается и внедряется технология. Процессы каждый раз могут быть кардинально отличающимися.

Continue reading “Про распознавание флюорограмм”

Машины для DL

Наблюдения последнего времени.

Вы разворачиваете небольшой Computer Vision проект. Для себя, для заказчика, или ещё для кого.  Вам нужен сервер для обучения. Понятно, что в ходе эксплуатации сервер будет применяться. И для постоянного переобучения. И, возможно, для внедрения. Как его сделать?
Есть пара подходов:

  • Аренда облака – Amazon, Azure, Google
  • Аренда сервера с GPU
  • Сборка своего сервера

Во-первых, я выскажу свои мысли на тему того что по нашему опыту получалось лучше. Во-вторых, любопытно послушать мнение читателей кто что использует.

Continue reading “Машины для DL”

Структура взаимодействия с заказчиками в задачах DL

Раз уж начали в одном из старых постов. Одна из тем про которые я давным давно хочу написать, но не доходят руки – организация взаимодействия при решении задач машинного зрения/обучения. Проблема не так проста как кажется на первый взгляд.

Continue reading “Структура взаимодействия с заказчиками в задачах DL”

CapsNet

Я думаю, что большая часть моих читателей уже видела последнюю работу Хинтона – Dynamic Routing Between Capsules. (ещё есть вторая статья)

Интересно, пробовал ли кто-то разобраться и вникнуть. Я немного попробовал и вот что вышло:
Continue reading “CapsNet”