Как мы задачи решаем + исходники сервера разметки

Последние года три большую часть наших доходов составляют различные работы где мы что-то делаем под заказ. Список таких работ проще всего посмотреть тут – http://cvml.ru/ . Есть далеко не все (многие фирмы не хотят светиться лишний раз). Но в целом спектр можно представить. Наверное основное это:

  • Распознавание буквенных и числовых последовательностей (номера/отметки/знаки/символы)
  • Биометрия и её интеграция
  • Детекция различных странных объектов
  • Трекинг объектов

И каждый третий раз делать надо одно и то же:

  1. Собрать данные
  2. Разметить
  3. Обучить модель
  4. Собрать больше данных и найти ошибки
  5. Goto п.2 пока качество неудовлетворительно

Ещё года два назад мы сделали сервер где весь пайплайн был достаточно удобно убран в одну сущность. Есть ли аналоги? Да. Но каждый раз когда смотришь как они устроены кажется “ну почему же всё так сложно”. Понятно, что у нас сдвинут биас. Но всё же нам кажется наш подход весьма симпатичным.
Где-то с прошлой осени мы решили что надо выложить сервер в OpenSource. Лежит он в открытом гитхабе уже месяца 4, но, наконец, решил сделать небольшое описание.

Continue reading “Как мы задачи решаем + исходники сервера разметки”

Машины для DL

Наблюдения последнего времени.

Вы разворачиваете небольшой Computer Vision проект. Для себя, для заказчика, или ещё для кого.  Вам нужен сервер для обучения. Понятно, что в ходе эксплуатации сервер будет применяться. И для постоянного переобучения. И, возможно, для внедрения. Как его сделать?
Есть пара подходов:

  • Аренда облака – Amazon, Azure, Google
  • Аренда сервера с GPU
  • Сборка своего сервера

Во-первых, я выскажу свои мысли на тему того что по нашему опыту получалось лучше. Во-вторых, любопытно послушать мнение читателей кто что использует.

Continue reading “Машины для DL”