Сайт поисковик по видео MVP(Python,Django+DRF+React,ML)2019-202*
- 5
- 0
- Опубликовано: 2023-11-14
- Анализ положения человека и ключевых точек скелета в кадре(закрытый gitlab, не покажу)
Модель ML- первые 10 слоёв mobilenet v3 (2,9 - 5 млн. параметров ) + слои (25 млн. параметров): привязки частей (PAF, 3шт), тепловых карт расположения частей. (сейчас суммарно 30,909,296 тренеруемых параметров, выдвинутые гипотизы ещё не все проверены)
- Анализ действия человека на основе точек скелета в последовательности 12, 24 кадров. LSTM на несколько десятков входов.
- Самописный генератор данных датасета на лету из базы(pgsql) сайта для тренировки сетей.
- Разметка датасета на 6 000 изображений с изменениями по ходу (пока проверка множества гипотез нет возможности наращивать. Громадную цену переделки датасета знаю. Уже была 2 раза крупная переразметка на 1000 и 1700 изображениях, 6 мелких правок во всём датасете на 2, 2,5 , 4 , 4,5 , 6 , 6, 6 . Переразмечать даже такой небольшой обьем уже дорого)
-Формат COCO, сегментация и расстановка 22 точек тела и 7 точек головы.
Технологии:
=Django (главная, админка, неосновные страницы с подтягиванием содержимого по API через DRF, страницы для React),
= Bootstrap 4,5
=React (видеоплеер для разметки временных отметок и данных)
=React (Главная поисковая страница с кучей форм выпадающими списками и селектами в виде групп изображений, запросом результата через API и выдачей результата поиска)
=ffmpeg (в видеоплеере обрезка и нарезка в маленькие фрагменты видеофайлов, создание и сохранение на сервере скриншотов, отправка по API отметок для экспорта в датасет)
=PostgreSQL (хранение данных разметки датасета, связанных таблиц отдельных видео, отдельных сцен с их описанием, настройки самописных фоновых обработчиков с подобием очереди)
=Поиск по api со стороних ресурсов информации о роликах, импорт информации о выбранных в внутреннюю БД для дальнейшего поиска по ним.
=Ручное тестирование веб сервисов, SEO оптимизация.
=Разметка изображений в COCOannotator, CV