Подобрать и запустить алгоритм обучения 6D Pose Estimation #34
Labels
No labels
bug
construct
design
doc
documentation
duplicate
enhancement
feature
good first issue
help wanted
In Progress
integration
invalid
programming
question
research
schematics
test
wontfix
не срочно
срочно
No milestone
No project
No assignees
1 participant
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference: robossembler/framework#34
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Некоторые варианты алгоритмов 6D pose estimation. Используется RGBD
assigned to @shalenikol
Ознакомился с методикой генерации позиций захвата Grasp Pose Detection (GPD).
Общая структура алгоритма содержит два основных шага:
Использование на 2-м шаге предобученных нейросетей, получивших знания о идеализированных моделях САПР плюс смоделированных глубин этих моделей, даёт возможность количественно оценить успешность позы захвата.
mentioned in issue #39
changed due date to February 14, 2023
changed time estimate to 40h
changed due date to March 14, 2023
mentioned in merge request !15
Исследовал se(3)-TrackNet
Запускается под docker'ом. Датасеты были скачаны, настроены пути для запуска predict.sh
При запуске predict.sh выползает ошибка в алгоритме:
Предлагаю также включить в исследование BOP challenge - это соревнование алгоритмов 6D pose estimation (в 2022 году включили также 2D object detection и 2D object segmentation). Результаты 2022 года - http://cmp.felk.cvut.cz/sixd/workshop_2022/slides/bop_challenge_2022_results.pdf. по 6D pose estimation в 2022 году стал однозначным победителем алгоритм GDR-NPP (наследник GDR_Net), реализация доступна тут https://github.com/shanice-l/gdrnpp_bop2022 . Думаю, что будет не лишним взять этот проект в качестве референса.
Прошу разобраться по каким критериям оцениваются алгоритмы и оценить насколько они пригодны для нашего сценария, где требуется высокая точность оценки позиции и при этом мы можем сделать несколько снимков, благодаря возможности изменять положение камеры.
Утилиты для проведения benchmark'а - https://github.com/thodan/bop_toolkit
Напомню, что мы позиционировали фреймворк также и с той точки зрения, он может служить таким benchmark'ом для подбора разных алгоритмов. Если есть уже готовый benchmark алгоритм, то нужно подумать о его интеграции в фреймворк.
для информации @solid-sinusoid @Splinter1984
Ещё интересный сценарий отражён в работе https://megapose6d.github.io/ - https://github.com/megapose6d/megapose6d

Тут идея заключается в том, что модель объекта неизвестна на этапе обучения, а передаётся в режиме исполнения вместе с RGB-изображением с выделенной областью, содержащей данный объект.
см. иллюстрацию:
Если быть точным, то входные параметры:
Подход оценивает 6D pose объекта (3D rotation + 3D translation) с поправкой на положение камеры.
Это может быть интересно в нашем случае, чтобы сделать фреймворк более универсальным. Мы можем поставлять некий сервис, который принимает результат object detection и CAD модель и на ходу оценивающий позицию без обучения.