ivdon3@bk.ru
В данной статье предлагается метод отслеживания звездного датчика без звездной библиотеки на основе алгоритма цепочки угловых расстояний, направленный на решение проблемы, заключающейся в том, что традиционные звездные датчики полагаются на фиксированную звездную библиотеку и должны быть настроены на работу с несколькими устройствами в режиме отслеживания. Этот метод обеспечивает сопоставление звездной карты путем динамической генерации цепочек угловых расстояний, избегая зависимости от глобальной библиотеки звезд. Эксперименты показывают, что время распознавания алгоритма в режиме отслеживания сокращается до миллисекунд, а максимальная ошибка определения позы не превышает 0,035°, что подтверждает его эффективность и надежность. Исследование обеспечивает ключевую техническую поддержку для разработки недорогих и легких звездных датчиков, которые подходят для таких сценариев, как исследование дальнего космоса и околоземных спутниковых скоплений.
Ключевые слова: алгоритм цепочки угловых расстояний, звездный датчик без звездной библиотеки, распознавание звездной карты, режим отслеживания, ориентация, динамическое сопоставление, исследование дальнего космоса
1.3.1 - Физика космоса, астрономия , 2.3.1 - Системный анализ, управление и обработка информации
В работе предлагается двухэтапный метод обучения робота по демонстрациям, сочетающий диффузионную генеративную модель и онлайн-дообучение методом обучение роботов по демонстрациям. На офлайн-фазе диффузионная модель использует ограниченный набор экспертных демонстраций и генерирует синтетические «псевдодемонстрации», позволяя расширить вариативность и охват исходного датасета. Это избавляет стратегию от узкой специализации и повышает её способность к обобщению. На онлайн-фазе робот с уже предобученной стратегией корректирует свои действия в реальной среде (или в высокоточной симуляции), что существенно снижает риски небезопасных действий и уменьшает число необходимых взаимодействий. Дополнительно введена параметрически-эффективная донастройка, сокращающая вычислительные затраты на онлайн-обучение, а также ценностное руководство, ориентирующее генерацию новых данных на области состояний и действий с высокими оценками Q. Эксперименты на задачах из набора D4RL (Hopper, Walker2d, HalfCheetah) показывают, что наш подход достигает наибольшей накопленной награды при меньших вычислительных затратах по сравнению с альтернативами. Анализ t-SNE свидетельствует о смещении синтетических данных в области пространства с высокими оценками Q, способствуя ускоренному обучению. Полученные результаты подтверждают перспективность предлагаемого метода для робототехнических приложений, где важно совмещать ограниченный объём демонстраций, безопасность и эффективность онлайн-фазы.
Ключевые слова: обучение роботов по демонстрациям, диффузионные генеративные модели, обучение с подкреплением