Robotics

Research on robot control, manipulation, navigation, and human-robot interaction.

cs.RO · 524 papers

123D: Unifying Multi-Modal Autonomous Driving Data at Scale

123D is an open-source framework that unifies diverse multi-modal autonomous driving datasets through a single API, enabling scalable data access.

2605.08084May 8, 2026Daniel Dauner, Valentin Charraut, Bastian Berle +10

6D Pose Estimation via Keypoint Heatmap Regression with RGB-D Residual Neural Networks

This paper proposes a 6D pose estimation framework using keypoint heatmap regression, achieving high accuracy with RGB-D fusion.

2605.08059May 8, 2026Ismail Aljosevic, Amir Masoud Almasi, Ana Parovic +1

Active Embodiment Identification with Reinforcement Learning for Legged Robots

A method using reinforcement learning to actively identify legged robot embodiment parameters via interaction.

2605.08020May 8, 2026Nico Bohlinger, Jan Peters

Evaluation of an Actuated Spine in Agile Quadruped Locomotion

This paper empirically shows that an actuated spine significantly enhances the agility and obstacle negotiation capabilities of quadruped robots.

2605.07988May 8, 2026Nico Bohlinger, Piotr Kicki, Davide Tateo +2

TAVIS: A Benchmark for Egocentric Active Vision and Anticipatory Gaze in Imitation Learning

TAVIS is a new benchmark for active vision in imitation learning, offering task suites and metrics to evaluate gaze control in robotic manipulation.

2605.07943May 8, 2026Giacomo Spigler

AERO-VIS: Asynchronous Event-based Real-time Onboard Visual-Inertial SLAM

AERO-VIS is an asynchronous, real-time event-inertial SLAM system enabling accurate onboard UAV control and state estimation.

2605.07885May 8, 2026Yannick Burkhardt, Sebastián Barbas Laina, Simon Boche +2

Melding LLM and temporal logic for reliable human-swarm collaboration in complex scenarios

This paper introduces a neuro-symbolic framework combining LLMs and temporal logic for reliable, low-overhead human-swarm collaboration in dynamic environments.

2605.07877May 8, 2026Junfeng Chen, Yuxiao Zhu, An Zhuo +6

Many-to-Many Multi-Agent Pickup and Delivery

This paper introduces M2M, a novel algorithm for many-to-many multi-agent pickup and delivery in warehouses, outperforming prior methods.

2605.07835May 8, 2026Ethan Schneider, Jingkai Chen, Tianyi Gu +3

Text-to-CAD Evaluation with CADTests

Introduces CADTestBench, the first test-based benchmark using CADTests for evaluating and guiding Text-to-CAD model generation.

2605.07807May 8, 2026Dimitrios Mallis, Marco Wang, Ahmet Serdar Karadeniz +3

NoiseGate: Learning Per-Latent Timestep Schedules as Information Gating in World Action Models

NoiseGate introduces a learnable per-latent timestep schedule as an information-gating policy for World Action Models, improving robot manipulation.

2605.07794May 8, 2026Wen Huang, Haoran Sun, Yongjian Guo +8

Sensitivity-Based Robust NMPC for Close-Proximity Offshore Wind Turbine Inspection with a Tilted Multirotor

A sensitivity-based robust NMPC is proposed for close-proximity offshore wind turbine inspection, preventing safety violations under uncertainties.

2605.07771May 8, 2026Giuseppe Silano, Martin Saska

CommandSwarm: Safety-Aware Natural Language-to-Behavior-Tree Generation for Robotic Swarms

CommandSwarm enables safety-aware natural language control of robotic swarms by generating validated behavior trees using adapted LLMs.

2605.07764May 8, 2026Mohammed Majid, Amjad Yousef Majid

Offline-Online Hierarchical 3D Global Relocalization With Synthetic LiDAR Sensing and Descriptor-Space Retrieval

This paper introduces an offline-online hierarchical framework for fast 3D global relocalization using synthetic LiDAR and descriptor-space retrieval.

2605.07741May 8, 2026Jiahua Ren, Kai Shen, Muhua Zhang +1

Drifting Field Policy: A One-Step Generative Policy via Wasserstein Gradient Flow

DFP is a new one-step generative policy using Wasserstein gradient flow, achieving state-of-the-art performance on manipulation tasks.

2605.07727May 8, 2026Juil Koo, Mingue Park, Jiwon Choi +2

Finite-Time Analysis of MCTS in Continuous POMDP Planning

This paper provides a finite-time analysis for MCTS in POMDPs, introducing Voro-POMCPOW for continuous observation spaces with theoretical guarantees.

2605.07703May 8, 2026Da Kong, Vadim Indelman

PhySPRING: Structure-Preserving Reduction of Physics-Informed Twins via GNN

PhySPRING uses a GNN to efficiently reduce the complexity of physics-informed digital twins, preserving structure for faster, high-fidelity simulations.

2605.07687May 8, 2026Yixiong Jing, Xingyuan Chen, Guangming Wang +3

Operating Within the Operational Design Domain: Zero-Shot Perception with Vision-Language Models

This paper demonstrates how Vision-Language Models can perform zero-shot perception of Operational Design Domain elements, enhancing safety for autonomous systems.

2605.07649May 8, 2026Berkehan Ünal, Dierend Hauke, Fazlija Dren +1

BrickCraft: Visuomotor Skill Composition with Situated Manual Guidance for Long-Horizon Interlocking Brick Assembly

BrickCraft is a compositional framework enabling robots to assemble complex interlocking brick structures by decomposing tasks into reusable, spatially guided skills.

2605.07605May 8, 2026Jichuan Yu, Bowei Li, Zhenran Tang +4

MemCompiler: Compile, Don't Inject -- State-Conditioned Memory for Embodied Agents

MemCompiler dynamically compiles state-conditioned memory for embodied agents, improving performance and efficiency over static memory injection.

2605.07594May 8, 2026Xin Ding, Xinrui Wang, Yifan Yang +9

How to utilize failure demo data?: Effective data selection for imitation learning using distribution differences in attention mechanism

This paper proposes a method to effectively use failure demonstration data in imitation learning by learning success-failure discrepancies in attention mechanisms.

2605.07560May 8, 2026Kana Miyamoto, Kanata Suzuki, Tetsuya Ogata

PreviousPage 4 of 27Next

📬 Weekly AI Paper Digest

Get the top 10 AI/ML arXiv papers from the week — summarized, scored, and delivered to your inbox every Monday.