fly51fly (@fly51fly)
MoCapAnything은 단안 영상만으로 임의의 스켈레톤에 대한 3D 모션 캡처를 통합적으로 수행하는 방법을 제안한다. 휴먼 모션 캡처를 넘어 다양한 스켈레톤 구조에 적용 가능한 점에서, 비전 기반 동작 추정과 3D 재구성 분야의 유용한 신규 기술이다.
fly51fly (@fly51fly)
MoCapAnything은 단안 영상만으로 임의의 스켈레톤에 대한 3D 모션 캡처를 통합적으로 수행하는 방법을 제안한다. 휴먼 모션 캡처를 넘어 다양한 스켈레톤 구조에 적용 가능한 점에서, 비전 기반 동작 추정과 3D 재구성 분야의 유용한 신규 기술이다.
Drones Adopt 3D Vision for GPS-Free Navigation
In a game-changing shift, drones are ditching GPS and embracing 3D vision for navigation, empowering them to fly high even in the most challenging environments. This innovative tech is redefining autonomy, enabling drones to thrive in "dirty" RF and contested conditions where satellite signals are unreliable or unavailable.
#3dVision #GpsfreeNavigation #DroneTechnology #AutonomousSystems #ResilientPositioning
fly51fly (@fly51fly)
Meta Reality Labs Research가 공개한 CV 논문으로, 오픈월드 2D 바운딩 박스를 3D로 강건하게 올리는 Boxer 방법을 제안한다. 2D 감지 결과를 3D 공간 이해로 확장하는 컴퓨터 비전 연구로, 향후 3D 인식·로보틱스·AR/VR 응용에 유용할 수 있다.
田中義弘 | taziku CEO / AI × Creative (@taziku_co)
Allen AI의 WildDet3D는 2D 비디오만으로 3D 객체 탐지를 수행하는 오픈소스 모델입니다. 단일 시점 영상에서 물체를 완전한 3D bounding box로 추출해 비전 시스템의 공간 이해를 크게 향상시킵니다.
merve (@mervenoyann)
3DV 논문 소개 트윗으로, DetailGen3D가 3D 자산의 기하학적 텍스처를 정교하게 보정하고 coarse-to-fine 변환을 학습하는 추론 파이프라인과 모델/데모를 함께 언급한다. 3D 생성 및 복원 분야에서 주목할 만한 연구다.
Researchers, including Benjamin Bogenberger, developed a robot that combines #LanguageModels with #3Dvision to locate misplaced objects by building a spatial map and estimating likely locations: http://go.tum.de/730486
📷A. Schmitz
Framer (@Framer_X)
이미지를 업로드하고 3D 공간에서 카메라를 움직이면 완전히 새로운 시점의 이미지를 생성할 수 있는 무료 도구가 공개되었습니다. 2D 이미지를 3D 장면으로 변환하는 혁신적인 비전 AI 응용 사례입니다.
田中義弘 | taziku CEO / AI × Creative (@taziku_co)
Seeed Studio가 Depth Anything V3와 NVIDIA Jetson AGX Orin을 결합해 단일 RGB 카메라만으로 로봇에 3D 인식 능력을 부여하는 솔루션을 공개했다. 이 기술은 고가의 센서나 장비 없이도 단안(depth) 추정(monocular depth) 기반으로 2D 이미지에서 실시간으로 거리 정보를 계산해 3D 공간 인식을 가능하게 한다. AI 기반의 최적화로 로봇 비전의 패러다임을 바꾸는 혁신적 접근이다.