Alisa Qian (@alisaqqt)

셀 시각화를 기반으로 한 작업을 미니맥스 M2.7, GPT Image 2, Tripo 3D AI를 활용해 다시 구축한 사례가 공유됐다. 씬 분해, 이미지 생성, 3D 재구성까지 여러 AI 도구를 결합해 인터랙티브한 결과물을 만든 것이 핵심이며, 오픈소스 프로젝트도 함께 언급됐다.

https://x.com/alisaqqt/status/2054408046324207714

#multimodalai #imagegeneration #3dreconstruction #opensource #aibuild

Alisa Qian (@alisaqqt) on X

Loved @DilumSanjaya's cell visualization so much. Swapped the theme to 🌍, and rebuilt it. Process: → Scene breakdown with MiniMax M2.7 → Image gen with GPT Image 2 on @atlas_cloud_ai → 3D reconstruction with Tripo 3D AI Huge thanks to @servasyy_ai for the open-source

X (formerly Twitter)
Robbyant - Exploring the Frontiers of Embodied Intelligence | 蚂蚁灵波科技 - 探索具身智能的上限,打造物理世界的 AGI 平台

Technology-driven and application-oriented. We build foundational large models for embodied AI: spatial perception (LingBot-Depth), VLA (LingBot-VLA), world models (LingBot-World), video action (LingBot-VA). Jointly embrace the new era of embodied intelligence. 技术驱动、场景导向,自研具身智能基础大模型,共迎具身智能新时代,共创幸福生活新场景。

Robbyant 蚂蚁灵波科技

田中義弘 | taziku CEO / AI × Creative (@taziku_co)

Streaming 3D reconstruction을 위한 Geometric Context Transformer 프로젝트가 공개됐다. LingBot-Map 관련 기술 페이지와 함께 소개된 연구/프로젝트로, 실시간 3D 재구성 분야에서 활용될 수 있는 새로운 기술 제안이다.

https://x.com/taziku_co/status/2046191582714740806

#3dreconstruction #transformer #streaming #computervision #research

田中義弘 | taziku CEO / AI × Creative (@taziku_co) on X

Geometric Context Transformer for Streaming 3D Reconstruction Project:https://t.co/ndwYt9Okdl Dev:@YinghaoXu1

X (formerly Twitter)

田中義弘 | taziku CEO / AI × Creative (@taziku_co)

LiDAR 없이도 monocular RGB와 순수 autoregression만으로 1만 프레임 이상을 초당 약 20FPS로 처리하는 3D 재구성 접근이 소개됐다. 학습된 구조(learned structures)를 활용한 방식이어서, 기존 LiDAR 기반 3D reconstruction을 다시 검토할 만한 새로운 가능성을 제시한다.

https://x.com/taziku_co/status/2046191580365889977

#3dreconstruction #lidar #computervision #autoregression #rgb

田中義弘 | taziku CEO / AI × Creative (@taziku_co) on X

LiDAR前提の3D再構築、そろそろ再考していいかもしれない。 LingBot-Mapは単眼RGB・純自己回帰・約20FPSで10,000フレーム超を処理。しかも最適化なし、後処理なし。 「賢いパイプライン」より「学習された構造」が勝つシーンも増えてくるかもしれない。 詳細は🧵

X (formerly Twitter)

🎓 GeoTech Cohort Sharing

Proud of Ting-Jia Guo, our GeoTech Master's student, for presenting her poster at the International Summer School on LiDAR Applications & Youth Forum of DGPF at TU Darmstadt! 🏛️✈️

Her work, HERI3D, compares traditional and deep learning-based 3D reconstruction using UAV imagery to document large-scale cultural heritage sites.

#GeoTech #CohortSharing #DGPF #SummerSchool #CulturalHeritage #Photogrammetry #3DReconstruction #UAV

Brie Wensleydale (@SlipperyGem)

Comfy 노드 기반의 파노라마를 Gaussian splat으로 변환하는 기능을 언급하며, 사용성은 좋지만 실제로는 파노를 어떻게 확보할지가 더 큰 문제라고 지적합니다. 3D/공간 재구성 워크플로와 관련된 흥미로운 도구 논의입니다.

https://x.com/SlipperyGem/status/2037933174597296226

#comfyui #gaussiansplat #panorama #3dreconstruction #aiworkflow

Brie Wensleydale🧀🐭 (@SlipperyGem) on X

Its a Comfy node, so hooray! Its pano to Gaussian splats, so hooray again! But, its not exactly what I need. If you've already got a pano, do you need to make a Gaussian splat out of it? More importantly, how do you get the pano in the first place? (Go ... outside? no,no ~)

X (formerly Twitter)

Prithiv Sakthi (@prithivMLmods)

Map-Anything v1 데모가 Hugging Face Spaces에 공개되었습니다. 다중 이미지와 비디오를 이용해 3D 재구성, 깊이 추정, 노멀 맵 생성, 인터랙티브 측정을 수행하는 범용 3D 재구성 모델로, Gradio와 Rerun이 통합되었습니다.

https://x.com/prithivMLmods/status/2035055111358357957

#huggingface #3dreconstruction #gradio #computervision #opensource

Prithiv Sakthi (@prithivMLmods) on X

Map-Anything v1 (Universal Feed-Forward Metric 3D Reconstruction) demo is now available on Hugging Face Spaces. Built with @Gradio and integrated with @rerundotio , it performs multi-image and video-based 3D reconstruction, depth, normal map, and interactive measurements.

X (formerly Twitter)

852話(hakoniwa) (@8co28)

단일 이미지로 고품질 3D화를 자동으로 만들어 컬러 상태로 바로 3D프린터에 보낼 수 있는 수준에 도달했다는 내용입니다. 리깅도 지원하며(Apose), 생성된 것은 동영상 AI가 아닌 일반 3D 메쉬라서 바로 출력(시제품 제작 등)에 활용할 수 있다고 적었습니다.

https://x.com/8co28/status/2032638757816643636

#3d #3dreconstruction #3dprinting #ai

852話(hakoniwa) (@8co28) on X

一枚の画像からのAIでの3D化もすごいレベルになっていて、そのままカラーで3Dプリンターに投げれる形式にもしてくれる時代になってる。Aposeならリギングもできる。 一つなにか印刷してみようかな。 (これは動画生成AIではなく普通に3Dメッシュ)

X (formerly Twitter)
DeepMind and #UC #Berkeley have teamed up to give us #LoGeR, a project that claims to tackle long video 3D reconstruction. 🚀 They've thrown in buzzwords like "Hybrid Memory" and "Sliding Window Attention" to distract you from the fact that it still drifts after 19,000 frames. 😜 Basically, it's a convoluted way to say: "Look, Ma! No hands!" while tripping over the finish line. 🙃
https://loger-project.github.io #DeepMind #3DReconstruction #AIResearch #VideoTech #HackerNews #ngated
LoGeR: Long-Context Geometric Reconstruction with Hybrid Memory

fly51fly (@fly51fly)

논문 'VGG-T³: Offline Feed-Forward 3D Reconstruction at Scale'이 arXiv에 공개되었음을 알리는 트윗이다. 저자로 S Elflein, R Li, S Agostinho, Z Gojcic 등이 언급되며 NVIDIA 소속으로 표기되어 있다. 대규모 오프라인 피드포워드 방식의 3D 재구성 관련 연구 논문이다.

https://x.com/fly51fly/status/2027867633438335281

#vggt3 #3dreconstruction #computervision #nvidia

fly51fly (@fly51fly) on X

[CV] VGG-T³: Offline Feed-Forward 3D Reconstruction at Scale S Elflein, R Li, S Agostinho, Z Gojcic… [NVIDIA] (2026) https://t.co/9LAqiiFr7a

X (formerly Twitter)