Jay Sensei (@hckinz)

대다수 주요 텍스트→이미지·텍스트→비디오 생성 시스템은 여전히 핵심에 디퓨전(diffusion) 계열 기법을 사용하고 있으며, flow matching 같은 방법은 사실상 현대화된 디퓨전으로 볼 수 있다는 관찰입니다. 즉, 현재 생성형 비전 모델들의 근간은 여전히 디퓨전 계열 기술에 의존하고 있다는 기술적 통찰을 제공합니다.

https://x.com/hckinz/status/2034056299978362931

#diffusion #flowmatching #texttoimage #texttovideo #generativeai

Jay Sensei👾 (@hckinz) on X

Almost every major text-to-image / text-to-video system still relies on diffusion (or very close relatives like flow matching, which is basically modernized diffusion) at its core.

X (formerly Twitter)

The Humanoid Hub (@TheHumanoidHub)

OmniXtreme이라는 확장 가능한 프레임워크가 휴머노이드의 'generality barrier' 문제를 해결한다고 발표. 두 단계 방법을 제시: 스페셜리스트 정책의 스킬을 집약하는 flow-matching 사전학습과 구동 특성을 반영하는 actuation-aware 사후학습으로, 스킬 라이브러리 확장에도 동작 추적 정밀도를 유지한다고 주장.

https://x.com/TheHumanoidHub/status/2028520139948519910

#omnixtreme #robotics #humanoids #flowmatching #airesearch

The Humanoid Hub (@TheHumanoidHub) on X

OmniXtreme is a scalable framework that solves the 'generality barrier' in humanoids, keeping motion tracking precise even as skill libraries expand. Two-step method: - Flow-matching pretraining to aggregate skills from specialist policies - Actuation-aware post-training to

X (formerly Twitter)

Apple opracowuje model językowy, który generuje długie teksty nawet 128 razy szybciej

Naukowcy Apple i Ohio State University przedstawili nowy model językowy FS-DFM (Few-Step Discrete Flow-Matching), zdolny do generowania pełnych fragmentów tekstu w zaledwie 8 szybkich krokach, osiągając jakość porównywalną z tradycyjnymi modelami dyfuzyjnymi wymagającymi ponad tysiąca iteracji.

Kluczowe różnice:

  • Autoregresywne modele LLM (np. ChatGPT) generują tekst sekwencyjnie, token po tokenie.
  • Modele dyfuzyjne wytwarzają wiele tokenów jednocześnie, udoskonalając je w wielu krokach.
  • Flow-matching pozwala uzyskać końcowy wynik w jednym przebiegu, pomijając wieloetapowe iteracje.

FS-DFM korzysta z trzystopniowej metody: dostosowuje się do różnych liczby iteracji, wspiera go model „nauczycielski” dla większej precyzji oraz optymalizuje każdy krok, aby przyspieszyć generowanie tekstu.

W testach model osiągnął niższą perplexity (dokładniejszy, naturalniejszy tekst) i stabilniejszą entropię (bardziej spójny dobór słów) w porównaniu z większymi modelami dyfuzyjnymi, nawet przy mniejszej liczbie parametrów (1,7 – 0,17 mld).

Apple planuje udostępnić kod i checkpointy FS-DFM, aby umożliwić dalsze badania i reprodukcję wyników.

#AI #AIresearch #Apple #arXiv #badaniaApple #dyfuzja #flowmatching #FSDFM #generowanietekstu #innowacjeAI #LLM #modelejęzykowe #NLP #sztucznainteligencja #szybkiegenerowanietekstu #technologia

MIT 6.S184: Introduction to Flow Matching and Diffusion Models — https://diffusion.csail.mit.edu
#HackerNews #MIT #6S184 #Introduction #FlowMatching #DiffusionModels
Generative AI with Stochastic Differential Equations - IAP 2025

Missing Semester
要約:Flow Matching for Generative Modeling (Part1) - Qiita

記事の要約Flow Matching for Generative Modelingの要約である.実験の部分は省略し,数学的な部分の要約をする.特に定理1について,論文では省略された部分を丁寧…

Qiita