Emily (@IamEmily2050)
Wan 2.7, Seedance V2, Veo4 같은 차세대 AI 영상 생성 모델들이 곧 공개되거나 출시될 예정이라고 언급했다. AI 영상 생성 분야의 다음 버전들이 연이어 등장할 가능성을 시사한다.

Wan 2.7 is coming soon, and Seedance V2 will be available in the near future. Veo4 is also not far away. All the people who keep screaming about X full of stolen AI videos from Douyin, or I am not interested in your 15-second slop, let's see what you guys are going to do in a few
Hands on with AI audio generation: GAI voice, music, and sound effects
This is the second post in a series exploring the multimodal possibilities of generative AI. This series will take a detailed, hype-free look at text, image, audio, video, and code generation and explore the creative potential as well as the ethical concerns of GAI. Although Generative AI isn't a new technology, it's definitely been having a hype moment since the release of ChatGPT in November 2022. Unfortunately, the focus has been squarely on the text-based chatbot at the exclusion of […]Hila Chefer (@hila_chefer)
bfl_ml의 새로운 연구 'Self-Flow'는 이미지·오디오·비디오·월드 모델을 아우르는 자기지도 프레임워크입니다. 저자들은 생성 모델이 강한 표현 학습을 위해 DINO 같은 별도 기법을 반드시 필요로 하지 않다고 보고, 생성 모델을 공동 프레임워크로 직접 가르치는 접근을 제안합니다.
https://x.com/hila_chefer/status/2029212708797661327
#selfflow #selfsupervised #multimodal #generativemodels #bfl

New research from @bfl_ml 🥳 Meet Self-Flow: our self-supervised framework for image, audio, video & world models 🤖 https://t.co/AshY8IkSEe Do generative models really need DINO to learn strong representations? We propose teaching them directly via a joint framework instead 🧵
Brie Wensleydale (@SlipperyGem)
FireRed 버전 1.1이 공개되었습니다. 이번 업데이트는 정체성 일관성(identity consistency), 다중 이미지 조건화(multi-image conditioning), 도메인 특화 편집 성능을 크게 향상시켜 실무적 크리에이티브 제작 요구에 더 가까운 결과를 목표로 합니다.
https://x.com/SlipperyGem/status/2029148671665946962
#firered #imageediting #generativemodels #multimodal #modelupdate

FireRed version 1.1 has been released! It apparently: "significantly enhances identity consistency, multi-image conditioning, and domain-specialized editing performance, bringing the model closer to real-world creative production needs." Great!~ https://t.co/mkiXLcDMu1
fly51fly (@fly51fly)
[논문] "dLLM: Simple Diffusion Language Modeling"(UC Berkeley & UIUC, 2026). 확산 기반의 언어모델링 접근법(dLLM)을 제안하는 연구로, 텍스트 생성에서 확산 모델을 적용하는 새로운 방법론과 실험 결과를 소개합니다. arXiv 원문 링크 포함.
Dan McAteer (@daniel_mac8)
Google DeepMind의 'Genie 3' 발표가 임박했다는 소식. Genie 3는 3D 세계를 생성하는 생성적 월드 모델(generative world model)로, 개인화된 가상 우주나 3D 환경 자동 생성 같은 새로운 응용을 열 가능성이 있다.
New research shows AI‑enabled disinformation swarms can flood social platforms, weaponising generative models and AI agents to sway public opinion and undermine democratic governance. Learn how these influence campaigns operate and what can be done. #AISwarms #Disinformation #DemocraticGovernance #GenerativeModels
🔗 https://aidailypost.com/news/ai-enabled-disinformation-swarms-threaten-democratic-governance
fly51fly (@fly51fly)
새 논문 'High-accuracy and dimension-free sampling with diffusions'는 차원 수에 의존하지 않는(diffusion) 고정밀 샘플링 기법을 제안합니다. 저자 K. Gatmiry, S. Chen, A. Salim(UC Berkeley·Harvard) 공동저자이며 arXiv에 공개되어 확률적 생성모델의 샘플링 정확도와 확장성 개선에 기여할 가능성이 있습니다.
AI labs are racing on multiple timelines, but without breakthroughs in memory and caching, generative models will hit a wall. Nvidia and OpenAI are pushing hardware limits, yet data‑center consolidation may be the real bottleneck. Find out why memory management is the next frontier for scaling AI. #AI #GenerativeModels #MemoryManagement #DataCenter
🔗 https://aidailypost.com/news/multiple-ai-bubbles-have-different-timelines-labs-need-memory-caching