fly51fly (@fly51fly)

논문 'HyperMLP: An Integrated Perspective for Sequence Modeling' 발표(J Lu, S Yang, Georgia Institute of Technology, 2026). 시퀀스 모델링을 위한 통합적 관점을 제시하는 HyperMLP라는 접근을 소개하는 arXiv 논문입니다(원문 링크 포함).

https://x.com/fly51fly/status/2023584718877585447

#hypermlp #sequencemodeling #arxiv #research

fly51fly (@fly51fly) on X

[LG] HyperMLP: An Integrated Perspective for Sequence Modeling J Lu, S Yang [Georgia Institute of Technology] (2026) https://t.co/uOEwI2hswL

X (formerly Twitter)

🚀 GFN v2.5.0 (Geodesic Flow Networks) đã chứng minh khả năng suy luận O(1) bộ nhớ và mở rộng độ dài lên tới 500× (từ 20 → 10.000 token) mà chỉ dùng ~60 MB VRAM. So với Transformer, GFN giảm 234× chi phí bộ nhớ và đạt 100 % độ chính xác trên task Binary Parity, cho thấy khả năng tổng quát hoá không giới hạn. Cập nhật tích hợp RiemannianAdam, Leapfrog integration và bảo toàn năng lượng hệ. #AI #MachineLearning #GFN #NLP #DeepLearning #CôngNghệ #BộNhớ #MôHình #SequenceModeling

https://www.reddit.