fly51fly (@fly51fly)
논문 'HyperMLP: An Integrated Perspective for Sequence Modeling' 발표(J Lu, S Yang, Georgia Institute of Technology, 2026). 시퀀스 모델링을 위한 통합적 관점을 제시하는 HyperMLP라는 접근을 소개하는 arXiv 논문입니다(원문 링크 포함).
fly51fly (@fly51fly)
논문 'HyperMLP: An Integrated Perspective for Sequence Modeling' 발표(J Lu, S Yang, Georgia Institute of Technology, 2026). 시퀀스 모델링을 위한 통합적 관점을 제시하는 HyperMLP라는 접근을 소개하는 arXiv 논문입니다(원문 링크 포함).
🚀 GFN v2.5.0 (Geodesic Flow Networks) đã chứng minh khả năng suy luận O(1) bộ nhớ và mở rộng độ dài lên tới 500× (từ 20 → 10.000 token) mà chỉ dùng ~60 MB VRAM. So với Transformer, GFN giảm 234× chi phí bộ nhớ và đạt 100 % độ chính xác trên task Binary Parity, cho thấy khả năng tổng quát hoá không giới hạn. Cập nhật tích hợp RiemannianAdam, Leapfrog integration và bảo toàn năng lượng hệ. #AI #MachineLearning #GFN #NLP #DeepLearning #CôngNghệ #BộNhớ #MôHình #SequenceModeling
https://www.reddit.