Xiaomin Yu (@XiaominY72213)
이 연구는 텍스트 데이터만으로 MLLM(멀티모달 대형 언어 모델)을 프리트레이닝하는 방법을 제안하며, 모달리티 간 격차(modality gap) 현상을 활용해 성능을 향상시키는 접근법을 탐구한다. 관련 논문은 Arxiv에 등록되어 있으며, Github에 소스 코드가 공개되어 있어 연구 재현성과 확장 가능성이 높다.
Xiaomin Yu (@XiaominY72213)
이 연구는 텍스트 데이터만으로 MLLM(멀티모달 대형 언어 모델)을 프리트레이닝하는 방법을 제안하며, 모달리티 간 격차(modality gap) 현상을 활용해 성능을 향상시키는 접근법을 탐구한다. 관련 논문은 Arxiv에 등록되어 있으며, Github에 소스 코드가 공개되어 있어 연구 재현성과 확장 가능성이 높다.
dear #lazyweb
hit me with your favorite RSS feeds for #homelab #selfhosting #linux #opensource #computing #programming #computerscience #cpu #microarchitecture #electronics #robotics #ai #llm #vlm #mllm #cognitivescience #consciousness #complexity #psychology #jung #philosophy #astronomy #cosmology #physics #chemistry #biology #books #literature #anthropology #jrpg #retrogaming #survival #outdoors #hunting #homesteading #gardening
i need to enrich my feed reader.
UniGen 1.5: el modelo de IA de Apple que puede ver, crear y editar imágenes
https://mecambioamac.com/unigen-1-5-el-modelo-de-ia-de-apple-que-puede-ver-crear-y-editar-imagenes/
Chào mọi người! Công cụ thay thế cục bộ **Super-Bot** vừa được ra mắt: tự viết và chạy mã (Python), tự phục hồi lỗi khi crash, kiểm tra trực quan qua ảnh chụp màn hình. Thử thành công với Ray Tracer và game Snake. Mua một lần thay vì đăng ký hàng tháng! Ý kiến bạn về AI cục bộ vs đám mây?
#AgentStudio #SuperBot #AI #MLLM #ĐạiLýTựĐộng #CôngNghệViệt
https://www.reddit.com/r/LocalLLaMA/comments/1ponuog/agent_studio/
Не все чувства одинаково полезны: как искусственный интеллект объединяет информацию из разных источников
Новое исследование показывает, что мультимодальные модели искусственного интеллекта неравномерно полагаются на визуальные и текстовые данные, что может приводить к ошибкам при обработке противоречивой информации.
Новое исследование показывает, что мультимодальные модели искусственного интеллекта неравномерно полагаются на визуальные и текстовые данные, что может приводить к ошибкам при обработке противоречивой...
Why AI Sucks At Telling Time... and why this should concern us for autonomous vehicles and more.
#News #TechNews #AI #MLLM #AIlimitations #SelfDriving #MedTech
Daily podcast: Why AI Sucks At Telling Time... and why this should concern us for autonomous vehicles and more.
#News #TechNews #AI #MLLM #AIlimitations #SelfDriving #MedTech #podcast
and why this should concern us for autonomous vehicles and more.
Kết quả test nhanh cho thấy việc sử dụng Oculink eGPU không gây ảnh hưởng tiêu cực đến hiệu năng khi chạy các dự án LLM cục bộ. Thậm chí, việc kết hợp RTX 3090 qua Oculink với RTX A6000 còn mang lại hiệu suất đáng kể.
#LocalLLaMA #eGPU #Oculink #AI #MLLM #gpu #vietnam
#trítuệnhântạo #máytính
BDH (Baby Dragon Hatchling) đã được port sang MLX cho Apple Silicon! 🚀 Mã nguồn, tài liệu và script huấn luyện đã sẵn sàng. Model này tương thích với M1/M2/M3. Weights sẽ sớm được upload lên Hugging Face.
#LocalLLaMA #MachineLearning #AI #MLLM #HọcMáy #TríTuệNhânTạo
https://www.reddit.com/r/LocalLLaMA/comments/1o108q5/mlx_port_of_bdh_baby_dragon_hatchling_is_up/
Ước tính chi phí sử dụng token của OpenAI: 1T tokens cho GPT-5 có thể tốn khoảng 3 triệu đô la. Một số lượng lớn người dùng đã tiêu thụ tổng cộng 112,62 triệu đô la tokens, chiếm khoảng 3% doanh thu năm 2024 của OpenAI.
#OpenAI #GPT5 #AI #MLLM # trí_tuệ_nhân_tạo
https://www.reddit.com/r/LocalLLaMA/comments/1o0or4w/how_much_does_1t_tokens_cost_how_much_did_all/