Wes Roth (@WesRoth)
마이크로소프트가 전 Ai2 CEO Ali Farhadi를 Corporate Vice President로 영입했고, 그와 함께 우수 AI 연구팀도 합류해 새롭게 재편된 AI 조직을 강화한다고 밝혔다. 연구 역량 확대와 조직 개편 측면에서 중요한 인사다.

Microsoft has hired Ali Farhadi, the former CEO of the Allen Institute for Artificial Intelligence (Ai2), as its new Corporate Vice President. He is bringing a team of elite AI researchers with him to bolster Microsoft's newly restructured AI division. Farhadi recently stepped
Microsoft Hires Former Ai2 CEO Farhadi for Suleyman AI Team
#Microsoft #AI #MustafaSuleyman #Copilot #BigTech #AITalentWar #Superintelligence #AIResearch #MachineLearning #AITalent #AIModels #AliFarhadi #AI2 #HannaHajishirzi
merve (@mervenoyann)
AI2(Allen Institute for AI)가 포인팅(pointing) 작업에서 SOTA 성능을 목표로 한 새로운 비전 언어 모델 패밀리 'MolmoPoint'를 공개함. 공개된 모델은 MolmoPoint-8B(범용), MolmoPoint-GUI-8B(그래픽 UI용), MolmoPoint-Vid-4B(비디오 내 계수/추적)이며, 관련 데이터셋도 함께 제공됨.
merve (@mervenoyann)
Allen Institute for AI(AI2)가 Olmo Hybrid 모델군(base/SFT/DPO)을 공개했습니다. 이 모델군은 트랜스포머와 RNN 레이어를 혼합해 FLOP 대비 학습 효율이 높은 구조를 추구하며 학습 측면에서 파레토 프런티어에 위치한다고 주장하고 확장성도 확보했다고 보고했습니다. 또한 학습 데이터 믹스도 함께 공개되었습니다.
Tim Dettmers (@Tim_Dettmers)
Ai2의 Open Coding Agent 시리즈 첫 모델 SERA 출시 발표. 작성자는 SERA가 동일 규모에서 SoTA 성능을 보이고 설계가 단순하며, 강화학습(RL) 대비 26배 효율적이라고 주장함. 상세 설명과 개발 여정은 Tim Dettmers의 블로그 글로 제공.

We release SERA, the first model part of Ai2’s Open Coding Agent series. SERA is a SoTA agent for its size, super simple, and 26x more efficient than RL. In my blog post, I write about my personal journey of building this coding agent: https://t.co/kPZHUGwBBC Details: 👇
AI2 công bố SERA - mô hình lập trình mở (8B-32B trên Qwen3), đạt 54.2% trên SWE-Bench Verified, vượt SOTA mở trước đó với chi phí thấp (~400$ để ngang mở, 12K$ cho mức công nghiệp). Agent nhanh, dễ truy cập và thích nghi với mọi repo. #AI #CodingAgent #SERA #Qwen3 #LLM #AI2 #LậpTrình #MôHìnhNgônNgữ #TríTuệNhânTạo #CôngNghệ
https://www.reddit.com/r/LocalLLaMA/comments/1qoqo8u/fine_tuning_open_coding_agents_fast_accessible/
I did some experiments to look at the capabilities of AI2's DataVoyager AI tool for data analysis. It can locate and/or generate Python code and can resolve dependencies, but the environment does not support modern NLP libraries (transformers, spaCy), so only deterministic, non-ML methods are used for extraction and analysis. I had it analyze 1000 abstracts gathered by Harzing's Publish or Perish on robust AI.
https://asta.allen.ai/share/f0b030eb-8eb3-4a79-9421-33cca998250a