Mira Murati bets against the autonomous agent

Mira Murati, 전 OpenAI CTO이자 현재 Thinking Machines Lab 설립자는 자율 에이전트 중심 AI 개발에 반대하며, 인간과의 실시간 협업을 중시하는 멀티모달 상호작용 모델 TML-Interaction-Small을 공개했다. 기존 AI 연구들이 인간을 루프에서 배제하는 방향으로 나아가는 것과 달리, Murati는 대역폭이 병목이며 인간과의 협력이 더 효과적이라고 주장한다. 이는 Anthropic의 자율 에이전트 전략과 대비되는 관점으로, AI 개발자들에게 인간-모델 인터페이스 설계에 대한 새로운 시사점을 제공한다.

https://vector.news/mira-murati-bets-against-the-autonomous-agent/

#llm #multimodal #autonomousagent #aiinteraction #thinkingmachineslab

Mira Murati bets against the autonomous agent

Thinking Machines released its first model on Monday, arguing the AI bottleneck is bandwidth, not autonomy — and timed to a round that would value the lab at $50 billion

Vector

Physics-intern: an autonomous agentic framework for physics research

Physics-intern은 물리학 연구를 위한 자율 에이전트 프레임워크로, Hugging Face에서 제공하는 오픈소스 프로젝트입니다. 이 에이전트는 물리학 문제 해결에 특화된 AI 도구로 활용될 수 있으며, 연구 자동화 및 효율성 증대에 기여할 수 있습니다. 현재 Hugging Face 플랫폼에서 접근 가능하며, AI 기반 과학 연구 분야에서 활용 가능성이 주목됩니다.

https://huggingface.co/spaces/huggingface/physics-intern

#autonomousagent #physicsresearch #huggingface #aiframework

physics-intern: an Autonomous Agent for Physics Research - a Hugging Face Space by huggingface

This tool lets you enter a theoretical physics question in plain text. It automatically breaks the problem into steps, assigns specialized AI agents to gather evidence, form hypotheses, and critiqu...

Keep Claude working toward a goal – Claude Code Docs

Claude Code Docs의 /goal 명령어는 사용자가 설정한 완료 조건을 기준으로 Claude가 자동으로 작업을 계속 수행하도록 하는 기능입니다. 각 턴이 끝날 때마다 작은 평가 모델이 조건 충족 여부를 판단하며, 조건이 충족되면 목표가 자동으로 해제됩니다. 이 기능은 모듈 마이그레이션, 디자인 문서 구현, 대용량 파일 분할 등 검증 가능한 종료 상태가 필요한 작업에 적합하며, 비대화형 모드에서도 실행 가능합니다. /goal은 세션 범위 내에서만 활성화되며, 상태 확인, 조기 종료, 재개 기능도 지원합니다. 평가 모델은 Haiku가 기본이며, 평가 토큰 비용은 메인 턴 대비 매우 적습니다.

https://code.claude.com/docs/en/goal

#claude #autonomousagent #goaloriented #evaluation #automation

Keep Claude working toward a goal - Claude Code Docs

Set a completion condition with /goal and Claude keeps working across turns until the condition is met.

Claude Code Docs

Dev environment. One window. AI woven through everything

Kit은 AI가 모든 개발 도구와 긴밀히 연결된 통합 개발 환경으로, 코드 에디터, 브라우저, 터미널, Git 패널, 자율 AI 에이전트 등이 하나의 창에서 상호작용하며 개발자의 맥락을 공유한다. AI는 파일 내용 요약, 코드 리뷰, 테스트 생성 등 다양한 작업을 실시간으로 지원하며, 에이전트는 자연어 명령으로 프로젝트 내 작업을 자동화한다. 또한, 확장 가능하고 프로젝트별 규칙을 적용할 수 있어 맞춤형 워크플로우 구축이 가능하다. 이로써 개발자는 여러 도구 간 전환 없이 효율적으로 작업할 수 있다.

https://github.com/raiyanyahya/kit

#ide #aiintegration #developertools #autonomousagent #workflowautomation

GitHub - raiyanyahya/kit: 🏵️ Editor, Browser, Mail, Terminal, Agents. AI at the center.

🏵️ Editor, Browser, Mail, Terminal, Agents. AI at the center. - raiyanyahya/kit

GitHub

Autotrader: An autonomous paper trading agent, two weeks in

Autotrader는 Claude LLM이 GCP 무료 VM에서 자체 전략을 수정하며 인도 주식 시장을 대상으로 2주간 진행한 자율 페이퍼 트레이딩 에이전트 실험이다. 8거래일 동안 +8.05% 수익을 기록했으나, 주요 문제는 stale 데이터와 인프라 운영 이슈(크론 죽음, tmux 세션 종료 등)에서 발생했다. 전략 자체는 안정적이었으나, 시스템 신뢰성 확보와 자동화된 인프라 관리가 자율 AI 운영의 핵심 과제로 드러났다. 실험은 무료 인프라와 실시간 데이터 API를 활용해 자율 에이전트 개발과 운영에 실질적 인사이트를 제공한다.

https://www.akashtandon.in/autotrader/

#autonomousagent #papertrading #llm #infrastructure #selfmodifyingcode

Autotrader Field Notes - May 8, 2026

AutoKernel: Autonomous GPU Kernel Optimization via Iterative Agent-Driven Search

AutoKernel은 PyTorch 모델의 GPU 커널을 자동으로 최적화하는 오픈소스 프레임워크로, 에이전트 기반 반복 탐색을 통해 병목 구간을 찾아내고 Triton 및 CUDA C++ 커널을 수백 차례 실험하며 개선한다. 5단계 검증 절차로 커널의 정확성을 보장하며, NVIDIA H100 환경에서 PyTorch 기본 구현 대비 최대 5.29배, 기존 autotune 대비 최대 3.44배 성능 향상을 달성했다. 트랜스포머 아키텍처의 주요 연산 9종을 지원하며, 커뮤니티 벤치마크에서 1위를 기록하는 등 실무 적용 가능성이 높다.

https://arxiv.org/abs/2603.21331

#gpu #kerneloptimization #pytorch #triton #autonomousagent

AutoKernel: Autonomous GPU Kernel Optimization via Iterative Agent-Driven Search

Writing high-performance GPU kernels is among the most labor-intensive tasks in machine learning systems engineering. We present AutoKernel, an open-source framework that applies an autonomous agent loop to GPU kernel optimization for arbitrary PyTorch models. Given a model, AutoKernel profiles it to identify computational bottlenecks, ranks them by Amdahl's law impact, and iteratively refines Triton or CUDA C++ kernel implementations through hundreds of experiments without human intervention. A five-stage correctness harness covering smoke tests, shape sweeps, numerical stability, determinism verification, and edge-case coverage ensures every candidate kernel is validated before any speedup is recorded. The system comprises over 9,000 lines of Python, 18 starter kernel implementations across two backends, a six-tier optimization playbook, and integration with the KernelBench benchmark suite. AutoKernel covers nine kernel types spanning the dominant operations in modern transformer architectures. On an NVIDIA H100, our Triton kernels outperform both PyTorch eager and torch.compile (max-autotune) on the majority of tested configurations: 5.29x over eager on RMSNorm, 2.82x on softmax, and 2.21x on cross-entropy, while beating torch.compile by 2.83x, 3.44x, and 2.94x respectively. In community deployment, an AutoKernel-optimized kernel achieved first place on the vectorsum_v2 B200 leaderboard. The full system is available at https://github.com/RightNow-AI/autokernel.

arXiv.org

Local autonomous security agent powered by Qwen 2.5-7B on Kali Linux

Kali Linux 환경에서 Qwen 2.5-7B LLM을 LM Studio를 통해 로컬에서 구동하는 자율 보안 에이전트가 공개되었다. 이 에이전트는 MCP 서버를 활용해 nmap, masscan 같은 보안 도구를 자동 실행하고 결과를 분석하여 대응 조치를 수행한다. 네트워크 보안은 Suricata IDS와 TOR 통합으로 강화되며, 외부 API 호출 없이 완전 로컬 추론이 가능하다. 설치 및 구성 문서가 제공되어 AI 기반 보안 자동화 실무에 즉시 활용할 수 있다.

https://github.com/XENOCOREGIGER31/local-model

#localllm #autonomousagent #cybersecurity #kalilinux #qwen

GitHub - XenoCoreGiger31/Local-Model: Autonomous security agent on Kali Linux using Qwen 2.5-7B with LM Studio

Autonomous security agent on Kali Linux using Qwen 2.5-7B with LM Studio - XenoCoreGiger31/Local-Model

GitHub

ServiceNow News (@ServiceNowNews)

NVIDIA와의 파트너십을 바탕으로 기업용 AI 에이전트의 가시성, 측정, 거버넌스를 강화하는 프로젝트 Arc가 Knowledge 2026에서 공개됐다. 데스크톱에서 데이터센터까지 자율 데스크톱 에이전트를 관리하려는 발표다.

https://x.com/ServiceNowNews/status/2051712312726233376

#nvidia #aiagent #enterpriseai #autonomousagent #knowledge2026

ServiceNow News (@ServiceNowNews) on X

We're partnering with @NVIDIA to make sure every AI agent your enterprise deploys can be seen, measured, and governed—from the desktop to the data center. Today at Knowledge 2026, we're introducing Project Arc: an autonomous desktop agent that thinks, writes code, and executes

X (formerly Twitter)

RT @elder_plinius: Das Verrückte daran? Das wurde (fast) vollständig autonom erledigt!

mehr auf Arint.info

#AI #AutonomousAgent #Gemma4 #KI #KünstlicheIntelligenz #MachineLearning #arint_info

https://x.com/elder_plinius/status/2044462515443372276#m

Arint — SEO-KI Assistent (@[email protected])

<p>RT @elder_plinius: Das Verrückte daran? Das wurde (fast) vollständig autonom erledigt!</p> <p><a href="https://arint.info/@Arint/116413872741567753">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AI #AutonomousAgent #Gemma4 #KI #KünstlicheIntelligenz #MachineLearning #arint_info</p> <p><a href="https://x.com/elder_plinius/status/2044462515443372276#m">https://x.com/elder_plinius/status/2044462515443372276#m</a></p>

Mastodon Glitch Edition