DARKNAVY (@DarkNavyOrg)

Cursor의 ‘Auto-Run in Sandbox’ 모드를 다룬 트윗으로, 사용자 친화적이지만 원격 URL 콘텐츠를 따를 경우 프롬프트 인젝션에서 비인가 명령 실행까지 이어질 수 있는 보안 취약점 가능성을 지적한다. AI 코딩 에이전트 보안 이슈가 핵심이다.

https://x.com/DarkNavyOrg/status/2054095022786855007

#cursor #security #promptinjection #codingagent

DARKNAVY (@DarkNavyOrg) on X

Coding agent hacking series 3/3: Cursor. The "Auto-Run in Sandbox" mode of @cursor_ai is great: user-friendly, convenient, and supposedly safer. But just like Codex CLI, following content from a remote URL can chain vulnerabilities from prompt injection to unauthorized command

X (formerly Twitter)

Show HN: Sigmashake Desktop – AI Coding Agent Guardrails

SigmaShake Desktop는 AI 코딩 에이전트가 잘못된 도구를 사용하거나 데이터베이스를 파괴하는 등의 위험을 방지하는 로컬 기반 가드레일 도구입니다. 주요 AI 코딩 툴과 호환되며 클라우드나 샌드박스 없이 작동합니다. 무료로 제공되며 개발 과정은 Twitch와 YouTube에서 공개 중입니다.

https://sigmashake.com/desktop

#ai #codingagent #guardrails #localtool #opensource

Download SigmaShake Desktop — SigmaShake

Download SigmaShake Desktop — the desktop app for AI agent guardrails. Free for Windows, macOS, and Linux. Block destructive AI tool calls in under 2ms.

SigmaShake

Learning on the Shop Floor

Shopify의 내부 코딩 에이전트 도구인 River는 모든 대화를 공개 Slack 채널에서 진행하여 작업의 투명성을 극대화하고, 직원들이 서로의 작업을 관찰하며 자연스럽게 학습할 수 있는 환경을 조성한다. 이는 Lehrwerkstatt(교육 작업장) 개념을 대규모로 구현한 사례로, 별도의 교육 계획 없이도 모두가 서로에게서 배우는 문화를 만든다. Midjourney의 초기 성공 사례와 유사하게, 공개된 작업 공간에서의 상호작용이 학습과 협업을 촉진하는 중요한 역할을 한다.

https://simonwillison.net/2026/May/11/learning-on-the-shop-floor/

#shopify #codingagent #collaborativelearning #slack #developertools

Learning on the Shop floor

Tobias Lütke describes Shopify's internal coding agent tool, River, which operates entirely in public on their Slack: River does not respond to direct messages. She politely declines and suggests to …

Simon Willison’s Weblog

George (@odysseus0z)

Claude Code에 /goal 네이티브 기능이 추가되었고, Cursor도 이미 이를 출시했다는 내용으로, AI 코딩 에이전트의 목표 분해와 서브에이전트 협업 기능 개선을 알립니다.

https://x.com/odysseus0z/status/2053975468559532091

#claudecode #cursor #codingagent #ai #developertools

George (@odysseus0z) on X

Claude Code has native /goal now as well! Now imagine the main agent can break things down and assign subgoals for the subagents... imagine each one can be paired with a verifier to check the work to keep it going until done... oh @cursor_ai already shipped it

X (formerly Twitter)

Show HN: Zot coding agent now supports DeepSeek

Zot는 Go로 작성된 경량 터미널 코딩 에이전트로, Anthropic, OpenAI, Kimi, DeepSeek, Google Gemini 등 다양한 AI 모델과 연동된다. 단일 바이너리로 실행되며, 파일 편집, 셸 명령 실행, 텔레그램 DM 응답 등 다양한 기능을 제공한다. 확장성도 뛰어나 JSON-RPC 프로토콜을 통해 다양한 언어로 확장 가능하며, 세션 관리, 사이드 채팅, 도구 호출 확인, 모델 폴백 등 실용적인 기능을 갖추고 있다. 이번 업데이트로 DeepSeek API 지원이 추가되어 더 많은 AI 서비스와 통합할 수 있게 되었다. 개발자들이 별도의 런타임이나 복잡한 설치 없이 바로 활용할 수 있는 실용적인 도구다.

https://www.zot.sh/#about

#codingagent #go #deeplseek #llm #aiintegration

zot. Yet another coding agent harness.

A lightweight, single-binary coding agent harness written in Go. Anthropic, OpenAI, Kimi, DeepSeek, Google Gemini, local models, four built-in tools, three run modes, extensions in any language, and a built-in Telegram bridge.

zot

Artificial Analysis (@ArtificialAnlys)

Artificial Analysis가 Coding Agent Index를 발표했습니다. 이 벤치마크는 에이전트 하네스와 모델 조합이 3개 주요 벤치마크에서 어떻게 성능을 내는지, 토큰 사용량과 비용까지 함께 평가해 AI 코딩 에이전트 선택에 도움을 줍니다.

https://x.com/ArtificialAnlys/status/2053865095076438427

#codingagent #benchmark #ai #evaluation #developers

Artificial Analysis (@ArtificialAnlys) on X

Announcing the Artificial Analysis Coding Agent Index! Our new coding agent benchmarks measure how combinations of agent harnesses and models perform on 3 leading benchmarks, token usage, cost and more When developers use AI to code they’re choosing a model, but also pairing it

X (formerly Twitter)

Sergey Karayev (@sergeykarayev)

엔지니어, PM, 디자이너가 Slack에서 동일한 멀티플레이어 코딩 에이전트 세션에 참여해 협업한다는 내용입니다. 팀의 개발 방식과 학습 방식을 크게 바꾼 AI 협업 도구 활용 사례로, @Superconductor에서 제공됩니다.

https://x.com/sergeykarayev/status/2053905762565644369

#codingagent #slack #collaboration #aiassistant #productivity

Sergey Karayev (@sergeykarayev) on X

@simonw we've been on 100% multiplayer coding agent sessions for many months now engineers/PMs/designers contribute to the same agent session from Slack fundamentally changed how our team works and learns together available to all in @Superconductor

X (formerly Twitter)

Building pi in a World of Slop [video]

마리오 제크너가 개발한 코딩 에이전트 'pi'는 자체 수정과 확장성을 갖춘 최소한의 에이전트 코어로, 기존 에이전트 하네스들이 가진 컨텍스트 관리 문제를 해결하는 데 중점을 두고 있다. TypeScript 기반의 확장성과 'YOLO' 보안 철학을 적용해 간결하면서도 강력한 기능을 제공하며, 채팅방, NES, Doom 등 다양한 확장 예시를 통해 실용성을 입증했다. 또한, 오픈소스 에이전트들이 복잡성을 야기하는 현상에 대한 비판과 함께, 에이전트를 워크플로우에 효과적으로 통합하는 실용적인 조언도 제시한다. 이 영상은 AI 에이전트 개발과 오픈소스 생태계에 대한 깊은 통찰을 제공한다.

https://www.youtube.com/watch?v=RjfbvDXpFls

#aiagent #opensource #typescript #codingagent #softwaredevelopment

Building pi in a World of Slop — Mario Zechner

YouTube

Self-upgradable software: A Pi setup

작성자는 Pi라는 커스텀 가능한 코딩 에이전트를 활용해 macOS 환경에서 Tuna 개발 워크플로우를 구축했다. Pi는 TypeScript 기반으로 사용자가 자연어로 직접 설정을 변경할 수 있어 vim과 유사한 커스터마이징 경험을 제공하며, 작업 테이블 관리, Git 작업 자동화, 터미널 UI 개선 등 개발 생산성을 높이는 다양한 기능을 포함한다. GPT 5.5 모델을 주로 사용하며, 에이전트가 스스로 설정을 업그레이드하고 작업을 수행하는 미래형 소프트웨어 개발 환경을 제시한다. 이 접근법은 AI 에이전트와 개발자 간의 상호작용을 혁신적으로 단순화하는 사례로 볼 수 있다.

https://mikkelmalmberg.com/2026/self-upgradable-software-a-pi-setup

#codingagent #pi #customization #gpt #softwaredevelopment

Self-upgradable software: A Pi setup · Mikkel Malmberg

Before I tell you about my customized Pi coding agent setup, I want to briefly mention how any vanilla coding agent is more than enough. I built most of Tuna...

Mikkel Malmberg

You Need AI That Reduces Maintenance Costs

AI 코딩 에이전트가 생산성을 높여도 유지보수 비용이 그만큼 줄지 않으면 장기적으로 팀 생산성은 오히려 악화된다. 코드 작성 속도가 두 배가 되면 유지보수 비용은 절반으로 줄어야 실질적인 이득이 발생하며, 그렇지 않으면 유지보수 부담이 누적되어 생산성이 하락한다. 현재 AI 코딩 도구들은 유지보수 비용을 크게 줄이지 못하는 경우가 많아, 단기 속도 향상에 따른 장기적 비용 증가 문제를 해결하는 것이 중요하다. 따라서 AI 도입 시 코드 품질과 유지보수 효율성 개선에 집중해야 한다.

https://www.jamesshore.com/v2/blog/2026/you-need-ai-that-reduces-your-maintenance-costs

#ai #codingagent #maintenancecost #productivity #softwareengineering

James Shore: You Need AI That Reduces Maintenance Costs