K.Ishi@生成AIの産業応用 (@K_Ishi_AI)

Claude Mythos가 인간이 3시간 이내에 수행 가능한 소프트웨어 작업에서 거의 실패하지 않는다는 성능 평가를 언급한 트윗이다. 특히 1시간 내 완료 가능한 작업에서는 실패율이 거의 0에 가깝다고 강조한다.

https://x.com/K_Ishi_AI/status/2053014022551957774

#claude #llm #softwareengineering #benchmark #ai

K.Ishi@生成AIの産業応用 (@K_Ishi_AI) on X

Claude Mythosの性能で驚くべきもう一つの点は、「人が3時間以内に処理できるソフトウェアタスクなら、Mythosはほとんど失敗しない」ことだ。 特に、人間にとって1時間程度のタスクなら失敗率はほぼ0。 実務には高難度のタスクは多くないことを考えると、もうAIで完結すると言っても過言ではない。

X (formerly Twitter)

What does it matches, Precious? What's it match, eh?

#SoftwareEngineering #Developers #Memes

I Will Never Use AI to Code

전 SKUTOPIA CTO Anthony Manning-Franklin은 AI를 이용한 코딩에 반대하는 이유를 상세히 설명한다. 그는 코딩을 즐기며 AI가 코딩을 대체하면 개발자의 기술이 퇴화하고, 결국 소프트웨어 산업 전반의 역량이 붕괴될 위험이 있다고 경고한다. AI가 전문가의 작업을 대체하면 신규 인재 양성이 중단되고, AI 모델도 점차 품질 저하와 환각 문제에 직면할 수 있다고 지적한다. 또한 AI 기반 코딩은 팀 내 협업과 코드 이해도를 저해하며, 현재 AI 산업이 막대한 부채에 의존해 지속 가능하지 않다고 분석한다.

https://antman-does-software.com/i-will-never-use-ai-to-code-or-write

#ai #softwareengineering #skilldecay #aicodegeneration #aibusiness

Pair programming is terrible for a team…

When it gets forced upon them…

It can be a powerful tool when used appropriately and without dogma.

The mindset of the engineers and the relationships between them are crucial for it to succeed.

Be pragmatic; allow engineers to pair up if they want to, but don’t force it.

Have you ever seen pair programming fail miserably?

#developers #coding #softwaredevelopment #softwareengineering #wellbeing #mindset #mentalhealth

New survey:
• 64% of developers report 25%+ productivity gains from AI
• Top use cases: code writing, reviews, explanations
• Claude Code, Gemini Code Assist & GitHub Copilot lead adoption
Challenges remain around cost, governance & code quality.

Source: https://devops.com/survey-sees-ai-driving-devops-productivity-gains-despite-challenges/

Follow TechNadu for more AI and DevOps updates.
#AI #DevOps #SoftwareEngineering #InfoSec

Show HN: AI-native tech assessments (end of LeetCode)

openround.ai는 AI를 활용해 실제 문제 해결 능력을 평가하는 AI 네이티브 엔지니어 채용 플랫폼입니다. 기존 코딩 테스트 대신 AI를 활용한 프로젝트 기반 평가를 제공하며, AI가 쉽게 해결할 수 없는 평가 환경 설계와 AI 활용 능력에 따른 엔지니어 차별화에 중점을 둡니다. 이는 AI 시대에 맞는 실무 중심의 기술 평가 방식을 제안하는 점에서 의미가 있습니다.

https://www.openround.ai/

#ainative #technicalassessment #hiring #aiintegration #softwareengineering

OpenRound — Assessments to hire AI-native Engineers

Don't ban AI from your interviews. Test with OpenRound to check how candidates ship with AI.

OpenRound

📆 Daily Prompt [2026-05-09]: What is your favorite piece of retro technology?

https://kmcd.dev/prompts/2026-05-09/
#Dailyprompt #writing #softwareengineering

What is your favorite piece of retro technology?

Depth-first search into networking, programming, web development and random tech topics by a bored software engineer.

kmcd.dev

Try Out AgentBase

AgentBase는 PR 리뷰 시 여러 도구와 탭을 하나의 통합된 작업 공간으로 모아 리뷰 효율을 극대화하는 도구입니다. Slack 알림, AI 기반 코드 설명, 코드베이스 내 영향 범위 분석 등 리뷰에 필요한 모든 정보를 한 페이지에서 제공해 PR 리뷰 시간을 약 4분으로 단축합니다. 또한, 리뷰 진행 상황에 따라 시각적 피드백을 주는 '정원' 기능과 개인정보 보호를 위한 자동 비밀 정보 마스킹 기능도 포함되어 있습니다. 대규모 엔지니어링 조직에서의 경험을 바탕으로 설계되어 AI가 생성하는 PR 증가에 대응하는 데 최적화되어 있습니다.

https://useagentbase.com/

#prreview #developerproductivity #aiassistant #softwareengineering #privacy

AgentBase — PR review you'll actually want to open

Author Intent on the diff. An agent that's read your codebase. Slack-native flow. Noise pruned. A garden that grows as you review.

AgentBase

Feeding the Machine

AI 선도 기업들이 AGI 개발을 위해 방대한 데이터와 소프트웨어 엔지니어를 필요로 하는 가운데, 스타트업 Mercor는 자동화된 인력 중개 플랫폼으로 빠르게 성장하며 연간 5억 달러 매출을 달성했다. 특히 Scale AI가 1,200명의 소프트웨어 엔지니어를 요구하면서 데이터 라벨링 및 AI 학습 데이터 생산 분야의 인력 수요가 급증하고 있다. Mercor는 중간 플랫폼 문제를 해결하며 AI 데이터 작업자들의 임금 문제를 개선하는 방향으로 사업을 확장 중이다.

https://www.theverge.com/cs/features/831818/ai-mercor-handshake-scale-surge-staffing-companies

#ai #trainingdata #softwareengineering #automation #scaleai

Feeding the machine

Frontier labs like OpenAI and Anthropic need vast amounts of data in the race to achieve AGI. This comes at a pretty penny — billions of dollars — and little-known companies like Mercor and Handshake are cleaning up in this AI hype cycle.

The Verge

What we lost the last time code got cheap

코드 생산 비용이 급격히 낮아진 현재, AI가 생성하는 코드는 기능적으로는 충분하지만 코드 작성 의도와 맥락이 결여되어 있어 이해와 유지보수가 어려워지고 있다. 과거 오프쇼어 개발 시절에도 코드 이해의 어려움이 있었지만, 당시에는 적어도 개발자가 의도를 알고 있었다. 이제는 AI가 생성한 코드에 대한 이해가 부족해지면서, 개발자 도구와 조직 문화가 코드 이해를 우선시하는 방향으로 진화해야 한다는 점이 강조된다. 이는 단순히 코드 생산 속도를 높이는 것을 넘어, 코드 이해를 돕는 새로운 도구와 실천법 개발이 필요함을 시사한다.

https://www.poppastring.com/blog/what-we-lost-the-last-time-code-got-cheap

#aiassisteddevelopment #codecomprehension #softwareengineering #developertools

What We Lost the Last Time Code Got Cheap

I worked at a startup in Toledo called Heartland Information Services. We ...