How many of us are evaling our skills?
Apastra는 AI 에이전트의 프롬프트와 스킬을 로컬에서 평가할 수 있는 경량화된 평가 프레임워크입니다. YAML과 JSONL 기반의 명세로 프롬프트, 데이터셋, 평가자, 테스트 스위트를 정의하며, 단위 테스트처럼 프롬프트 동작을 반복 검증할 수 있습니다. GitHub Actions와 연동한 자동 회귀 테스트도 지원해 품질 저하를 사전에 감지할 수 있습니다. 언어 독립적이며 Python 런타임을 포함해 간단히 설치해 바로 사용할 수 있어 AI 에이전트 개발과 운영에 유용합니다.
https://github.com/BintzGavin/apastra
#aievaluation #prompttesting #agentdevelopment #regressiontesting #apastra


