teaql/teaql-agent-kit
비즈니스 소프트웨어 작업에서 코딩 에이전트와 언어모델의 동작을 평가하는 환경
2,782+0이번 주9550
데모·홈페이지 열기teaql.io중간맛 분석
TEAQL(Domain-Driven Design 기반 비즈니스 소프트웨어 프레임워크) 위에서 동작하는 코딩 에이전트 평가 도구입니다. Java/Rust 스택 지원, MIT 라이선스. 기능 완성도, API 준수, 할루시네이션 API 개수, 감사 커버리지, 프레임워크 규율, 토큰 효율성 등 7개 차원으로 평가합니다. main 브랜치에서 명확한 가이드와 체크포인트를 기반으로 평가하며, autonomous 브랜치에서 에이전트의 자가 수리 및 프레임워크 위반 행동을 스트레스 테스트합니다. 평가 보고서가 레포지토리에 발행될 예정이나 현재는 프로토타입 단계입니다.
이런 레포예요
이럴 때 쓰면 좋아요
- AI 코딩 에이전트가 비즈니스 규칙을 얼마나 잘 지키는지 평가할 때
- 자동 코드 생성이 프로덕션 배포 전에 얼마나 안전한지 판단할 때
- 코딩 에이전트의 할루시네이션과 자가 수리 능력을 측정할 때
핵심 기능
다차원 평가 프레임워크 (기능성, API 준수, 감사 커버리지, 토큰 효율성)통제 평가와 자동 평가 두 가지 모드Java/Rust 스택 지원으로 구현 간 의미론 보존 측정
대안 대비 차별점
일반 코드 벤치마크와 달리 비즈니스 의미론, 프레임워크 경계 준수, 감사 추적 같은 실무 프로덕션 요구사항을 동시에 측정합니다.
별 추이 · 7일
2,782+0 / 7일
활용성 · 따라 만들기 좋은가
베스트 샘플샘플 점수 62/100
- 관대한 라이선스
- 테스트 있음
- 예제 디렉토리
- 최근 활동
- AGENTS.md
- llms.txt
- 템플릿
🟢 최근 활동 있음 · 2018년 생성
AI가 README 기반으로 요약했습니다 · 원문 보기