자연어로 안드로이드/iOS 폰을 자동으로 조종하는 AI 에이전트
중간맛 분석
Python 기반 LangGraph 에이전트로, 다중 LLM 지원(OpenAI, Google, xAI, MiniMax 등)하며 클라우드 또는 로컬 배포 가능합니다. AndroidWorld 벤치마크 100% 달성한 다중 에이전트 아키텍처로, 데이터 추출(JSON 구조화)·자동 조작·복합 태스크 분해를 수행합니다. 빠른 시작 지원하며, 안드로이드 에뮬레이터·실기기(USB 디버깅) 및 iOS 시뮬레이터(macOS, Xcode+fb-idb 필요) 지원하고, 게임처럼 접근성 데이터가 없는 앱은 효율이 제한적입니다.
이런 레포예요
이럴 때 쓰면 좋아요
- Gmail에서 미읽음 이메일 자동으로 찾아 발신자·제목 추출하기
- 설정 앱을 열어 배터리 잔량 확인하기
- 여러 앱을 연속으로 조작하여 복잡한 작업 자동화하기
핵심 기능
대안 대비 차별점
AndroidWorld 벤치마크 100% 달성한 유일한 오픈소스 프레임워크로, UI 트리 기반 의미 이해가 브라우저 자동화 수준의 정확도를 모바일 환경에서 구현합니다.
준비물
- Android Debug Bridge (ADB) (안드로이드용)
- Xcode + fb-idb (iOS 시뮬레이터용, macOS만)
- uv (Python 패키지 매니저)
- LLM API 키 (OpenAI, Google, xAI, MiniMax 중 하나)
바로 시작하기
- 환경 변수 설정:
cp .env.example .env
.env 파일을 열어 API 키 추가(OpenAI, Google, xAI 등 중 선택)
- (선택) LLM 설정 커스터마이징:
cp llm-config.override.template.jsonc llm-config.override.jsonc
llm-config.override.jsonc 편집하여 모델·프로바이더 변경
- 저장소 클론:
git clone https://github.com/minitap-ai/mobile-use.git && cd mobile-use
- Python 환경 설정:
uv venv
source .venv/bin/activate
(Windows: .venv\Scripts\activate)
- 의존성 설치:
uv sync
- 기본 명령 실행(안드로이드 디바이스/에뮬레이터 연결 필수):
python ./minitap/mobile_use/main.py "Go to settings and tell me my current battery level"
또는 Docker 빠른 시작(Linux/macOS):
chmod +x mobile-use.sh
bash ./mobile-use.sh "Open Gmail, find first 3 unread emails, and list their sender and subject line" --output-description "A JSON list of objects, each with 'sender' and 'subject' keys"
별 추이 · 7일
활용성 · 따라 만들기 좋은가
- 관대한 라이선스
- 테스트 있음
- 예제 디렉토리
- 최근 활동
- AGENTS.md
- llms.txt
- 템플릿
🟢 최근 활동 있음 · 2025년 생성
이 레포에 깃밥 배지 달기
[](https://www.gitbap.com/r/minitap-ai/mobile-use)🔌 클로드에서 바로 써보기
깃밥을 클로드에 연결하면 이런 레포를 클로드·커서·Codex에서 바로 찾고 체험할 수 있어요.
클로드 설정 → 커넥터에 이 주소를 붙여넣기.
https://www.gitbap.com/api/mcp플러그인을 설치하면 /gitbap-trending·/gitbap-try 슬래시 커맨드로 레포를 그 자리에서 체험. Claude Code에서 아래 두 줄을 차례로 실행하세요.
/plugin marketplace add jakeparkcolde/gitbap-cowork/plugin install gitbap-cowork@gitbapAI가 README 기반으로 요약했습니다 · 원문 보기