apify/crawlee

웹 스크래핑과 브라우저 자동화를 위한 엔드투엔드 Node.js 라이브러리

개발 재료맘대로 써도 됨 · Apache-2.0자동화·워크플로우TypeScript난이도

25,112+193이번 주0 찜

1,584포크118이슈

중간맛 분석

TypeScript로 작성된 라이브러리로, PlaywrightCrawler와 PuppeteerCrawler 두 가지 크롤러를 지원합니다. HTTP/2 자동 지원, TLS 핑거프린팅, Cheerio/JSDOM 파서 통합, 자동 프록시 로테이션, 세션 관리 등이 포함됩니다. 로 프로젝트 부트스트랩 가능하며, 기본 설정만으로도 즉시 사용 가능합니다. Apify 플랫폼 배포 지원.

이런 레포예요

이럴 때 쓰면 좋아요

대규모 e-commerce 사이트에서 상품 정보와 가격 수집
JavaScript 렌더링이 필요한 동적 웹사이트의 데이터 추출
API 요청 기반 JSON 데이터 수집 및 자동화

핵심 기능

HTTP와 헤드리스 브라우저 크롤링 통합 인터페이스인간적 요청 생성 및 자동 봇 차단 우회자동 요청 큐 관리 및 데이터 스토리지

대안 대비 차별점

Playwright와 Puppeteer를 동일한 인터페이스로 통합 지원하며, 기본 설정에서 인간적 TLS 핑거프린팅과 헤더를 자동 생성하므로 복잡한 보안 설정 없이 즉시 신뢰성 있는 크롤러를 구축할 수 있습니다.

먹어본 사람들

실제로 차려 먹어본 손님들의 흔적이에요 — 한마디와 완주 인증 모두 검수 후 공개돼요.

시식평 · 먹어본 사람 한마디

아직 시식평이 없어요. 먹어보셨다면 첫 한마디를 남겨주세요.

다른 레포 시식평 구경하기 →

이 레포로 만든 것들

🖋 완주 인증하기

아직 이 레포로 만든 완주 인증이 없어요. 첫 밥도장을 찍어보세요!

이 레포, 해먹는 법

처음 오셨어요? 어렵지 않아요 — 위에서 아래로 따라 하면 내 컴퓨터에 이 레포를 차려서 바로 맛볼 수 있어요.

준비물

Node.js 16 이상
Playwright 또는 Puppeteer (선택사항)

바로 차려먹기Node.js (yarn)

깃밥이 레포 구조를 확인하고 만든 실행 명령이에요. 터미널에 붙여넣으면 받기부터 실행까지 한 번에 진행돼요.

git clone --depth 1 https://github.com/apify/crawlee.git &&
cd crawlee &&
yarn

실행 명령은 README를 확인하세요.

코드는 내 컴퓨터에서 실행돼요 — 처음 보는 레포라면 내용을 한번 훑어보고 실행하는 습관을 추천해요.

README가 안내하는 자세한 단계 보기

Crawlee CLI로 신규 프로젝트 생성

npx crawlee create my-crawler

프로젝트 디렉토리로 이동

cd my-crawler

프로젝트 시작

npm start

또는 기존 프로젝트에 수동 설치:

Crawlee와 Playwright 설치

npm install crawlee playwright

코드 작성 (예: index.js 또는 index.ts)

import { PlaywrightCrawler, Dataset } from 'crawlee';

const crawler = new PlaywrightCrawler({
    async requestHandler({ request, page, enqueueLinks, log }) {
        const title = await page.title();
        log.info(`Title of ${request.loadedUrl} is '${title}'`);
        await Dataset.pushData({ title, url: request.loadedUrl });
        await enqueueLinks();
    },
});

await crawler.run(['https://crawlee.dev']);

크롤러 실행

npm start

깃밥트라이로 맛보기

받아보기 귀찮고 살짝 불안했다면 — 안전 스캔부터 설치까지 터미널 한 줄로 끝나요.

터미널에 붙여넣으면 깃밥 안전 스캔 → 격리 폴더 clone → 설치 → 실행법 안내까지 자동이에요. 처음이어도 괜찮아요 — 이 한 줄이 전부예요.

npx gitbap-try apify/crawlee

Node.js만 있으면 설치 없이 실행돼요 · 깃밥트라이가 뭐예요? →

별 추이 · 7일

25,112+193 / 7일

활용성 · 따라 만들기 좋은가

샘플 점수 34/100

관대한 라이선스
테스트 있음
예제 디렉토리
최근 활동
AGENTS.md
llms.txt
템플릿

🟢 최근 활동 있음 · 2016년 생성

「자동화·워크플로우」 이런 레포, 매주 받아보실래요?

매주 월요일 아침, 골라 담은 밥상만. 광고 없이 · 언제든 해지.

내 레포인가요? README에 깃밥 배지 달기

[![깃밥](https://www.gitbap.com/badge/apify/crawlee.svg)](https://www.gitbap.com/r/apify/crawlee)

🔌 클로드에서 바로 써보기 — 깃밥 연결하는 법

깃밥을 클로드에 연결하면 이런 레포를 클로드·커서·Codex에서 바로 찾고 체험할 수 있어요.

방법 ① 커넥터 URL

클로드 설정 → 커넥터에 이 주소를 붙여넣기.

https://www.gitbap.com/api/mcp

방법 ② 플러그인 (체험까지)

플러그인을 설치하면 /gitbap-trending·/gitbap-try 슬래시 커맨드로 레포를 그 자리에서 체험. Claude Code에서 아래 두 줄을 차례로 실행하세요.

/plugin marketplace add jakeparkcolde/gitbap-cowork

/plugin install gitbap-cowork@gitbap

연결 방법 자세히 →

AI가 README 기반으로 요약했습니다 · 원문 보기