vllm-project/vllm

PagedAttention 기반 고속 LLM 추론·서빙 라이브러리로 처리량 최적화와 유연한 분산 배포를 지원

개발 재료맘대로 써도 됨 · Apache-2.0LLM 도구·RAGPython난이도

87,799+654이번 주0 찜

20,107포크2,039이슈

중간맛 분석

Python 기반이며 NVIDIA/AMD GPU, TPU, CPU 등 다양한 하드웨어를 지원합니다. 핵심은 PagedAttention 메모리 관리로 높은 처리량을 달성하며, FP8·INT4·GPTQ 등 양자화 기법을 통해 모델 크기를 줄일 수 있습니다. OpenAI 호환 서버로 바로 배포 가능하고, Llama·Qwen·DeepSeek·GPT 계열 모델을 즉시 지원합니다. 난이도는 설치 후 기본 추론은 쉽지만 분산 배포와 커스텀 최적화는 고급입니다.

이런 레포예요

이럴 때 쓰면 좋아요

고처리량 LLM API 서버를 OpenAI 호환 인터페이스로 빠르게 배포하기
파인튜닝된 Llama·Qwen 모델을 프로덕션 환경에서 효율적으로 서빙하기
양자화(INT4, FP8)와 멀티 GPU 분산처리로 대규모 모델 추론 비용 절감하기

핵심 기능

PagedAttention 기반 메모리 효율화200+ Hugging Face 모델 아키텍처 지원다중 양자화 기법(INT4, FP8, GPTQ, AWQ 등)과 추측 디코딩

대안 대비 차별점

PagedAttention 메모리 관리로 TensorRT-LLM 대비 유연성을, Ray Serve·Triton 대비 모델 호환성을 제공하며, UC Berkeley 발원의 활발한 오픈소스 커뮤니티로 신규 모델과 기법을 빠르게 지원합니다.

먹어본 사람들

실제로 차려 먹어본 손님들의 흔적이에요 — 한마디와 완주 인증 모두 검수 후 공개돼요.

시식평 · 먹어본 사람 한마디

아직 시식평이 없어요. 먹어보셨다면 첫 한마디를 남겨주세요.

다른 레포 시식평 구경하기 →

이 레포로 만든 것들

🖋 완주 인증하기

아직 이 레포로 만든 완주 인증이 없어요. 첫 밥도장을 찍어보세요!

이 레포, 해먹는 법

처음 오셨어요? 어렵지 않아요 — 위에서 아래로 따라 하면 내 컴퓨터에 이 레포를 차려서 바로 맛볼 수 있어요.

준비물

Python 3.9+
NVIDIA/AMD GPU 또는 CPU (GPU 권장)

바로 차려먹기Python (uv)

깃밥이 레포 구조를 확인하고 만든 실행 명령이에요. 터미널에 붙여넣으면 받기부터 실행까지 한 번에 진행돼요.

git clone --depth 1 https://github.com/vllm-project/vllm.git &&
cd vllm &&
uv sync

uv가 없다면: brew install uv · 실행 명령은 README를 확인하세요.

코드는 내 컴퓨터에서 실행돼요 — 처음 보는 레포라면 내용을 한번 훑어보고 실행하는 습관을 추천해요.

README가 안내하는 자세한 단계 보기

uv 또는 pip으로 vLLM 설치

uv pip install vllm

(선택) 소스에서 빌드

git clone https://github.com/vllm-project/vllm.git
cd vllm
python setup.py develop

공식 문서의 Quickstart 가이드 참고

https://docs.vllm.ai/en/latest/getting_started/quickstart.html

깃밥트라이로 맛보기

받아보기 귀찮고 살짝 불안했다면 — 안전 스캔부터 설치까지 터미널 한 줄로 끝나요.

터미널에 붙여넣으면 깃밥 안전 스캔 → 격리 폴더 clone → 설치 → 실행법 안내까지 자동이에요. 처음이어도 괜찮아요 — 이 한 줄이 전부예요.

npx gitbap-try vllm-project/vllm

Node.js만 있으면 설치 없이 실행돼요 · 깃밥트라이가 뭐예요? →

별 추이 · 7일

87,799+654 / 7일

활용성 · 따라 만들기 좋은가

베스트 샘플샘플 점수 80/100

관대한 라이선스
테스트 있음
예제 디렉토리
최근 활동
AGENTS.md
llms.txt
템플릿

🟢 최근 활동 있음 · 2023년 생성

「LLM 도구·RAG」 이런 레포, 매주 받아보실래요?

매주 월요일 아침, 골라 담은 밥상만. 광고 없이 · 언제든 해지.

내 레포인가요? README에 깃밥 배지 달기

[![깃밥](https://www.gitbap.com/badge/vllm-project/vllm.svg)](https://www.gitbap.com/r/vllm-project/vllm)

🔌 클로드에서 바로 써보기 — 깃밥 연결하는 법

깃밥을 클로드에 연결하면 이런 레포를 클로드·커서·Codex에서 바로 찾고 체험할 수 있어요.

방법 ① 커넥터 URL

클로드 설정 → 커넥터에 이 주소를 붙여넣기.

https://www.gitbap.com/api/mcp

방법 ② 플러그인 (체험까지)

플러그인을 설치하면 /gitbap-trending·/gitbap-try 슬래시 커맨드로 레포를 그 자리에서 체험. Claude Code에서 아래 두 줄을 차례로 실행하세요.

/plugin marketplace add jakeparkcolde/gitbap-cowork

/plugin install gitbap-cowork@gitbap

연결 방법 자세히 →

AI가 README 기반으로 요약했습니다 · 원문 보기