kakaobank/KF-DeBERTa

카카오뱅크의 금융 특화 DeBERTa 사전학습 언어모델로 금융 도메인과 범용 도메인 모두에서 우수한 성능을 제공합니다.

개발 재료맘대로 써도 됨 · MITLLM 도구·RAGPython난이도

122+0이번 주0 찜

9포크2이슈

중간맛 분석

Python/Transformers 기반 모델로 DeBERTa-v2 아키텍처를 사용합니다. 난이도는 중간 정도로, NLP 기초가 있으면 쉽게 활용 가능합니다. 감정분석, 개체명인식(NER), 의도분류, 질의응답 등 다양한 금융 자연언어 처리 작업에 바로 적용할 수 있습니다. KLUE 벤치마크 8개 태스크와 금융 도메인 6개 데이터셋에서 기존 모델(KLUE-RoBERTa-Large, KoELECTRA)을 능가하는 성능을 입증했습니다.

이런 레포예요

이럴 때 쓰면 좋아요

금융 문서의 감정 분석 및 위험도 평가
은행권 뉴스 및 보도자료의 자동 분류
금융 거래 기록이나 계약서에서 핵심 개체명 추출
금융 관련 고객 질문에 대한 자동 응답 시스템 구축

핵심 기능

금융 도메인 특화 사전학습으로 금융 텍스트 이해 강화범용 + 금융 말뭉치 혼합 학습으로 두 도메인 모두 우수 성능KLUE 및 금융 벤치마크에서 기존 모델 초과 성능

대안 대비 차별점

금융 특화 말뭉치를 포함한 학습으로 일반 언어모델 대비 금융 도메인 작업에서 측정 가능한 성능 향상을 달성하면서도 범용 도메인 성능을 유지합니다.

준비물

Python 3.7+
PyTorch 또는 TensorFlow
Transformers 라이브러리

바로 시작하기

필요한 라이브러리 설치

pip install transformers torch

모델과 토크나이저 로드

# Python 스크립트에서
from transformers import AutoModel, AutoTokenizer

model = AutoModel.from_pretrained("kakaobank/kf-deberta-base")
tokenizer = AutoTokenizer.from_pretrained("kakaobank/kf-deberta-base")

텍스트 토크나이제이션 및 모델 추론

text = "카카오뱅크와 에프엔가이드가 금융특화 언어모델을 공개합니다."
tokens = tokenizer.tokenize(text)
print(tokens)

inputs = tokenizer(text, return_tensors="pt")
model_output = model(**inputs)
print(model_output)

별 추이 · 7일

122+0 / 7일

활용성 · 따라 만들기 좋은가

샘플 점수 20/100

관대한 라이선스
테스트 있음
예제 디렉토리
최근 활동
AGENTS.md
llms.txt
템플릿

⚪ 최근 활동 정보 없음 · 2023년 생성

이 레포에 깃밥 배지 달기

[![깃밥](https://www.gitbap.com/badge/kakaobank/KF-DeBERTa.svg)](https://www.gitbap.com/r/kakaobank/KF-DeBERTa)

🔌 클로드에서 바로 써보기

깃밥을 클로드에 연결하면 이런 레포를 클로드·커서·Codex에서 바로 찾고 체험할 수 있어요.

방법 ① 커넥터 URL

클로드 설정 → 커넥터에 이 주소를 붙여넣기.

https://www.gitbap.com/api/mcp

방법 ② 플러그인 (체험까지)

플러그인을 설치하면 /gitbap-trending·/gitbap-try 슬래시 커맨드로 레포를 그 자리에서 체험. Claude Code에서 아래 두 줄을 차례로 실행하세요.

/plugin marketplace add jakeparkcolde/gitbap-cowork

/plugin install gitbap-cowork@gitbap

연결 방법 자세히 →

AI가 README 기반으로 요약했습니다 · 원문 보기