kakaobank/KF-DeBERTa

카카오뱅크의 금융 특화 DeBERTa 사전학습 언어모델로 금융 도메인과 범용 도메인 모두에서 우수한 성능을 제공합니다.

개발 재료맘대로 써도 됨 · MITLLM 도구·RAGPython난이도
122+0이번 주0
9포크2이슈

중간맛 분석

Python/Transformers 기반 모델로 DeBERTa-v2 아키텍처를 사용합니다. 난이도는 중간 정도로, NLP 기초가 있으면 쉽게 활용 가능합니다. 감정분석, 개체명인식(NER), 의도분류, 질의응답 등 다양한 금융 자연언어 처리 작업에 바로 적용할 수 있습니다. KLUE 벤치마크 8개 태스크와 금융 도메인 6개 데이터셋에서 기존 모델(KLUE-RoBERTa-Large, KoELECTRA)을 능가하는 성능을 입증했습니다.

이런 레포예요

이럴 때 쓰면 좋아요

  • 금융 문서의 감정 분석 및 위험도 평가
  • 은행권 뉴스 및 보도자료의 자동 분류
  • 금융 거래 기록이나 계약서에서 핵심 개체명 추출
  • 금융 관련 고객 질문에 대한 자동 응답 시스템 구축

핵심 기능

금융 도메인 특화 사전학습으로 금융 텍스트 이해 강화범용 + 금융 말뭉치 혼합 학습으로 두 도메인 모두 우수 성능KLUE 및 금융 벤치마크에서 기존 모델 초과 성능

대안 대비 차별점

금융 특화 말뭉치를 포함한 학습으로 일반 언어모델 대비 금융 도메인 작업에서 측정 가능한 성능 향상을 달성하면서도 범용 도메인 성능을 유지합니다.

준비물

  • Python 3.7+
  • PyTorch 또는 TensorFlow
  • Transformers 라이브러리

바로 시작하기

  1. 필요한 라이브러리 설치
pip install transformers torch
  1. 모델과 토크나이저 로드
# Python 스크립트에서
from transformers import AutoModel, AutoTokenizer

model = AutoModel.from_pretrained("kakaobank/kf-deberta-base")
tokenizer = AutoTokenizer.from_pretrained("kakaobank/kf-deberta-base")
  1. 텍스트 토크나이제이션 및 모델 추론
text = "카카오뱅크와 에프엔가이드가 금융특화 언어모델을 공개합니다."
tokens = tokenizer.tokenize(text)
print(tokens)

inputs = tokenizer(text, return_tensors="pt")
model_output = model(**inputs)
print(model_output)

별 추이 · 7일

122+0 / 7일

활용성 · 따라 만들기 좋은가

샘플 점수 20/100
  • 관대한 라이선스
  • 테스트 있음
  • 예제 디렉토리
  • 최근 활동
  • AGENTS.md
  • llms.txt
  • 템플릿

⚪ 최근 활동 정보 없음 · 2023년 생성

이 레포에 깃밥 배지 달기

[![깃밥](https://www.gitbap.com/badge/kakaobank/KF-DeBERTa.svg)](https://www.gitbap.com/r/kakaobank/KF-DeBERTa)

🔌 클로드에서 바로 써보기

깃밥을 클로드에 연결하면 이런 레포를 클로드·커서·Codex에서 바로 찾고 체험할 수 있어요.

방법 ① 커넥터 URL

클로드 설정 → 커넥터에 이 주소를 붙여넣기.

https://www.gitbap.com/api/mcp
방법 ② 플러그인 (체험까지)

플러그인을 설치하면 /gitbap-trending·/gitbap-try 슬래시 커맨드로 레포를 그 자리에서 체험. Claude Code에서 아래 두 줄을 차례로 실행하세요.

/plugin marketplace add jakeparkcolde/gitbap-cowork
/plugin install gitbap-cowork@gitbap
연결 방법 자세히 →

AI가 README 기반으로 요약했습니다 · 원문 보기