프로그래밍/LLM
[Day8] 한 권으로 LLM 온라인 스터디 1기 - 단일 GPU Gemma 파인튜닝 2
31weeks
2025. 1. 25. 19:52
728x90
반응형
3.4.5 키워드 데이터 생성
- jaehy12/new3 데이터셋은 각 기사별 키워드 정보를 포함하지 않으므로 Gemma 모델을 활용해서 각 데이터마다 5개씩 키워드를 추출
3.4.6 데이터 전처리
- Gemma 모델이 이해할 수 있도록 기사 형식의 데이터를 대화 형식으로 데이터 전처리 진행
3.4.7 데이터셋 분리 및 콜레이터 설정
- 학습용 데이터와테스트용 데이터 분리
- 모델이 중점적으로 학습해야할 부분을 지정
728x90
반응형