polyglot-ko-5.8b를 lora로 학습 후 가중치 병합. ko-lima 데이터 사용. 10에폭 1e-4 -> 1e-5 cosine decay. 배치 128, 최대시퀀스길이 2048