SFT와 RLHF: 최적의 AI 학습 방법 선택 | 2025