표 5. | Table 5. Whisper medium, base 및 tiny모델을 파인튜닝한 이후 한국어 평가셋에 대한 음절 오류율(CER, %) 및 zero-shot 추론 대비 오류 감소율(%) | CER (%) for each size of the Whisper model after fine-tuning and error reduction ratio (ERR) compared to zero-shot inference (%)
테스트 데이터셋 | CER (%) | ERR (%) |
medi | base | tiny | medi | base | tiny |
kspon-evalclean | 7.61 | 12.99 | 15.94 | 36.26 | 43.15 | 52.52 |
kspon-evalother | 8.36 | 13.68 | 17.67 | 30.10 | 35.23 | 42.82 |
spon-bcast | 14.75 | 20.91 | 29.44 | –5.13 | 1.83 | –3.33 |
spon-debate | 7.42 | 16.01 | 22.64 | 35.37 | 14.16 | 12.82 |
spon-present | 4.74 | 9.35 | 12.87 | 58.75 | 44.21 | 41.26 |
CER, character error rate.