1. 서론
음성장애는 다양한 연령층에서 발생할 수 있으며, 발생 원인도 다요인적이다. 따라서 음성 문제에 대한 원인을 파악하는 것이 중요하며, 환자의 환경이나 생활 습관 등 음성 문제와 관련된 정보를 파악하는 것 또한 필요하다(Ferrand, 2014). 음성 문제는 일반 성인에게 흔히 나타나는 문제이지만 아동이나 노인층을 포함한 다양한 연령층에서도 관찰된다(Lindström et al., 2023).
음성장애를 평가하는 전문가들은 음성 변화를 호소하는 이들의 삶의 질, 의사소통 상황에 따른 문제 등을 평가하게 된다. 그런데 대상자의 주관적인 음성 문제 인지는 음성장애와 독립적으로 관련될 수 있으므로 평가와 치료가 치료사가 아닌 환자 중심으로 이루어지기도 한다(Pyo & Song, 2010). 주관적 평가는 객관적 평가에서는 살펴보기 어려운 개인이 경험하는 음성의 불편함을 평가할 수 있기 때문에 중요한 평가로 자리잡고 있다(Barsties & Bodt, 2015). 음성장애 평가를 위한 한국판 자기보고식 설문(self-reported questionnaire)으로는 대표적으로 voice handicap index(VHI), voice-related quality of life(VQOL), voice fatigue index(VFI) 등이 개발되어 널리 쓰이고 있다. 자기보고식 설문 평가는 삶의 질, 기능적, 신체적, 감정적인 영역을 평가할 수 있어 개인에 맞는 치료법을 적용할 수 있다는 것에 의미가 있다(Lee et al., 2022).
자기보고식 설문 평가가 개발됨에 따라 다양한 언어로 번역되는데, 설문 문항의 길이가 길거나 어려울수록 긴 시간이 소요되고, 대상자의 주의력이 낮아져 결과에 영향을 미칠 수 있다(Checa-Moreno et al., 2021). 따라서 설문 개발 및 번안 시에 언어적, 문화적 차이를 반영하여 문장의 길이나 단어의 난이도를 고려하여 작성되어야 한다. 설문지의 개발이 완료된 후에도 평가자는 대상자의 읽기 수준을 고려하여 설문을 진행해야 한다(Zraick & Atcherso, 2012). 설문을 실시하기 전에 이해하기 어려운 항목에 대한 충분한 설명을 제공하고, 주의를 기울이도록 하여 정확한 진단을 할 수 있어야 한다(Crabtree & Lee, 2022; Gromada et al., 2020).
이에 따라 의학 분야에서는 자기보고식 설문에 대한 가독성(readability) 평가가 활발히 이루어지고 있으며, 어려운 항목에 대한 주의를 기울일 수 있도록 돕는다(Checa-Moreno et al., 2021). 평가 설문지의 가독성이 낮은 경우, 신뢰성과 유효성에도 영향을 미칠 수 있다(Zraick & Atcherso, 2012). 여기서 가독성이란 인쇄물을 쉽게 읽을 수 있는 정도로서, 텍스트의 난이도를 결정하는 직접적인 요인이다. 가독성이라는 용어는 읽기 쉬운 정도의 글자, 흥미도 및 글의 내용의 읽기 쉬운 정도를 포괄한다. 텍스트의 가독성은 글을 이해하기 위해서 갖추어야 하는 읽기 능력의 객관적인 척도로 글을 이해하는 데 중요한 영향을 미친다(Bailin & Grafstein, 2016).
이에 따라, 자료의 정보를 정확하게 전달하고 전문가가 대상자의 읽기 수준에 맞게 적절한 자료를 선택하는 것은 중요하므로 가독성 분석은 교육 및 언어학, 의료 및 기술 등 다양한 분야에서 중요한 주제가 되었다(Bailin & Grafstein, 2016). 영어 텍스트의 경우에 flesch formula, fry readability formula, SMOG formula, Dale-Chall formula, FOG formula 등의 공식이 있다. 국내에서도 한국어의 가독성 분석을 위해 가독성에 영향을 미치는 요인을 수치화 또는 계량화하고자 다양한 시도를 하고 있다(Koo & Yang, 2013). 본 연구에서는 한국어 가독성 공식 및 어휘 난이도를 분석하여 한국어판 음성장애 자기보고식 설문들의 가독성을 확인하였으며, 원판 설문지와 아동용 설문지의 가독성을 분석하여 비교하고자 하였다.
2. 연구 방법
설문지는 국내에서 사용되고 있는 음성장애 자기보고식 11가지를 포함하였는데, 선정 기준은 다음과 같았다. (1) 전문가의 도움 없이 대상자가 작성하도록 고안되었으며, (2) 성인을 대상으로 실시할 수 있어야 하며, (3) 신뢰도와 타당도 검증이 완료되었고, (4) 한국어로 번안이 되어 있으며, 임상에서 사용되어야 한다. 위의 선정 기준을 통해 가독성 분석 대상으로 포함된 설문지 11가지로는 Kim et al.(2007)의 한국어판 음성장애지수(Korean-voice handicap index, KVHI), 한국어판 음성관련 삶의 질(Korean-version of voice-related quality of life, KVQOL), Lee & Sim(2013)의 성악가를 위한 한국어판 음성장애지수(the Korean version of the singing voice handicap index, K-SVHI), Lee et al.(2016)의 음성 활동 및 참여 프로파일-한국판(Korean version of the voice activity and participation profile, K-VAPP), Kang et al.(2017)의 한국어판 음성 피로도 검사(vocal fatigue index in Korean version, K-VFI), Son et al.(2018)의 한국어판 음성증상척도(Korean voice symptom scale, K-VoiSS), Jang & Kim(2022)의 한국어판 음성장애 대처 설문지(voice disability coping questionnaire for Korean, K-VDCQ), Bae et al.(2019)의 한국어판 노인 음성장애지수(Korean aging voice index, KAVI), Lee et al.(2020)의 한국어판 성도 불편감 척도(Korean vocal tract discomfort scale, K-VTDS), Hwang et al.(2020)의 갑상선 수술 관련 음성 및 증상 설문(thyroidectomy-related voice and symptom questionnaire, TVSQ), Lee et al.(2022)의 한국어판 목소리 자기조절 척도(Korean voice perceived present control scale, K-VPPC)를 포함하였다. 축약판 설문지는 분석 대상에서 제외하였다.
텍스트 등급은 한국어 가독성 공식을 이용하여 등급을 측정하였다. 텍스트 복잡도는 문장의 어절 수를 포함하며, 복잡도 공식을 통한 분석이 이루어졌다. 가독성 공식은 Lee(2020)에서 제시한 한국어 텍스트 가독성 공식을 활용하였으며, 사용된 공식은 Dale-Chall 공식을 기반으로 하였다. 가독성 공식은 문법 난이도와 어휘 난이도를 통해 산출하였다.
텍스트 복잡도 분석에서 어절 수는 (주) 낱말(https://natmal.com)의 ‘문장검사프로그램’을 이용하여 총 어절 수와 평균 어절 수를 계산하였으며, 문장의 복잡도의 경우에는 텍스트 복잡도 공식(Suh et al., 2013)을 이용하였다. 텍스트 복잡도는 점수가 높을수록 문장의 복잡도가 높은 것으로 평가된다.
어휘 빈도 수 및 순위는 NVivo14Ⓡ 프로그램을 활용하며, 어휘 빈도와 함께 순위를 함께 제시하였다. 어휘 등급을 확인하기 위해서는 Kim(2017)의 국제 통용 한국어 표준 교육과정 적용 연구에 제시된 어휘 등급을 기준으로 1–6등급으로 나누어 분석하였으며, 등급이 높을수록 어휘 난이도가 높은 것으로 판단한다.
어휘 다양도(type-to-token ratio, TTR)는 얼마나 다양한 어휘를 사용하였는지 측정하는 것으로서 서로 다른 어휘 수(type)를 총 어휘 수(token)로 나누어 계산하였다(Janan et al., 2010). 어휘 다양도 점수가 높을수록 어휘를 다양하게 사용했다는 것을 의미한다.
영어의 가독성 분석은 대표적인 가독성 공식인 Flesh 가독성, Flesch-Kincaid grade level을 적용하였다. 이때, 가독성 공식을 적용하여 자동으로 분석해주는 『Readable』이라는 온라인 도구(toolkit)(https://readable.com)를 활용하였다. Flesh 가독성 범위는 0–100 사이인데, 0–40점인 경우에는 읽기 난이도가 매우 높은 것으로 판단되므로, 일반적으로 40점 이상으로 작성할 것이 권고된다. 또한, Flesch-Kincaid grade level은 1–12등급의 범위이며, 7등급 이상인 경우 읽기 난이도가 매우 높은 것으로서 중학교 이상의 텍스트로 간주된다.
3. 연구 결과
한국어판(성인용) 설문지의 텍스트 등급 평균(표준편차)은 3.84(0.41)이었으며, K-VTDS가 4.67로 가장 높았으며, K-VDCQ가 3.17로 가장 낮았다.
어절 수를 분석한 결과, 총 평균(표준편차)은 7.59(2.19)이었다. K-VDCQ가 평균 어절 수 11.6으로 가장 높았으며, K-VTDS가 평균 어절 수 4.63으로 가장 낮았다.
텍스트 복잡도 평균(표준편차)은 5.65(1.59)점이었다. 설문지별로 살펴보았을 때, K-VAPP가 8.57로 가장 높았으며, K-VoiSS가 3.61로 가장 낮았다. 결과는 표 1에 제시하였다.
K-VDCQ, voice disability coping questionnaire for Korean; K-VPPC, Korean voice perceived present control scale; K-VAPP, Korean version of the voice activity and participation profile; K-SVHI, the Korean version of the singing voice handicap index; K-VoiSS, Korean voice symptom scale; K-VFI, vocal fatigue index in Korean version; TVSQ, thyroidectomy-related voice and symptom questionnaire; KVQOL, Korean-version of voice-related quality of life; KVHI, Korean-voice handicap index, KAVI, Korean aging voice Index; K-VTDS, Korean vocal tract discomfort scale.
텍스트 등급의 상대적 영향력을 분석한 결과, 텍스트 등급은 어휘와 문법에서 유의한 차이가 있었으며, 그 외에 요인에서는 차이가 유의하지 않았다. 어휘와 문법 중 등급에 가장 큰 영향력을 미치는 요인은 문법(β=.756)이며, 어휘(β=.570)보다 문법적 요인이 텍스트 등급에 큰 영향을 미친다. 결과는 표 2에 제시하였다.
독립 변수 | 비표준화 계수 | t(유의확률) | ||
---|---|---|---|---|
B | SE | |||
(상수) | –2.199 | .048 | –46.031 (<.000) |
|
문법 | .184 | .001 | .756 |
144.569
(<.001)*** |
어휘 | .122 | .001 | .570 |
109.588
(<.001)*** |
11가지의 설문지에서 총 615개의 어휘가 사용되었으며, 그 중 ‘목소리’가 총 274회(5.25%)로 가장 많이 사용되었다. 어휘 빈도 순위는 1–84위의 범위로 분석되었다.
어휘 등급은 1–6등급까지의 범위로 확인되었는데, 1등급 어휘 32.29%, 2등급 어휘는 23.91%, 3등급 어휘는 22.36%, 4등급 어휘는 15.22%, 5등급 어휘는 4.03%, 6등급 어휘는 2.17%의 비율로 사용되었다.
어휘 다양도의 평균(표준편차)은 0.44(0.101)이었으며, KVQOL과 K-SVHI가 동일하게 0.58로 가장 높음으로써 두 설문이 가장 다양한 어휘를 사용한 것으로 확인되었다. 가장 낮은 어휘 다양도를 보인 설문은 K-VAPP(0.25)이었다.
Flesh 가독성의 경우에는 VAPP 설문지(67.62) 점수가 가장 낮았고(즉, 가장 어려움), AVI(90.41)가 가장 높았다(즉, 가장 쉬움). 반면에, Flesch-Kincaid grade level의 경우에는 VAPP 설문지(67.62)가 6.87등급으로 읽기 수준이 가장 높았고(즉, 가장 어려움), VoiSS는 2.70등급으로 가장 낮았다(즉, 가장 쉬움).
아동용 설문지의 텍스트 등급의 평균(표준편차)은 3.40(0.13)이었으며, 문법 난이도 점수는 22.20(0.76), 어휘 난이도 점수는 15.77(0.17)이었다. 이 2가지 설문지의 텍스트 복잡도 평균(표준편차)은 4.57(0.66)이었다. 아동용 설문지 가독성 결과는 표 3에 제시하였다.
한국어판 소아 음성장애지수 (pVHI-K) | 아동 음성장애지수 (K-CVHI-10) | 평균 (표준편차) | |
---|---|---|---|
등급 | 3.49 | 3.31 | 3.40 (0.13) |
텍스트 복잡도 | 5.04 | 4.10 | 4.57 (0.66) |
11개의 성인용 설문지와 2개의 아동용 설문지를 비교하였을 때, 문법 점수 측면에서 성인용 설문지 점수[18.72(1.68)]가 아동용[22.20(0.76)]보다 낮음으로써 더 쉬웠다. 어휘 점수, 텍스트 복잡도, 수식어, 절의 평균은 성인용 설문지가 더 높음으로써 다소 어려운 것으로 확인되었다. 텍스트 등급은 각각 3.84와 3.40으로 유사하였으며, 어휘 다양도 역시 성인용 설문지 평균(표준편차)[0.44(0.10)]와 아동용 설문지[0.49(0.13)]가 유사하였다. 결과는 표 4에 제시하였다.
어휘 등급은 가장 쉬운 1등급 어휘의 경우 성인용:아동용= 32.29%:42.53%를 차지하였다. 어려운 어휘 등급인 5등급과 6등급 어휘의 경우는 성인용:아동용=6.20%:7.51%로 비율 차이가 가장 적었다. 중간 등급인 2등급, 3등급, 4등급을 합쳤을 경우, 성인용:아동용=61.49%:49.42%이었다. 결과는 그림 1에 제시하였다.
4. 고찰
본 연구는 음성장애 자기보고식 설문지의 문항의 가독성을 확인하여 설문지의 가독성에 영향을 주는 요인이 무엇인지 확인하였다. 음성장애 자기보고식 설문을 조사하고, 국내 임상에서 사용되는 설문지 11가지를 분석 대상으로 선정하여 텍스트 등급 및 복잡도, 어휘 빈도 및 등급, 어휘 다양도 등을 분석하였다.
본 연구에서 사용한 가독성 공식은 Dale-Chall 공식을 기준으로 하고 있어 등급이 4.9이하이면 4학년 수준으로 해석될 수 있다고 보고된 바 있다(Lee & Kil, 2018). 분석 대상으로 선정된 11가지의 설문지는 모두 4.9 이하의 등급으로서, 4학년 이상의 아동들이나 노인층에도 무난하게 사용할 수 있다.
11가지 설문지의 어절 평균은 7.59로서 문장당 어절 수가 많다는 것은 문장의 길이가 길어짐을 의미한다. 문장이 길어질수록 절의 수가 증가하고, 문장의 결합 양상이 다양해지면서 가독성이 떨어진다(Seong, 2011). K-VAPP는 어절 수가 가장 길었지만, 어휘 다양도가 가장 낮았다. 이러한 결과는 추후 설문 개발 시 번안 과정에서 어절 수가 길어질 경우에 어휘 다양도를 낮춤으로 상쇄하는 방안을 고려할 수 있다.
텍스트 복잡도 공식에서 절의 수와 수식어 수를 분석한 결과, 절은 K-VFI에서 가장 높은 빈도로 사용되었으며, 수식어는 K-VAPP에서 가장 높은 빈도로 사용하였는데, 텍스트의 복잡성과 비교하였을 때, K-VFI보다 K-VAPP 문항의 텍스트가 더 복잡하였다. 따라서 절의 수보다 수식어의 수가 많을수록 텍스트가 복잡하다고 해석할 수 있다.
설문지별로 보았을 때, K-VTDS는 5등급 어휘가 25%의 높은 비율로 사용되었는데, 텍스트 등급에서도 높은 점수를 받았다. 어휘 수준이 높을수록 읽기가 미숙한 독자들은 어휘를 빠뜨리거나 읽지 않는 모습을 보인다는 선행 연구(Shin & Shin, 2021)에 따라, 어휘 난이도가 높은 경우 설문을 제대로 읽고 실시하는 것이 어려워지고, 결과에 영향을 줄 수 있다.
원판 설문지 가독성과 비교하였을 때, VAPP가 Flesh 가독성과 Flesch-Kincaid grade level에서 11가지 설문지 중 읽기 난이도가 가장 높았으며, K-VAPP도 텍스트 복잡도가 가장 높았다. Voiss는 Flesch-Kincaid grade level에서 읽기 난이도가 가장 낮았으며, 번안본인 한국어판인 K-VoiSS도 텍스트 복잡도가 가장 낮았다. 이러한 결과는 원판 설문지와 한국어판 설문지는 텍스트 난이도가 비슷한 수준으로 작성되었으며, 선행 연구에서는 원본과 번안본은 텍스트가 동등하게 작성되려면 텍스트 난이도가 비슷한 수준으로 작성되어야 한다고 하였다(Arffman, 2010). 반대로 원판인 AVI는 Flesh 가독성에서 읽기 난이도가 가장 낮았으며, 번안본인 KAVI는 어휘 난이도가 21.31로 읽기 난이도가 높은 편에 속하였다. 이러한 결과로 보아 어휘 난이도 차이가 번안본과 원본 항목에 의미적인 차이를 가져올 수 있기 때문에(Ercikan, 1998) 추후 개발 시에 어휘 난이도 차이를 고려해야 한다.
성인용 설문지와 아동용 설문지에 대한 분석 결과 중 텍스트 등급 차이가 0.44로 큰 차이를 보이지 않았다. 성인용과 아동용 음성장애 설문지 문항에 대한 텍스트 수준이 유사한 것으로 보아 성인용 설문지는 문해력이 낮은 노인이나 성인이 실시하기에 큰 어려움이 없을 것으로 해석할 수 있다. 가독성 연구에서 어휘 다양도가 읽기 난이도에 중요한 요인이며, 어휘 다양성이 낮을수록 읽기 쉬운 텍스트가 된다(Roos & Roos, 2019). 따라서 아동이 실시하는 설문의 경우, 어휘 다양도를 낮춘다면 읽기 난이도를 낮출 수 있다. 문장에서 어휘 빈도 및 등급의 적절한 분포는 가독성에서 중요한 역할을 한다(Duffy & Kabance, 1982). 이에 따라 설문지 개발 과정에서 어려운 어휘 사용이 많은 경우에 유사하지만 난이도가 낮은 어휘로 수정한다면 텍스트의 난이도를 낮출 수 있다.
K-VTDS의 경우, 5등급 어휘의 사용빈도가 높고 어휘 난이도가 가장 높게 측정되었으며, 텍스트 등급 분석에서 읽기 난이도가 가장 높았다. 이는 텍스트의 정확한 이해를 위해서는 단어의 이해가 중요한 역할을 하며, 독해력에도 어휘가 영향을 미친다는 선행연구와 일치한다(Cain & Oakhill, 2014; Chen & Meurers, 2017). 난이도가 높은 어휘가 포함된 설문은 설문 시행에 영향을 줄 수 있으므로 임상에서 활용 시, 어휘에 대한 충분한 지식이 있는지 확인할 필요가 있다.
5. 결론
본 연구는 음성장애 설문지의 설문 문항에 대한 텍스트 읽기 등급의 결과를 제공했다는 것에 의의가 있으며, 본 연구의 제한점 및 제언은 다음과 같다. 첫 번째, 본 연구에서는 양적인 부분에 초점을 맞추어 가독성을 분석하였다. 그러나 가독성 평가를 위해서 다양한 전문가의 평가를 포함하고, 대상자에 대한 이해도 평가가 필요하다. 두 번째, 선행 연구에서는 전반적인 설문의 가독성에서 적합한 것을 밝혔지만, 문항별로 비교하여 가독성을 분석하였을 때, 주의가 필요할 것이다. 따라서, 후속 연구에서는 설문지 내의 문항별 가독성을 비교해야 한다. 세 번째, 임상에서 설문을 실시할 때, 가독성뿐만 아니라 설문 시행 절차가 자기보고에 영향을 미치는 요인이 될 수 있기 때문에 검사자는 설문 제시 시에 설문의 취지와 목적에 대해 충분한 설명을 했는지와 같은 요소를 확인해야 한다. 네 번째, 같은 설문지가 두 개 이상으로 번안된 경우, 표준적인 번안 절차를 얼마나 준수하였는지에 따라 설문 문항의 내용과 가독성이 응답자에게 적합한지를 판단하여 선정하는 과정을 거쳐야 할 것이다. 다섯 번째, 다양한 요인(연령, 나이, 성별 등)을 고려하여 가독성과 관련된 기준은 제시하는 연구가 진행된다면, 향후 새로운 설문지를 개발하거나 번안하는 과정에서 가독성이 높은 설문 문항을 구성할 수 있을 것이다.