1. 서론
발화 기본주파수(speaking fundamental frequency, SF0)는 말 산출 시 발성의 음도 측면을 나타내는 가장 대표적인 변수 중 하나이다. 그러나 음도에 관련된 발성 특성은 단순히 발화 시의 음도보다 훨씬 다양한 면을 포함하며, 이러한 차원에서 다면적 음성검사에서도 가장 높고 낮은 음도를 확인하도록 권고된다(Patel et al., 2018). 이러한 음역대는 모음 발성뿐만 아니라 다양한 말 자료를 이용하여 측정하여야 한다(Ma & Lam, 2015; Sanchez et al., 2014). 또한 환자의 음역대에 비추어 적절한 수준의 SF0로 말을 산출하는가의 여부 또한 확인해볼 필요가 있는데, 많은 음성장애 환자가 본인에게 부적절한 SF0를 습관적 혹은 의도적으로 사용하거나, 음성장애의 증상으로 SF0의 변화를 겪을 수 있기 때문이다(Lee & Kim, 2019; Ma et al., 2007).
이러한 맥락에서 정상인 및 음성장애 환자에서 각 개인의 고유한 음역대를 토대로 SF0를 예측하는 선행연구들이 이루어져 왔다. 먼저 Lee & Kim(2019)은 정상 성인에서 전기성문파형검사(electroglottography, EGG)를 통해 측정한 SF0를 음성 범위 프로파일(voice range profile, VRP)과 말 범위 프로파일(speech range profile, SRP)의 측정치로 예측하는 회귀식을 제시하였으며, SF0의 추정치와 측정치 간 절대 오차(absolute error of estimated SF0, AEF0)의 성별 차가 없다고 하였다. 또한 Lee & Kim(2020)은 VRP를 이용한 AEF0(AEF0VRP), SRP를 이용한 AEF0(AEF0SRP), 둘의 합(AEF0SUM) 모두 양성 성대질환 환자군과 정상군 간 차이가 있다는 점을 밝히고 두 집단 구분을 위한 절단점을 제시하였다. 또한 후속 연구에서는 양성 성대질환 환자의 치료 후 AEF0가 성별과 무관하게 감소하고 타 음성 변수의 변화량과 유의한 상관관계가 있었으며, 중재 후 GRBAS의 Grade가 1 이상 감소한 개선군의 AEF0가 비개선군에 비해 더 많이 감소하였음을 밝힘으로써, 중재 전후 AEF0의 반응도 또한 확립하였다(Lee et al., 2022). 이러한 점들을 통해 볼 때, AEF0는 음성 중재에 따른 개선 정도를 반영하고, 경우에 따라 바람직하지 못한 SF0를 사용하는 환자에서 음도 변화를 도모할 때 가이드라인으로 삼을 수 있는 척도로 활용할 수 있다는 임상적 의의를 가질 수 있다.
음성장애는 크게 기능적 음성장애와 비기능적 음성장애로 나누어 볼 수 있다. 기능적 음성장애는 환자 스스로의 음성사용 습관 상의 오남용 문제에 기인하는 반면, 비기능적 음성장애는 나머지 기질적, 신경학적 병인을 포괄한다(Boone et al., 2020). 이러한 각각의 병인 집단(etiological group)에는 상이한 음성 증상과 중증도를 가진 음성 질환들이 포함될 수 있다. 예컨대 기능적 음성장애 집단은 다시 크게 과도한 근긴장 장애와 심인성 음성장애로 나뉠 수 있다. 뿐만 아니라 신경학적 음성장애는 성대마비와 연축성 발성장애 등 상이한 임상양상을 가진 음성장애군을 포함하고 있다.
이처럼 음성장애의 병인 집단은 상이한 증상의 음성장애를 모아둔 집단일 뿐만 아니라 그 분류가 단일한 것이 아님에도 불구하고, 각 병인 집단 간 비교는 근본적인 음성장애의 원인에 따른 분류라는 점에서 중재에 시사하는 바가 크다. 한 선행연구에 따르면, 음성 및 참여 프로파일-한국판(Korean version of the voice activity and participation profile, K-VAPP; Lee et al., 2016)을 통해 살펴본 주관적 음성문제의 정도는 중증도를 통제할 경우 기능적 음성장애가 기질적 음성장애보다는 심하지만 신경학적 음성장애보다는 덜하다고 하였다(Lee et al., 2019a). 또한 이러한 차이는 주관적 음성 문제를 묻는 하위영역, 즉 음성 활동 제한(voice activity limitation, ALS)이냐 혹은 음성 참여 제약(voice participation restriction)이냐, 직업, 일상적 의사소통, 사회적 의사소통이냐에 따라 상이한 양상을 보임으로써, 음성장애 평가와 중재에 있어 병인에 따른 세심한 고려가 필요함을 보여주었다.
이렇듯 각 병인 집단별 고유한 특성을 밝힐 수 있다면, 해당 집단에 속하는 음성 특성의 기초자료를 고려하여 질환 맞춤형 음성치료에 기여할 수 있을 것으로 사료된다. 그런데 병인 집단에 따라서 발화 시 성대의 부적절한 사용, 부적절한 말하기 습관과 호흡 패턴 등으로 인해 상이한 음성 변화 양상을 보일 수 있음에도 불구하고, 다양한 음성장애 환자에서 SF0의 변화를 병인 집단 간에 실증적으로 비교한 연구는 전무하다고 할 수 있다. 즉 병인 집단 간의 SF0 특성 차이를 밝혀 이에 따른 임상적 시사점을 탐색해보는 일이 필요하다고 할 수 있다.
이러한 SF0의 측정과 이를 토대로 한 병리적 음성의 구분에는 연령과 성별 등 개인적인 요인 또한 중요한 고려대상이다(Verde et al., 2018). 음성장애의 병인과 무관하게 음성장애의 중증도 자체도 음성의 특성에 막대한 영향을 미치는 중요한 요인으로서 통제해야 할 필요성이 있다(Lee et al., 2019a, 2019b). 또한 과다 및 과소기능 여부에 따라 성대 접촉 양상도 달라지므로, 성문폐쇄지수(closed quotient, CQ)와의 상관관계도 살펴볼 만하다. 즉 각 병인 집단 별로 AEF0와 이러한 관련 요인들 간의 상관관계 또한 살펴볼 필요가 있다.
따라서 본 연구에서는 음성장애 환자에서 VRP와 SRP를 이용하여 산정한 AEF0를 음성장애의 병인 집단, 즉 기능적(functional, FUNC), 기질적(organic, ORGAN), 신경학적(neurogenic, NEUR) 음성장애군, 정상대조군(normal control group, NC) 간에 비교하여 차이를 확인하고자 하였다. 또한 각 병인 집단 별로 AEF0와 관련된 변수들 간의 상관관계를 살펴보았다.
2. 연구방법
G*Power(Faul et al., 2009)를 통하여 네 집단 간 AEF0를 비교하기 위한 최소한의 표본 수를 산정한 결과, 총 112명이었다(effect size f=0.4, Power=0.95). 이에 강남세브란스병원 이비인후과의 음성클리닉에 음성문제를 주소로 내원하여 1급 언어재활사에 의해 음성 및 말 범위 프로파일, 그리고 전기성문파형검사를 포함하는 다면적 음성검사를 시행받고, 후두스트로보스코피를 통하여 이비인후과 전문의에 의하여 음성장애로 진단된 기능적, 기질적, 신경학적 음성장애 환자군과 정상군 각 30명(남 15명, 여 15명)으로 총 120명을 대상으로 연구를 진행하였다. 집단별 평균 연령은 FUNC 32.87±12.10세, ORGAN 35.07±11.07세, NEUR 37.33±11.88세, NC 34.67±6.91세였으며, 집단 간 연령 차이는 없었다(F=.887, p=.450).
구체적인 연구대상 포함 및 제외 기준은 다음과 같다. 먼저 검사 전 타 기관에서 수술적, 행동적 치료를 받지 않은 자, 문맹 또는 무학 학력이 아닌 자로 문단 읽기 및 설문지 과제에 어려움이 없는 문해력(literacy skill)을 갖춘 자에 한하였다. 또한 정상군에서는 흡연한 이력이 있거나, 검사일을 기준으로 하여 3개월내 상기도 감염이나 음성 문제를 주소로 하여 의료기관에 내원한 이력이 있거나(Choi & Choi, 2016), K-VAPP를 시행하여 총점이 14.5점 이상인 자는 제외하였다(Lee et al., 2016). 병인 집단에 따른 구체적인 진단명의 분포는 표 1과 같다. 병인에 따른 각 음성질환에 대한 분류는 문헌에 따라 다양하나, 본 연구에서는 Boone et al.(2020)의 분류를 따랐다.
음성 및 전기성문파형의 기록을 위해 Computerized Speech Lab(CSL: Model 4150B; KayPentax, Lincoln Park, NJ, USA)와 Real-time EGG(Model 6103; KayPENTAX, Lincoln Park, NJ, USA), SM48 다이나믹 마이크(SHURE, Niles, IL, USA)를 이용하였다. VRP와 SRP에는 CSL의 voice range profile(VRP: Model 4326; KayPENTAX, Lincoln Park, NJ, USA)를, 문단읽기 샘플 녹음에는 CSL Main Program(Model 4150B; KayPentax, Lincoln Park, NJ, USA)을, EGG 분석에는 Real-time EGG 프로그램을 이용하였다. 녹음 시 첫 번째 채널에는 음향학적 신호가, 두 번째 채널에는 EGG 신호가 동기화되어 기록되도록 하였다. 마이크와 입술의 거리가 약 10 cm 되도록 한 다음, 각 대상자가 전체 ‘가을’ 문단(Kim, 2012) 의 전체 부분을 소리 내어 읽도록 하였다.
VRP와 SRP 과제의 보다 상세하고 구체적인 절차는 선행연구들(Lee & Kim, 2019; Lee & Kim 2020; Lee et al., 2022)에 기술되어 있으며, 간략히 설명하면 다음과 같다. 먼저 VRP 과제에서 모음 /아/를 활창하도록 하여 진성구 및 가성구를 포함하는 전체 음역대의 VRP plot을 저장하였다. SRP 과제에서는 ‘가을’ 문단(Kim, 2012) 첫 문장(‘우리나라의 가을은 참으로 아름답다.’)을 편안한 음도와 크기로 읽게 하여 VRP plot을 저장하였다. 두 과제 모두 CSL 하드웨어의 VRP 모드를 on 시킨 후 진행하였다.
분석 절차는 선행연구(Lee et al., 2022)에 준하여 수행하였다. 먼저 각 연결발화 샘플에 대하여 GRBAS 척도(0.5점 단위; Choi et al., 2021)로 청지각적 평정을 시행하여 전반적 중증도(Grade)를 측정하고, K-VAPP의 1. 환자 스스로 느끼는 중증도(Severity)를 측정하였다. 또한 EGG 프로그램을 이용하여 문단 읽기 샘플 전체를 분석 대상으로 하여 기준이 되는 평균 SF0와 CQ를 측정하였다. VRP 프로그램을 통해 VRP와 SRP 과제의 측정치들을 측정한 뒤에 Lee & Kim(2019)의 회귀식에 대입하여서 ESF0VRP와 ESF0SRP, AEF0VRP, AEF0SRP, AEF0SUM을 각각 계산하였다.
병인 집단 간 음성장애 중증도를 비교하기 위하여 일원분산분석을 실시하였으며, 사후 분석은 Tukey 사후검정을 시행하였다. 각 측정치 간 상관관계를 알아보기 위하여 피어슨 상관분석을 시행하여 상관관계 히트맵을 작성하였다. 통계 프로그램으로는 IBM SPSS statistics 26.0(IBM-SPSS, Armonk, NY, USA)를, 상관관계 분석 및 히트맵 작성에는 Python 3.9(Van Rossum & Drake, 2009)을 사용하였고, 유의수준은 .05로 하였다.
3. 연구 결과
집단에 따른 Grade, Severity, EGG, VRP, SRP 측정치가 표 2에, ESF0와 AEF0가 표 3에 제시되어 있다. 병인 집단 간 비교 결과 Grade(F=83.663, p<.001), Severity(F=99.193, p<.001), SF0Range(F=5.914, p=.001), CQRange(F=5.077, p=.002), MAXVRP(F=2.723, p=.048), RANGEVRP(F=3.319, p=.022), SEMIVRP(F=4.434, p=.005), AEF0VRP(F=4.153, p=.008), AEF0SUM(F=3.762, p=.013)에서 집단 간 유의한 차이가 있었다.
FUNC, functional; ORGAN, organic; NEUR, neurogenic; NC, normal control; Severity, self-perceived severity; SF0EGG, speaking fundamental frequency measured by electroglottography; CQ, closed quotient; VRP, voice range profile; SRP, speech range profile; Max, maximum pitch in Hz; Min, minimum pitch in Hz; Range, pitch range in Hz; Semi, pitch range in semitones.
사후검정 결과를 보다 자세히 살펴보면, 먼저 Grade와 Severity의 경우 세 병인 집단 간에는 차이가 없었으며, NC가 각 병인 집단에 비해 유의하게 낮았다(p<.001). SF0Range는 FUNC, NC와 비교하였을 때 ORGAN(각 p=.014, p=.016)과 NEUR(각 p=.021, p=.025)가 높았다. CQRange는 ORGAN(p=.002)과 NEUR(p=.035)가 FUNC보다 높은 것으로 확인되었다. MAXVRP(p=.032)와 RANGEVRP(p=.020)의 경우 세 병인 집단 중 NEUR만 NC에 비해 유의하게 낮은 것으로 나타났다. SEMIVRP의 경우 ORGAN(p=.012)과 NEUR(p=.009)가 NC보다 낮았다. AEF0VRP는 ORGAN이 FUNC(p=.020)와 NC(p=.017)보다 높았으며, AEF0SUM은 ORGAN이 NC보다 높았다(p=.026).
각 병인 집단별로 살펴본 AEF0와 관련 변수들 간 상관관계 가 그림 1−3에 제시되어 있다. 전반적으로 상관관계의 크기는 약함에서 중간 수준인 것으로 확인되었다.
먼저 FUNC의 경우 AEF0VRP가 GRADE와 양의 상관관계를 보인 반면(r=.423, p=.020), ORGAN의 경우 AEF0VRP(r=.404, p=.027), AEF0SRP(r=.381, p=.038), AEF0SUM(r=.418, p=.022)이 평균 CQ와 양의 상관관계를 나타냈다.
한편 NEUR에서는 AEF0SUM이 Grade와 양의 상관관계(r=.411, p=.024)를 가졌을 뿐만 아니라, AEF0VRP(r=.427, p=.019), AEF0SRP(r=.382, p=.037), AEF0SUM(r=.506, p=.004)이 환자가 보고한 Severity와 양의 상관관계를 나타냈다.
4. 논의 및 결론
본 연구에서는 음성장애 환자에서 VRP와 SRP를 이용한 AEF0를 음성장애의 병인 집단 간에 비교하여 차이를 확인하고,각 병인 집단별로 AEF0와 관련된 변수들 간의 상관관계를 살펴보았다. 그 결과, AEF0VRP와 AEF0SUM에서 병인 집단 간 차이가 있었으며, 병인 집단에 따라 AEF0와 유의한 상관관계를 가진 음성 측정치가 상이함을 확인하였다.
먼저 AEF0 계산을 위해 측정한 VRP 및 SRP에서도 병인 집단 간 차이가 있었다. 또한 MAXVRP와 RANGEVRP의 경우 NEUR만 NC에 비해 낮았던 반면, SEMIVRP의 경우 ORGAN과 NEUR가 NC보다 낮아서 병인 집단에 따라 정상군과 차이를 보이는 VRP 와 SRP 변수가 서로 다름을 확인하였다. 이러한 병인 집단 간 차이는 언어재활사가 청지각적으로 판단한 중증도나 환자의 주관적인 중증도에 있어서는 집단 간 차이가 없었던 점과는 대조되는 것이며, 병인 집단에 따라서 발화 기본주파수 관련 변수들을 주의 깊게 살펴볼 필요성을 뒷받침한다고 할 수 있다. 또한 VRP와 SRP에서 측정할 수 있는 환자군들의 측정치가 정상군과 유의한 차이를 보인 점은 음성장애 성인 여성과 정상음성 성인 여성 간 진성구와 가성구의 VRP 측정치들의 차이를 보고한 연구(Kim & Lee, 2022), 그리고 VRP 측정치들이 음성장애의 선별에 유용하게 이용될 수 있다고 보고한 선행연구(Ma et al., 2007), 그리고 선별검사도구로서의 유용성과 절단점을 보고한 선행연구(Lee & Kim, 2020)의 내용과도 일맥상통한다.
AEF0 변수들의 집단 간 차이를 자세히 살펴보면, AEF0VRP는 ORGAN이 FUNC와 NC보다 높았으며, AEF0SUM은 ORGAN이 NC보다 높았다. 이러한 결과는 다른 병인 집단에 비해 ORGAN에서 AEF0 변수들의 차이가 더 두드러진다는 점을 시사한다. 구체적인 질환들을 보면 성대구증, 성대반흔, 낭종, 인후두역류질환 등을 포함하는데, 음역대의 차원에서 자세히 살펴보면 서로 상이한 특성을 보이는 질환들이 모두 포함되어 일견 의아한 결과로 보일 수 있다. 즉 성대구증이나 반흔은 대체로 SF0나 음역대가 상승하는 반면, 낭종이나 역류질환의 경우 하강하는 경향을 보이기 때문이다(Boone et al., 2020; Lee et al., 2021). 그러나 AEF0의 정의와 그 계산식에서 차이의 ‘절댓값’이 계산된다는 점을 상기해본다면, 이러한 SF0의 증가 또는 감소의 절댓값만이 계산되므로 이러한 차이는 타당한 면이 있다고도 해석할 수 있을 것이다. 다만 병인 집단 간 차이가 AEF0VRP와 AEF0SUM에서만 관찰되었고 AEF0SRP에서는 나타나지 않았는데, 이는 ORGAN에서 관찰되는 고유한 음역대의 변화가 문단읽기와 같은 발화과제보다는 모음 /아/의 산출을 이용하여 스케일링을 하는 VRP 과제에서 더 잘 관찰되기 때문이라고 해석할 수 있으며, 이러한 과제 간의 차이에 대해서는 후속 연구가 필요할 것으로 생각된다.
FUNC와 NEUR에서는 AEF0가 Grade와 양의 상관관계를 보인 반면, ORGAN은 CQ와 양의 상관관계가 있었다. 한편으로 Grade와의 상관관계가 관찰된 점은 중증도가 증가함에 따라 AFE0도 함께 증가한다는 점을 의미하므로, AEF0가 음성 스크리닝을 위한 지수로 활용될 가능성을 보고한 선행연구와도 맥을 같이 한다(Lee & Kim, 2020). 그런데 다른 한편으로 ORGAN이 다른 병인 집단과 달리 CQ와 상관관계를 보인 점은 상당히 흥미롭다. 앞서 질환군에 대해 살펴본 것처럼 ORGAN에서는 성대의 과다기능과 과소기능이 유발될 수 있는 음성장애들이 모두 포함되어 있으며, 이는 FUNC와 NEUR에서도 마찬가지이다. 더군다나 CQ 자체로만 보면 병인 집단 간의 차이가 관찰되지도 않았으며, ORGAN의 CQ는 45.452±4.689%로 높은 편이 아니었다. 이에 대한 해석은 매우 어려우나, 앞서 ORGAN이 음역대 변수에서 유의미한 집단 간 차이를 보인 결과와도 맞닿아 있는 것으로 보인다.
한 가지 추측을 해보자면 구조적인 변화를 동반하는 ORGAN의 특성상 이러한 구조의 변화 때문에 AEF0가 증가하게 될수록 이에 비례하여 대상자가 병변 부위나 성문상부 구조들의 접촉을 증가시키고자 했을 가능성이 있다. 그러나 FUNC에 속하는 성대결절이나 폴립의 경우에도 구조의 변화를 동반하므로, 병인 집단과 무관하게 구조 변화를 동반하는 환자군을 선별하여 CQ와 AEF0의 변화 및 상관관계가 어떠한지에 후속연구를 통해 관련 변인을 탐색할 필요가 있다고 본다.
본 연구는 충분한 수의 대상자에 대하여 수행하고자 하였으나, 개별 병인 집단 내에서 살펴보면 질환의 분포가 고르게 이루어지지는 못하였다. 또한 각 병인 집단 내에서 ‘병인’이라는 공통 요인을 가지고 있다 하더라도 구체적인 질환들 간에도 차이를 보일 가능성을 배제할 수 없다는 한계가 있다. 또한 중증도가 아주 높은 환자의 경우 VRP와 SRP의 측정치가 신뢰도 높게 측정되지 못했을 가능성(D'Alatri & Marchese, 2014)이 있다. 마지막으로 개인차를 고려한 자료 분석과 해석, 관련 요인 탐색을 수행하지 못하여 이에 대한 후속 연구가 필요하다고 생각된다.
본 연구를 통하여 각 병인 집단 중에서 특별히 AEF0에 있어 이상을 보이는 환자 집단에 대하여 더욱 주의를 기울여 조기에 음도 차원에서의 이상을 발견함과 동시에 적절한 음도 중재를 수행할 수 있는 이론적 근거를 일부 마련한 것으로 판단된다. 그 중에서도 특히 ORGAN 집단은 NC는 물론 FUNC보다도 AEF0가 높았으며, CQ와 상관관계를 보여 바람직한 발화 기본주파수와 실제 발화 기본주파수 사이에 간극이 크며, 이러한 차이가 성대접촉의 양상과 관련있을 가능성을 보여주었다는 데 임상적 의의가 있다고 하겠다. 아울러 이를 이용하여 환자와의 효율적인 의사소통과 정확한 정보제공을 통하여 공유된 임상적 의사결정(shared decision-making)을 촉진하고, 음성장애 환자의 신속한 음성 클리닉 내원을 촉진하여 음성장애로 인한 사회적 비용감소와 체계적이고 맞춤형의 음성질환 치료 토대 마련에 도움이 될 것으로 여겨진다.