Speech Disorders/말장애

Acoustic Voice Tremor index in the measurement of voice tremor: Development and validation

김근효1, 이연우2,*
Geun-Hyo Kim1, Yeon-Woo Lee2,*
Author Information & Copyright
1부산대학교병원 이비인후과, 의생명연구원
2고신대학교 언어치료학과
1Department of Otorhinolaryngology-Head and Neck Surgery and Biomedical Research Institute, Pusan National University Hospital, Busan, Korea
2Department of Speech-Language Pathology, Kosin University, Busan, Korea
*Corresponding author : ahaha1216@gmail.com

© Copyright 2024 Korean Society of Speech Sciences. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: May 13, 2024; Revised: Jun 10, 2024; Accepted: Jun 10, 2024

Published Online: Jun 30, 2024

국문초록

본 연구에서는 음성 떨림의 음향학적 측정을 위해서 AVTI(Acoustic Voice Tremor index)를 개발하고 검증하는 것을 목표로 한다. 정상 성인 71명, 음성 떨림 환자 41명이 참여하였으며, 모음/아 /를 5초 이상 녹음하였다. 모음 안정구간 3초를 편집하여 Praat 스크립트를 이용하여 음성 떨림 관련 18개의 변수 측정값을 확인하였다. 이 변수들과 청지각적 평가 전반적 중증도(overall severity, OS)를 이용하여 선형 회귀분석을 돌려 AVTI를 구성하였다. 선형 회귀분석 결과, 18개 중 4개의 변수가 유의미하게 확인되고 회귀식이 구성되었다. 내부/외부 타당도 조사에서도 평균 0.8 이상의 높은 연관성을 나타내었다. AVTI는 OS와 0.841의 높은 상관관계를 보였다. AVTI를 통해서 음성 떨림을 예측할 수 있었다. 후속 연구에서는 더욱 많은 음성샘플과 보완된 Praat script를 추가 분석해 볼 필요성이 있을 것으로 생각된다.

Abstract

The aim of this study was to develop and validate the Acoustic Voice Tremor index (AVTI) for the acoustic measurement of voice tremor. A total of 71 normal adults and 41 patients with voice tremor participated in the study. Vowels /a/ were recorded for at least five seconds. Three seconds of vowel stable duration were edited to identify measures of 18 variables related to voice tremor using a Praat script. These variables and the overall severity (OS) of auditory-perceptual assessment were used to design the AVTI using linear regression analysis. The linear regression analysis identified four out of the 18 variables as significant, and a regression equation was constructed. Furthermore, internal and external validity studies demonstrated high correlations, with an average of over 0.8. The AVTI demonstrated a high correlation of 0.841 with OS. The AVTI was found to be capable of predicting voice tremor. Further studies should include a larger number of voice samples and a complementary Praat script for further analysis.

Keywords: 음성 떨림; 프랏; 말운동장애
Keywords: voice tremor; Praat; motor speech disorder

1. 서론

음성 떨림은 목, 후두(성대) 및 성대의 근육이 비자발적(involuntary movement)으로 움직이는 신경학적 장애이다. 병리적인 음성 떨림은 성도에 불수의적이고 리드미컬한 진동 운동이 있을 때 발생하며, 이는 음성의 기본 주파수와 진폭의 변화로 인식된다. 일반적으로 신경질환과 관련된 경우나 노화로 인하여 음성 떨림이 발생하고 유병률의 범위는 13%–68%로 알려져 있다(Brin et al., 1992; Dromey et al., 2009).

음성 떨림의 평가를 위해서 이비인후과 음성 전문의, 언어재활사가 팀을 이루어 다양한 평가를 수행한다. 평가에는 후두 내시경, 후두 스트로보스코피, 개인의 병력 검토, 증상에 대한 인터뷰, 음성 검사, 청지각적 평가, 음성설문지 등이 포함된다. 이 중에서 비침습적이고 간단하게 평가할 수 있는 방식이 음성 검사이다. 성대를 통해 산출되는 음성 신호를 분석하여 정상 범위의 데이터들과 비교하여 병리적인 음성 유무를 판단하게 된다.

음향학적으로 음성 떨림을 측정하는 방법은 예전부터 존재해왔다. Computerized Speech Lab 4500(CSL 4500, Kay Pentax, Saint Louis, MO, USA), Motor Speech Profile(MSP 5141; Kay Pentax), Praat 등을 이용하여 왔다(Boersma & Weenink, 2024; Brückl et al., 2018; Gamboa et al., 1998; Lundy et al., 2004; Maryn et al., 2019). 변수명은 다르지만 변수들은 주파수와 강도의 변동에 대해서 측정하였다. 변수들을 통해 확인하려고 한 부분은 변동들이 얼마나 규칙적인지, 변동의 변화량, 속도가 어떠한지 등에 대한 것이다.

상용화 된 CSL이나 MSP는 검사자가 음성 떨림을 쉽게 분석할 수 있지만 정상의 기준이 되는 데이터가 부족하고 지속적인 소프트웨어의 업데이트가 이루어지고 있지 않다는 점에서 제한이 있다(Brückl, 2012, 2021; Brückl et al., 2018; Maryn et al., 2019). Praat은 지속적으로 업데이트 되고 있으며 현재까지도 연구자들이 다양한 변수들을 구성하여 음성 떨림에 대한 연구를 보고 하고 있다. Praat script에 대한 이해가 있어야 분석에 어려움을 덜 겪지만 사용자의 편의를 위해서 최대한 간편한 방식으로 만들어 배포하고 있다(Brückl, 2021).

최근에 보고된 두 Praat script를 시연해보려 하였지만 Maryn et al.(2019)의 script는 공개되지 않아서 확인해 볼 수 없었다. Brückl의 script는 지속적으로 공개되어 왔으며, 2021년에 tremor 3.05 버전이 배포되었다. 이 버전에서는 주파수, 강도와 관련된 음성 떨림 변수들을 18개 측정하도록 구성되었다. 음성 떨림 특성을 측정하기 위해서 단일 변수(single-variable) 또는 특성을 사용하였다. 단일 변수의 장점은 단순하고 이해하기 쉽고, 데이터의 처리 및 분석이 상대적으로 간단하다. 하지만 단일 변수만을 고려하기 때문에 음성의 복잡한 특성을 충분히 반영하지 못할 수 있다.

이러한 점들을 보완하기 위해서 다중 변수 모델(multivariable composite model)들도 소개되고 있다(Awan & Roy, 2006; Latoszek et al., 2017; Maryn et al., 2010, 2019). Maryn 등이 소개한 acoustic phonatory tremor index(APTI)는 청지각적으로 지각된 음성 떨림의 중증도(perceived voice tremor severity)를 정량화하였다. 10개의 음향 변수들을 통해서 APTI의 회귀식이 완성되었지만 적용해 볼 수 있는 세부 Praat script는 확인되지 않아서 한국어 화자들에게 적용하기는 어려웠다.

임상현장에서 음성 떨림을 평가하는 것은 쉽지 않다. 임상가들은 음성의 옴도, 강도 변화를 통해서 음성 떨림을 지각하고 그 중증도를 평가한다. 음도와 강도 변화 중 어느 변수에 더욱 초점을 맞춰야 할지 그 기준은 명확하지 않다. 대부분의 음성평가처럼 음향학적 평가와 청지각적 평가를 모두 시행하여 종합적으로 결론 내리는 것이 최선이다. CSL, MSP, 기존의 Praat 연구에서 보고된 개별 변수들이 아니라 음성 떨림을 종합적으로 평가해 주는 다중 변수 모델이 필요하다.

본 연구에서는 공개되어 있는 Brückl의 script를 이용하여 새로운 다중 변수 모델을 만들어보고자 하였다. Praat script가 공개되어 있기 때문에 누구나 적용하여 사용할 수 있다는 점에서 큰 이득이 있을 것으로 생각된다. 이비인후과뿐만 아니라 음성분석기기들이 부족한 재활의학과, 언어치료센터 등에서도 이용할 수 있다.

연구문제는 다음과 같다.

첫째, 18개의 음성 떨림 변수들을 통한 다중 회귀분석 결과 유의미한 변수들은 어떤 것들이 있는가?

둘째, 내부/외부 타당도 확보를 위해서 정상 집단, 음성 떨림 집단 내에서의 상관관계는 어떠한가?

셋째, 다중 변수 모델과 청지각적 평가 결과 간의 상관관계는 어떠한가?

2. 연구방법

2.1. 연구 대상

본 연구에서는 정상 발화 집단 71명(평균 47.5±12.3세), 음성 떨림 집단 41명(평균 46.7±15.5세)의 음성 샘플이 사용되었다. 정상 발화자의 선정 기준은 다음과 같다. 첫째, 한국어를 모국어로 사용하고, 둘째, 감각적, 신경학적, 신체적 결함이 없고, 셋째, 인지, 언어, 말에 문제가 없는 것으로 확인된 자였다.

Voice tremor(VT) 집단은 이비인후과 전문의에 의해 음성 떨림이 있는 것으로 진단된 환자들로, 음향학적 음성분석과 청지각적 평가를 통해 음성 떨림을 확인하였다. 단, 다른 신경학적 및 해부학적 문제로 인한 수술력이 있는 경우, 기타 뇌질환을 동반하는 경우 연구대상에 제외하였다.

2.2. 음성 녹음

음성 녹음은 이비인후과 음성언어치료실 내에 위치한 방음 부스에서 실시하였다. 음성분석기기인 CSL 4500을 사용하여 녹음하였다. 말과제는 단모음 /아/를 편안한 음도, 강도로 발성하도록 교육하였다.

음성 떨림을 분석하기 위해서 모음은 최소 3초 구간을 선택하여 편집하여 선행연구(Brückl, 2021)에서 제시한 Praat script를 이용하여 음향 변수들을 측정하였다. 신뢰성 있는 분석을 위해서 동일한 샘플링레이트(44,100 Hz), 3초 구간(음성 신호의 시작과 끝 부분에 무음이 나타나지 않는 구간을 선택)을 이용하였다(Kent et al., 2000; Oguz et al., 2006).

2.3. 음성 떨림 분석

선행연구(Brückl, 2021)에서 제시한 tremor.praat 3.05를 이용하였다(그림 1). 기존 버전에서 수정 보완된 것으로 main script 파일과 그 하위 procedure script 파일들로 구성되어 있다. 음성 떨림과 관련된 18개의 변수들을 측정하도록 작성되었다(표 1). 간단하게 하나의 파일을 분석할 수 있는 모드와 폴더 내의 파일을 한꺼번에 분석할 수 있는 모드로 나눌 수 있다. 본 연구에서는 폴더 내의 파일을 분석하는 모드를 사용하였다. 분석시 측정값이 ‘undefined’로 나오는 음성 샘플들은 Praat에서 ‘사용할 수 없는(not available)’ 의미를 가지기 때문에 제외하였다(Brückl et al., 2018).

pss-16-2-91-g1
그림 1. | Figure 1. Tremor 3.05의 Praat script 화면 | Script window for the Praat script (Tremor 3.05)
Download Original Figure
표 1. | Table 1. 음성 떨림과 관련된 18개의 변수 | 18 variables associated with voice tremor
Variables Detail
FCoM Frequency contour magnitude
FTrC (Maximum) frequency tremor cyclicality
FMoN Number of frequency modulations above thresholds
FTrF (Strongest) frequency tremor frequency
FTrI Frequency tremor intensity index at FTrF
FTrP Frequency tremor power index at FTrF
FTrCIP Frequency tremor cyclicality intensity product at FTrF
FTrPS Frequency tremor product sum
FCoHNR Frequency contour harmonicity-to-noise ratio
ACoM Amplitude contour magnitude
ATrC (Maximum) amplitude tremor cyclicality
AMoN Number of amplitude modulations above thresholds
ATrF (Strongest) amplitude tremor frequency
ATrI Amplitude tremor intensity index at FTrF
ATrP Amplitude tremor power index at FTrF
ATrCIP Amplitude tremor cyclicality intensity product at FTrF
ATrPS Amplitude tremor product sum
ACoHNR Amplitude contour harmonicity-to-noise ratio
Download Excel Table
2.4. 청지각적 평가

7년 이상의 음성평가 임상경험을 가진 언어재활사(Speech language pathologist, SLP) 3명이 모음 샘플들을 듣고 음성 떨림의 심한정도를 평가하였다. 평가자들은 Consensus Auditory-Perceptual Evaluation of Voice(CAPE-V)을 사용하여 전반적인 음성의 심한 정도(overall severity, OS)를 측정하였다(Kempster et al., 2009). CAPE-V의 OS는 100 mm 막대선의 시각적 아날로그 척도(Visual analogue scale)를 사용하여 표시된 위치까지의 길이를 측정하여 기록한다. 심각한 음성장애는 더 높은 수치로 표시된다.

음성 샘플은 조용한 환경에서 소음이 40 dB 이하로 통제된 상황에서 제공되었고, 헤드셋을 통해 평가되었다. 각 평가자는 필요에 따라 음성을 반복하여 듣고 최종 평가를 진행하였다.

학습 효과를 최소화하기 위해 음성 샘플은 무작위로 제시되었으며, 모든 평가자는 사전 정보 없이 평가를 진행하였다. 또한, 평가자들은 30개의 음성 샘플을 평가한 후 짧은 휴식을 가졌다(Kreiman et al., 1993).

2.5. 통계분석

평가자 내 신뢰도를 평가하기 위해 전체 음성 샘플 중 약 30%인 30개를 임의로 선택하여 첫 평가 후 2주 후에 재평가하였다. 또한, 평가자 간 신뢰도를 측정하기 위해 평가자들 간의 청지각적 평가 점수를 비교하였다. 평가자 간 신뢰도는 이원혼합효과 모형(two-way mixed effects model)을 사용하고, 평가자 내 신뢰도는 일원임의효과 모형(one-way random effect model)을 활용하여 급내상관계수(intraclass correlation coefficient, ICC)를 측정하였다.

AVTI(Acoustic Voice Tremor index) 모형을 도출하기 위해서 SPSS 27.0 프로그램(IBM-SPSS, Armonk, NY, USA)을 사용하였다. 선형 회귀 방정식의 결과(OS 척도)가 0–10 사이의 점수로 출력되도록 선형 재조정(linear rescaling)한 후 단계적 다중 선형 회귀분석(stepwise multiple linear regression analysis)을 이용하여 OS-rescaling 척도와 18개의 변수들과의 관계를 분석하였다.

내부/외부 타당도, 상관관계 분석을 위해서 스피어만 상관분석은 R version 4.1.1(The R Foundation for Statistical Computing, Vienna, Austria) and RStudio 2023.09.1+494(RStudio, Boston, MA, USA)을 이용하여 분석하였다.

3. 연구 결과

3.1. 평가자 간/내 신뢰도

평가자 내 신뢰도(0.717–0.796, mean: 0.753), 평가자 간 신뢰도(0.701–0.783, mean: 0.745)으로 높은 수준이었다(표 2, 3).

표 2. | Table 2. 평가자 내 신뢰도 | Intra-rater reliability of the three SLPs who evaluated OS
ICC Rater 1 Rater 2 Rater 3
OS 0.746** 0.717** 0.796**

** p<.01.

OS, overall severity; ICC, intraclass correlation coefficient.

Download Excel Table
표 3. | Table 3. 평가자 간 신뢰도 | Inter-rater reliability of the three SLPs who judged OS
ICC Rater 1 Rater 2
Rater 2 0.701**
Rater 3 0.751** 0.783**

** p<.01.

OS, overall severityl; ICC, intraclass correlation coefficient.

Download Excel Table
3.2. AVTI 모형을 휘나 다중 선형 회귀분석

단계적 다중 선형 회귀분석을 사용하여 OS-rescaling 척도와 18개의 음향 변수들과의 관계를 분석하여 표 4에 제시하였다. 최종 모형 4단계에서 결정되었고 유의미한 것으로 나타났다(R=0.863, R2=0.744, ***p<0.001). 다중공선성(multicollinearity)에 있어서 공차한계가 0.1보다 크고 분산팽창요인(variance inflation factor; VIF)이 10보다 작은 경우 다중공선성이 없는 것으로 판단한다(Graham, 2003). FTrCIP, ATrI, FCoHNR, FCoM 등 4개 요인이 이러한 기준을 충족시키며 다중공선성의 문제는 없는 것으로 나타났다. AVTI의 회귀식은 식 (1)과 같다.

표 4. | Table 4. AVTI 다중회귀분석 결과 | Multiple linear regressions analysis predicting AVTI
Model Unstandardized coefficients Standardized coefficients t-value Sig. TL VIF
B SE B
(Constant) 2.445 .413 5.920 .000***
FTrCIP 0.467 0.078 0.453 6.013 0.000 0.421 2.372
ATrI 0.077 0.018 0.329 4.351 0.000 0.419 2.386
FCoHNR 0.102 0.027 0.194 3.822 0.000 0.926 1.080
FCoM –1.405 0.500 –0.147 –2.810 0.006 0.878 1.139

*** p<.001.

AVTI, Acoustic Voice Tremor index; SE, standard deviation error; TL, tolerance; VIF, variance inflation factor.

Download Excel Table
A V T I = 2.445 + ( 0.467 × F T r C I P ) + ( 0.077 × A T r I ) + ( 0.102 × F C o H N R ) + ( 1.405 × F C o M )
(1)
3.3. 내부/외부 타당도 조사

내부 타당도 조사를 위해서, 112명의 대상자로 구성된 원래 표본에서 무작위 추출을 통해 75명, 40명의 대상자로 구성된 집단을 구성하였다. 75명의 집단은 0.793, 40명의 집단은 0.811의 상관관계를 보였다(p<0.05).

외부 타당도 조사는 완전히 새로운 대상자 집단에 대해 측정 항목의 성능을 평가하였다. 새로운 대상자 30명의 집단에 대한 상관관계는 0.822로 나타났다(p<0.05).

3.4. AVTI 모형과 청지각 평가(OS) 간의 상관관계

AVTI와 청지각적 평가 간의 상관관계를 분석한 결과, AVTI는 OS와 0.840(p<0.05)의 상관관계를 보였다(그림 2, 표 5). 4개의 변수 중에서 AVTI, OS_res와 높은 상관관계를 보인 것은 FTrCIP와 ATrI로 확인되었다.

pss-16-2-91-g2
그림 2. | Figure 2. AVTI와 OS_res 간의 산점도 플롯 | Scatter plot between AVTI and OS_res AVTI, Acoustic Voice Tremor index; OS, overall severity
Download Original Figure
표 5. | Table 5. 변수들 간의 상관관계 | Correlation coefficient among variables
FCoM FTrCIP FCoHNR ATrI OS_res AVTI
FCoM 1.000
FTrCIP –0.257** 1.000
FCoHNR –0.029 0.305** 1.000
ATrI –0.320** 0.747** 0.286** 1.000
OS_res –0.358** 0.735** 0.486** 0.720** 1.000
AVTI –0.501** 0.761** 0.604** 0.809** 0.841** 1.000

** p<.01.

OS, overall severity; AVTI, Acoustic Voice Tremor index.

Download Excel Table

4. 논의

본 연구에서는 음성 떨림을 측정하기 위한 AVTI 모형을 제시하고, 내부/외부 타당도를 검증하였다. 본 연구의 질문들에 대한 논의는 다음과 같다.

첫째, 18개의 음성 떨림 변수들을 통한 다중 회귀분석 결과 유의미한 변수들은 어떤 것들이 있는가?

본 연구에서 새로운 유형의 AVTI 모델이 제시되었다. 모델을 만들기 위한 초기 변수들은 선행 연구(Brückl, 2012, 2021; Brückl et al., 2018)들에서 제시한 변수들로 선정하였다. 기존 연구들에서는 단일 변수들의 측정값을 정상집단과 파킨슨병 집단 간에 비교를 진행하였다. 각 단일 변수들의 차이는 확인하였지만 이것이 복합적인 음성 떨림의 특성을 모두 설명하기에는 어려움이 있었다. 이를 해결하기 위해서 18개의 변수를 통해 회귀 분석을 진행하였고, 그 결과 FTrCIP, ATrI, FCoHNR, FCoM이 회귀 모형을 설명하기 위한 변수들로 선택되었다(R=0.863, R2=0.744, ***p<0.001). 연구 초기에는 112명 보다 많은 대상자 샘플이 있었으나 Praat의 분석 과정에서 측정값이 ‘undefined’로 나오는 음성 샘플들은 Praat에서 ‘사용할 수 없는(not available)’ 의미를 가지기 때문에 제외하였다(Brückl et al., 2018). ‘undefined’ 대신 ‘zero, 0’ 값으로 출력하는 것도 가능하지만 0으로 계산하게 되면 왜곡된 분포, 결측치와의 혼동, 잘못된 통계적 분석 등이 나타나기 때문에 선택하지 않고 음성 샘플을 제외하였다. Anand et al.(2012)에서는 음성 주파수, 변조 주파수, 변조의 정도, 신호대 잡음비 등을 이용하여 음성 떨림에 대해서 조사한 결과, 주파수 변조의 정도에 따라 음성 떨림의 중증도가 증가함을 확인하였다(R=0.702, R2=0.493, ***p<0.001). 본 연구에서도 유의미한 4개의 변수 중에서 3개가 주파수 관련인 것으로 보아 선행 연구의 결과를 뒷받침한다고 볼 수 있다(Anand et al., 2012). Maryn et al.(2019)의 연구에서는 (R=0.884, R2=0.781, ***p<0.001)의 결과를 나타내었다.

둘째, 내부/외부 타당도 확보를 위해서 정상 집단, 음성 떨림 집단 내에서의 상관관계는 어떠한가?

내부 타당도 조사를 위해 112명의 대상자를 대상으로 한 표본에서, 75명과 40명의 대상자로 구성된 두 집단이 무작위 추출되었다. 75명 집단은 0.793, 40명 집단은 0.811의 상관관계를 보였다(p<0.05). 외부 타당도 조사는 새로운 대상자 집단을 이용하여 측정 항목의 성능을 평가하였다. 30명의 새로운 대상자로 이루어진 집단의 상관관계는 0.822로 나타났다(p<0.05). 선행 연구에서는 내부 타당도 확보를 위해 기존 대상자 253명 중에서 10, 50, 100명을 무작위 선정하였다. 각각 0.8, 0.75, 0.77의 상관관계가 확인되어 내부 타당도를 확보하였고, 외부 타당도 확보를 위해 새로운 대상자 군을 39명 모집하여 검증하였다(R=0.796, R2=0.634, ***p<0.001). 본 연구에서도 평균 0.8 이상의 상관관계가 확인되어 내,외부 타당도를 확보하였다.

셋째, 다중 변수 모델과 청지각적 평가 결과 간의 상관관계는 어떠한가?

AVTI는 OS_res와 0.841의 높은 상관관계를 보였다. 이 변수들과 높은 상관을 보이는 것도 FTrCIP와 ATrI로 확인되었다. 선행연구들에서도 청지각적 평가와 다중 변수 모델 간에 0.884의 상관관계를 보였다(Maryn et al., 2019). 다중 변수 모델들은 지속적으로 음성 샘플을 추가하여 모델의 예측도를 업데이트 해야할 필요가 있다. 음향학적 변수들 중에서 FCoM은 유일하게 다른 변수들과 음의 상관관계를 나타내었다. 음성 떨림이 심할수록 FCoM은 낮아진다는 것이다. 이 변수는 frequency contour magnitude에 대한 것이라 설명되어 있지만, 스크립트 개발자는 CoM은 0에서 1 사이의 값을 가지며, 값이 높을수록 다른 변수 측정치들이 더 신뢰할 수 있다고 하였다. 또한 이 측정치는 기술적으로 pitch 객체(음조 윤곽에서 생성됨) 내의 Praat의 intensity와 동일하다고 보고하였다. CoM 값이 클수록 해당 음성 신호의 중심 주파수나 강도를 신뢰할 수 있다고 하였다. 이는 음성 분석에서 중요한 역할을 하며, 신뢰도가 높을수록 분석 결과가 더 정확하다는 것을 의미한다. 정상 음성보다는 병리적인 음성에서 pitch를 탐지하는 것이 더 어렵고 이러한 부분이 분석의 신뢰도에 영향을 주는 것으로 생각된다. 개발자도 배포 문서에서 이 스크립트는 정확한 pitch의 추출에 분석 신뢰도가 영향을 받기 때문에 여전히 실험단계라고 하였다(Brückl, 2021). 후속 연구를 통해서 FCoM이 측정되는 과정을 살펴보고 좀 더 명확한 정의가 내려져야 할 것으로 생각된다.

청지각적 평가를 수행하면서 생각해봐야 할 점은 음성의 음도와 강도 변화 중에 어디에 더욱 초점을 두고 평가를 해야할지 고민되는 점이다. 이러한 부분들이 다중 변수 모델에 잘 적용될 수 있도록 더 많은 음성 샘플을 분석하여야 할 것으로 생각된다.

본 연구에서는 기존에 소개된 Praat 스크립트를 이용하여 음성 떨림의 전반적인 특성을 반영하는 다중 변수 모델을 고안하였다. 18개의 음향 변수를 통해 회귀분석을 실시하여 음성 떨림의 중증도를 잘 설명할 수 있는 회귀모형을 제시하였다. 많은 연구에서 음향학적 분석과 청지각적 평가 간의 상호보완적 역할을 강조하고 있다. 본 연구를 통해 임상 현장에서 청지각적으로 판단하는 음성 떨림의 중증도를 정량화하여 평가의 신뢰도를 높이기 위함이다. 현재 연구는 AVTI가 음성 떨림의 정도를 잘 반영하는지 확인하고, 청지각적 평가와의 상관관계를 통해 타당성을 검증하고자 하였다. 임상 현장에서 유용한 평가 도구로 활용되기 위해서는 후속 연구가 필요하다. 대상자 수를 늘려 정상과 음성 떨림 환자들의 측정값을 통해 정상과 병리를 구분하는 역치값을 구하고, 그 예측력을 확인해야 한다.

본 연구의 제한점은 다음과 같다. 첫째, 본 연구에서는 정상 집단 71명과 음성 떨림 집단 41명의 모음 112명 샘플을 분석하였다. 음성 떨림 환자의 특성상 많은 수의 대상자를 모집하기에는 어려움이 있지만 최소 수백명 단위의 대상자를 분석한다면 좀 더 신뢰성 높은 회귀 모형이 도출될 것으로 예상할 수 있다. 이를 위해 다른 병원기관과도 협력하여 다양한 연령대의 대규모 데이터 수집, 빠른 대상자 모집, 신뢰성 증대 등도 기대할 수 있다. 다중 변수 모델의 특성상 데이터가 누적되고 새로운 음향 변수가 소개되면 더 높은 예측력을 가진 모델로 업데이트될 수 있다. 둘째, 후속 연구에서는 Maryn의 Praat script를 확보하여 Brückl의 방식과 비교하는 것이 좋을 것으로 생각된다. 같은 Praat 내에서의 분석이라 하더라도 음성 떨림을 측정하는 방식은 매우 다양하다. 현재 소개된 두 연구방법의 변수들을 모두 분석하여 한꺼번에 회귀분석을 진행한다면 18개에서 30개 이상으로 변수가 증가하기 때문에 음성 떨림을 더욱 잘 설명할 수 있는 모형이 도출 될 것이라 기대한다.

References

1.

Anand, S., Shrivastav, R., Wingate, J. M., & Chheda, N. N. (2012). An acoustic-perceptual study of vocal tremor. Journal of Voice, 26(6), 811.E1-811.E7.

2.

Awan, S. N., & Roy, N. (2006). Toward the development of an objective index of dysphonia severity: A four‐factor acoustic model. Clinical Linguistics & Phonetics, 20(1), 35-49.

3.

Boersma, P., & Weenink, D. (2024). Praat: Doing phonetics by computer (version 6.4.05) [Computer program]. Retrieved from http://www.praat.org

4.

Brin, M. F., Fahn, S., Blitzer, A., Ramig, L. O., & Stewart, C. (1992). Movement disorders of the larynx. In Neurologic disorders of the larynx (pp. 248-278). New York, NY: Thieme Medical.

5.

Brückl, M. (2012, September). Vocal tremor measurement based on autocorrelation of contours. Proceedings of the 13th Annual Conference of the International Speech Communication Association 2012 (Interspeech 2012), (pp. 715-718). Portland, OR.

6.

Brückl, M. (2021). Tremor.praat 3.05 [Praat script]. Retrieved from http://www.brykl.de/tremor3.05.zip

7.

Brückl, M., Ghio, A., & Viallet, F. (2018). Measurement of tremor in the voices of speakers with Parkinson's disease. Procedia Computer Science, 128, 47-54.

8.

Dromey, C., Reese, L., & Arden Hopkin, J. A. (2009). Laryngeal-level amplitude modulation in vibrato. Journal of Voice, 23(2), 156-163.

9.

Gamboa, J., Jiménez-Jiménez, F. J., Nieto, A., Cobeta, I., Vegas, A., Ortí-Pareja, M., Gasalla, T., ... García-Albea, E. (1998). Acoustic voice analysis in patients with essential tremor. Journal of Voice, 12(4), 444-452.

10.

Graham, M. H. (2003). Confronting multicollinearity in ecological multiple regression. Ecology, 84(11), 2809-2815.

11.

Kempster, G. B., Gerratt, B. R., Verdolini Abbott, K., Barkmeier-Kraemer, J., & Hillman, R. E. (2009). Consensus auditory-perceptual evaluation of voice: Development of a standardized clinical protocol. American Journal of Speech-Language Pathology, 18(2), 124-132.

12.

Kent, R. D., Kent, J. F., Duffy, J. R., Thomas, J. E., Weismer, G., & Stuntebeck, S. (2000). Ataxic dysarthria. Journal of Speech, Language, and Hearing Research, 43(5), 1275-1289.

13.

Kreiman, J., Gerratt, B. R., Kempster, G. B., Erman, A., & Berke, G. S. (1993). Perceptual evaluation of voice quality: Review, tutorial, and a framework for future research. Journal of Speech, Language, and Hearing Research, 36(1), 21-40.

14.

Latoszek, B. B., Maryn, Y., Gerrits, E., & De Bodt, M. (2017). The acoustic breathiness index (ABI): A multivariate acoustic model for breathiness. Journal of Voice, 31(4), 511.E11-511.E27.

15.

Lundy, D. S., Roy, S., Xue, J. W., Casiano, R. R., & Jassir, D. (2004). Spastic/spasmodic vs. tremulous vocal quality: Motor speech profile analysis. Journal of Voice, 18(1), 146-152.

16.

Maryn, Y., De Bodt, M., & Roy, N. (2010). The acoustic voice quality index: Toward improved treatment outcomes assessment in voice disorders. Journal of Communication Disorders, 43(3), 161-174.

17.

Maryn, Y., Leblans, M., Zarowski, A., & Barkmeier-Kraemer, J. (2019). Objective acoustic quantification of perceived voice tremor severity. Journal of Speech, Language, and Hearing Research, 62(10), 3689-3705.

18.

Oguz, H., Tunc, T., Safak, M. A., Inan, L., Kargin, S., & Demirci, M. (2006). Objective voice changes in nondysphonic Parkinson's disease patients. Journal of Otolaryngology, 35(5), 349-354.