Speech Disorders/말장애

뮤지컬 전공 남학생에서 후두 높이에 따른 음향학적 측정치에 대한 예비 연구*

이광용1, 이승진2,**
Kwang Yong Lee1, Seung Jin Lee2,**
Author Information & Copyright
1동국대학교 예술대학 연극학부
2한림대학교 자연과학대학 언어청각학부 및 청각언어연구소
1Division of Theatre, College of the Arts, Dongguk University, Seoul, Korea
2Division of Speech Pathology and Audiology, Research Institute of Audiology and Speech Pathology, College of Natural Sciences, Hallym University, Chuncheon, Korea
**Corresponding author : sjl@hallym.ac.kr

© Copyright 2022 Korean Society of Speech Sciences. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Apr 25, 2022; Revised: Jun 16, 2022; Accepted: Jun 16, 2022

Published Online: Jun 30, 2022

국문초록

본 연구에서는 남성 뮤지컬 전공 학생의 발성 시 고, 중, 저의 후두 높이 조건에 따른 음향학적 측정치를 비교하고자 하였다. 또한 휴식 시 후두 융기의 높이를 기준으로 후두의 상대적 높이와 음향학적 측정치 간의 상관관계를 알아보고, 후두의 상대적 높이에 대한 예측 가능성을 확인하고자 하였다. 연구대상은 남성 뮤지컬 가창 전공 남학생 5명이었으며, 고, 중, 저의 후두 위치에서 발성한 /아/ 모음을 각각 10회씩 발성하도록 하여 음향학적 분석을 시행하였다. 발성 시, 휴식 시를 기준으로 고, 중, 저 위치에서의 후두 융기의 상대적 수직 위치를 측정하였다. 연구 결과, 후두의 상대적 위치는 휴식 시를 기준으로 유의한 차이가 있었다. 후두가 하강함에 따라 포먼트 주파수는 감소한 반면, 해당 주파수에서의 스펙트럼 에너지는 증가하였다. 포먼트 주파수는 후두의 상대적 높이와 약함–중간 수준의 정적 상관관계를, 스펙트럼 에너지는 중간 수준의 부적 상관관계를 보였다. 후두의 상대적 높이는 8개의 음향학적 측정치에 의해 예측되었다(수정된 R2=.829). 이를 통하여 비침습적인 방법으로 후두의 상대적 높이를 예측할 수 있는 가능성을 일부 확인하였다.

Abstract

This study aimed to compare acoustic measurements by the high, middle, and low laryngeal heights of male musical theater students. Furthermore, the correlation between the relative height of the larynx and the acoustic measurements was examined, along with the predictability of the relative height (vertical position) of the larynx from acoustic measurements. The participants included five male students majoring in musical theater singing, and acoustic analysis was performed by having them produce the /a/ vowel 10 times each at the laryngeal positions of high, middle, and low. The relative vertical positions of the laryngeal prominence in each position were measured based on the resting position. Results indicated that the relative position of the larynx varied significantly according to laryngeal height, such that as the larynx descended, the first three formant frequencies decreased while the spectral energy at the same frequencies increased. Formant frequencies showed a weak to moderate positive correlation with the relative height of the larynx, while the spectral energy showed a moderate negative correlation. The relative height of the larynx was predicted by eight acoustic measures (adjusted R2 = .829). In conclusion, the predictability of the relative height of the larynx was partially confirmed in a non-invasive manner.

Keywords: 후두 높이; 음향학적 분석; 뮤지컬 가창; 음성
Keywords: laryngeal height; acoustic analysis; musical theatre singing; voice

1. 서론

뮤지컬이라는 연극 장르에서 배우들은 다양한 캐릭터를 연기하고, 그것을 위해 호흡의 압력이나 후두의 위치에 따라 달라지는 소리의 밝기, 두께감, 무게감 같은 청각적 느낌의 차이로 발생하는 다양한 음색을 도구로 사용하게 된다(Deer & Dal Vera, 2008). 현대 뮤지컬 발성에서는 조 에스틸(Josephine Antoinette Estill, 1921–2012)이 음성학적 측면에서 음색을 6개의 퀄리티(quality)로 나누어 제안하였으며, 훈련을 위한 발성 연습법인 에스틸 보이스 트레이닝(estill voice training, EVT)을 제안하여 현재 국내에서도 뮤지컬 발성 교육에 활용되어 오고 있다(Klimek et al., 2005; Lee, 2021b; Lee & Kim, 2020).

에스틸이 제안한 6개의 퀄리티는 소리의 질감을 크게 6개로 나눈 것이다. 구체적으로 살펴보면, 먼저 말에 가까운 자연스러운 소리는 스피치 퀄리티(speech quality)이며, 정서적 갈등에 필요한 소리를 크라이 퀄리티(cry quality), 내적 정서를 표현하기 적당한 소리를 팔세토 퀄리티(falsetto quality), 밝고 화려한 느낌의 소리를 트웽 퀄리티(twang quality)로 일컫는다. 트웽과 스피치가 섞여 인물의 정서를 극대화할 때 쓰이는 소리인 오페라 퀄리티(opera quality)가 있으며, 마지막으로 극의 절정이나 갈등의 정점에서 강렬한 표현에 적합한 벨팅 퀄리티(belting quality)가 있다. 이 퀄리티들의 특징은 다름 아닌 후두의 높이 혹은 위치(고, 중, 저)와 성문하압의 크기로 표현되고 있다(Park, 2012). 이와 같은 점을 통해 볼 때, 뮤지컬 장르에서의 다양한 음색 조절 및 가창방법을 습득하는 데 있어 후두의 높이 혹은 위치를 필요에 따라 조절하는 것이 중요한 기술 가운데 하나가 될 수 있음을 알 수 있다.

음색에 따른 후두 조절능력은 가창 학습자의 음성 위생과 보호를 위해서도 중요한 부분이다. 예컨대 EVT의 6개의 음색 중 특히 벨팅 퀄리티(belting quality)는 높은 후두 위치와 높은 성문하압을 필요로 하는데(Kayes & Welch, 2017), 일반적으로 낮은 후두 위치에서 성대의 완전한 접촉이 촉진된다는 것을 생각해본다면(Titze, 1993), 높은 후두 위치에서 강한 강도로 발성할 경우 특히 초심자는 인위적이고 과도한 후두 근긴장이 유발된 상태에서 성대 접촉률을 높이게 될 가능성이 높다. 가창 시 공명 특성은 장르의 영향 또한 받게 되는데(Yoo, 2017), 뮤지컬 전공 학생들은 이러한 상태에서의 발성을 지속적으로 요구받기 때문에 성대 폴립이나 결절 등의 문제가 빈번히 발생할 수 있어서, 한 선행연구에서는 연구대상자 중 성악전공 학생은 음성질환이 없는 데 반해 실용음악과 뮤지컬 전공 학생의 각각 17%, 40%가 음성질환을 보였다고 보고하기도 하였다(Lloyd et al., 2020). 또한 이차적으로 성문상부 구조의 과도한 보상적 협착 패턴을 보이는 경우도 많다(D’haeseleer et al., 2017). 따라서 안전한 가창 훈련을 위해 음성상태와 함께 필요한 음색에 따라 민첩하게 후두의 위치와 성문하압 등을 모니터링하면서 조절할 수 있어야 한다.

뮤지컬 전공 학생이 가창 훈련을 수행하면서 스스로 본인의 후두의 수직적 위치를 가장 손쉽게 시각적으로 모니터링할 수 있는 방법은 거울을 통해 후두 융기(laryngeal prominence)를 관찰하여 시각적인 피드백을 받는 방법이다. 그러나 이를 정량적, 객관적으로 시행할 수 있는 방법이 부재하다는 점은 뮤지컬 발성 가창자의 성대가 음성 외상(phonotrauma)의 위험에 자주 노출되는 이유 중 하나로 작용한다. 특히 여성이나 음역이 높은 성대를 가진 경우 후두 융기가 두드러지지 않아 육안으로 이를 관찰하기가 어려운 경우가 많아 어려움이 더욱 가중되고 있는 실정이다.

후두 외부의 근육들 중에서 설골(hyoid bone)의 상부 근육들은 주로 후두를 상승시키고, 설골 하부의 근육들은 후두를 하강시키는 데 이용된다(Jin, 2017). 이와 같은 후두 외근의 움직임에 의해 후두의 위치 또는 높이가 변화함에 따라 성도 내의 공간이 변할 수 있고, 이에 따라 음성의 특징 변화가 나타날 수 있다. 후두 위치에 따른 음성 특성의 변화에 대한 선행 실험 연구를 살펴보면, 먼저 자기공명영상을 이용하여 다양한 성종의 성악가 및 학생의 후두 높이를 측정한 연구에서는 후두의 수직적 높이와 음도가 정적인 상관관계를 보인 것으로 보고되었다(Neuschaefer-Rube et al., 1996).

국내 연구를 살펴보면, Nam et al.(2004)은 전통 성악가를 대상으로 성악 발성 시와 후두를 높였을 때 비디오투시검사(videofluoroscopy)를 통해 후두의 높이를 측정하고 포먼트 주파수를 비교한 결과, 전반적으로 성악 발성 시 포먼트 주파수가 낮아지고 해당 포먼트에서의 진폭이 증가했다고 보고하였다. 그러나 성악 발성을 하는 대상자에 국한되었고, 침습적인 검사를 시행하였으며, 대상자가 1인이어서 통계적 검정은 하지 못하였으므로, 추가적인 근거가 필요한 실정이다. 이러한 음향학적 변수에는 발성 시 성도의 모양과 그로 인한 공명 특성을 반영하는 포먼트 주파수뿐만 아니라, 음성의 질(voice quality)와 상관관계가 있는 것으로 알려진 주파수/진폭변동률이나 소음대배음비, 또 켑스트럼 분석 변수들이 포함될 수 있다. 한편 가수에서의 연구는 아니지만, X-ray를 이용하여 자폐스펙트럼장애에서 후두 높이를 측정한 연구에서도 자폐 아동의 후두 높이가 더 높으면서 기본주파수(fundamental frequency, F0)가 높게 나타나, 후두를 낮추었을 때 저음 발성이 용이하다는 기존 연구들과 맥을 같이하였다(Lee et al., 2021a).

이러한 측정치들을 이용하여 후두의 높이에 따른 음성 특성들을 객관적으로 모니터링할 수 있는 토대 마련이 가능하다면, 이를 응용해 애플리케이션 등을 이용하여 후두 위치를 모니터링하는 플랫폼을 개발할 수 있는 가능성이 생긴다. 이러한 피드백 시스템의 필요성은 이미 선행연구에서도 제시되어 왔으나, 아직 정량적 피드백이 가능한 실용화된 시스템은 제시되지 못하였다(Pehlivan & İlter Denizoğlu, 2009). 뮤지컬 전공 학생들의 발성 연습 시 후두의 위치를 학생 스스로 손쉽게 모니터링하고, 이를 통해 필요한 음색과 본인의 음성상태에 맞게 후두 위치를 조절하는 가창 훈련을 시행할 수 있다면, 뮤지컬 전공 학생들의 발성 능력 개발과 음성 외상의 방지를 통한 사회적 비용 감소에 도움이 될 수 있을 것이다.

따라서 이 예비연구에서는 남성 뮤지컬 전공 학생의 발성 시 후두 높이 조건에 따른 음향학적 측정치를 비교하고자 하였다. 아울러 휴식 시 후두 융기의 높이를 기준으로 한 후두의 상대적 높이, 즉 수직 위치(vertical position)와 음향학적 측정치 간의 상관관계를 알아보고, 이러한 상관관계를 토대로 후두의 상대적 높이에 대한 예측 가능성을 확인하고자 하였다. 이를 통하여 궁극적으로는 후두 위치에 대한 정량적 모니터링의 가능성을 탐색하고자 하였다.

2. 연구 방법

2.1. 연구 대상

연구 대상으로 한국어 모국어 화자인 남성 뮤지컬 가창 전공 학생 5명이 참여하였으며, 연령은 25.2±1.6세였다. 이들은 뮤지컬 분야에 입문한 뒤 경과한 기간이 평균 5.2년이었고, 일 평균 가창 연습참여 시간은 2–3시간으로 보고되었다. 연구포함 기준은 다음과 같다. 1) 한국어 모국어 화자로 흡연력(평생)이나 최근 3개월 동안 음성장애 병력을 보고하지 않은 자, 2) 평가자에 의해 발성 시 후두 위치를 고, 중, 저의 위치를 조절할 수 있음이 육안으로 판단된 자, 3) 평가자의 GRBAS 척도를 통한 청지각적 평가에서 정상 음성(G0)으로 판단된 자, 4) 기타 음성장애와 관련된 신경학적 질환 병력이 보고되지 않은 자. 후두 높이 조절 가능 여부에 대한 평가자는 공연예술학 석사 이상의 학력으로 교육경력 10년 이상인자로 선별하였으며, 청지각 평가자는 언어병리학 박사 학력으로 음성장애 분야 임상 및 연구 경력 10년 이상인 자로 하였다. 모든 대상자는 연구의 목적 및 절차에 대한 상세한 설명을 안내받은 뒤 본 연구에 자의로 참여하였다.

2.2. 연구 절차

음성녹음 및 영상녹화는 환경 소음이 50 dB 이하로 통제된 조용한 공간에서 시행하였다. 대상자가 편안하게 서서 정면을 바라보는 상태에서 대상자의 입으로부터 약 10~15 cm의 거리를 유지하도록 안정적으로 위치시킨 TASCAM Linear PCM Recorder DR-40X(TEAC, East Syracuse, NY, USA)를 이용하여, 44,100 Hz의 표본추출률(sampling rate)과 16 bit 양자화 설정으로 녹음을 수행하였다.

먼저 대상자의 얼굴 옆면에 30 cm 자를 댄 뒤, 자의 하단부를 쇄골 위에 고정하고 상단부를 평가자가 안정적으로 잡아 고정한 후, 1) 편안하게 호흡하는 휴식 시 후두 위치, 2) 높은 후두 위치(고), 3) 중간 후두 위치(중), 4) 낮은 후두 위치(저)에서 순서대로 /아/ 모음을 3초 이상 안정적으로 발성하도록 하였다. 과제 수행 시 녹음과 동시에 스마트폰을 이용하여 대상자의 측면을 영상으로 촬영하였다. 이때 발성 과제 전, 편안한 음도와 크기로 “안녕하세요. OOO입니다.”와 같이 본인의 이름을 말하도록 한 후, 해당 음도에서 ±3 반음(semitone) 이내에서 본인이 가창 시 가장 편안하게 발성할 수 있는 음도로 발성하도록 하였다. 휴식 시의 후두 위치는 1회, 3초간 촬영하였으며, 고, 중, 저의 후두 위치에서 순서대로 발성하는 것을 1세트로 하여 10세트를 촬영 및 녹음하였다. 1인당 총 30회 발성 영상 및 음성 샘플, 총 150개의 영상 및 음성 샘플을 획득하였으며, 모든 음성 및 영상샘플이 분석에 활용되었다. 과제를 수행하는 동안 대상자가 가급적 상체와 머리를 안정적으로 유지하도록 안내하였다.

후두 높이에 따라 음도에는 차이가 없도록 하였으며, 음도의 차이가 발생한 것으로 판단할 경우 즉시 다시 시행하였다. 자의 높이와 위치가 안정적으로 유지되지 않거나, 대상자가 재시행을 요청하는 경우에도 재시행하도록 하였다.

2.3. 분석

대상자의 영상 자료를 통해 후두 높이 측정치를, 음성 자료를 통해 음향학적 측정치를 아래 절차를 이용하여 분석하였다.

2.3.1. 후두 융기의 상대적 높이 측정

먼저 촬영한 영상 파일을 재생하면서 휴식 시, 고, 중, 저의 후두 위치에서 모음 /아/를 안정적으로 발성할 때의 장면을 개별 사진(jpg)의 형태로 각각 캡처한 후, Microsoft Powerpoint 슬라이드에 사진들을 삽입(1세트당 4장씩)하였다. 네 개의 사진에서 자의 눈금을 기준으로 동일한 높이로 사진들을 위치시킨 후, 휴식 시 후두 융기의 높이에서 보조선으로 이용할 직선을 수평으로 긋고, 그 직선을 기준으로 하여 고, 중, 저 위치의 후두 융기 정점 높이에서 다시 수평으로 그은 추가 보조선까지의 거리(cm)를 확인하여, 자의 눈금이 있는 소수점 첫째 자리까지 값을 측정하였다.

기준이 되는 휴식 시 위치에 비해 후두 융기의 정점이 높게 위치하는 경우 양(+)의 값으로, 낮게 위치하는 경우 음(–)의 값으로 측정하였다. 눈금을 이용한 정확한 측정이 어려운 경우 해당 발성 영상에서 선명한 측정이 가능한 장면을 다시 캡처하여 재측정하였다. 또한 대상자 중 1명을 무선으로 선정하여 검사자 간, 검사자 내(1주일 간격) 신뢰도를 확인하기 위해 재측정하였다. 휴식 시를 기준으로 고, 중, 저 위치에서 후두 융기의 높이를 측정한 예시는 그림 1과 같다.

pss-14-2-55-g1
그림 1. | Figure 1. 휴식 시, 고, 중, 저의 후두 위치에서 후두 융기의 상대적 높이를 측정한 예시 | Example of measuring the relative height of the laryngeal prominence at rest, high, mid, and low laryngeal positions
Download Original Figure
2.3.2. 음향학적 분석

모음 샘플에 대해 포먼트와 스펙트럼 에너지, 음질 관련 측정을 수행하였다. 3초 이상 녹음된 각 모음샘플 파일은 Sony Sound Forge 12.0(Sony Creative Software, Middleton, WI, USA) 프로그램을 이용하여, 정확하게 2초 길이의 안정구간을 확인 및 트리밍하여 별도의 wav 파일로 저장하였다. 고, 중, 저 위치 음성샘플의 스펙트로그램 예시(range 0–8 kHz, window length=.005, dynamic range=70 dB)가 순서대로 그림 2에 제시되어 있다.

pss-14-2-55-g2
그림 2. | Figure 2. 고, 중, 저 후두 위치의 모음샘플 스펙트로그램 예시 | Example of spectrograms of vowel samples at high, mid, and low laryngeal positions
Download Original Figure

포먼트와 스펙트럼 에너지에 대한 분석을 위해서는 Praat와 Matlab을 기반으로 한 무료 음성 분석 프로그램인 VoiceSauce v1.37(http://www.phonetics.ucla.edu/voicesauce/)의 실행가능한 Matlab 컴파일 버전을 이용하였다. VoiceSauce는 Praat script 활용을 하지 않고도 그래픽 사용자 인터페이스(graphic user interface)를 활용하여, 사전에 설정해 둔 분석 세팅에 따라 특정 디렉토리 내의 대량의 음성데이터에 대한 자동적 분석을 손쉽게 수행하여 데이터 시트의 형태로 내보내기에 매우 용이한 프로그램이다(Shue et al., 2011). 본 연구의 대상자들은 정상 음성 대상자로 한정하였으므로 수작업이 아닌 자동적 분석을 통하여 측정치를 획득하는 데 큰 문제가 없었다.

포먼트 측정 시에는 5,000 Hz 내에서 5개의 포먼트를 측정하는 것으로 설정하였으며, 첫 번째(F1), 두 번째(F2)와 세 번째(F3) 포먼트 주파수를 Hz 단위로 측정하였다. 스펙트럼 에너지 값으로는 첫 번째 배음(first harmonic, H1), 첫 번째 포먼트(first formant, A1), 두 번째 포먼트(second formant, A2), 세 번째 포먼트(third formant, A3)의 진폭(amplitude)을 dB 단위로 측정하였다. 또한 각 포먼트에 해당하는 주파수 대역폭(bandwidth), 즉 B1, B2, B3 또한 측정하였다. 측정된 데이터는 ‘output to text’ 기능을 이용하여 내보내기를 수행한 뒤 Microsoft Excel에서 로드하였고, 각 음성샘플 파일별로 측정된 구간 내의 값을 분석에 이용하였다.

음질과 관련된 음향 변수의 측정에는 Computerized Speech Lab(Model 4150B, KayPENTAX, Lincoln Park, NJ, USA; CSL)의 모듈 프로그램인 Multi-Dimensional Voice Program advanced version(Model 5105, KayPENTAX; MDVP)과 Analysis of Dysphonia in Speech and Voice(Model 5109, KayPENTAX; ADSV)를 이용하였다. MDVP를 통해서는 음질과 관련된 전통적 음향학적 변수인 주파수변동률(jitter%, Jitt; 단위 %), 진폭변동률(shimmer%, Shim; 단위 %), 그리고 소음대배음비(noise-to-harmonic ratio, NHR)를 측정하였다. 아울러 ADSV를 통해서는 켑스트럼 피크 현저성(cepstral peak prominence, CPP; 단위 dB), L/H 스펙트럼 비율(L/H spectral ratio, SR; 단위 dB), 두 변수의 표준편차(SD, σCPP, σSR)와 남성 기준의 모음에 대한 켑스트럼 스펙트럼 발성장애 지수(Cepstral Spectral Index of Dysphonia, CSID) 또한 계산하였다.

2.4. 통계분석

후두의 상대적 높이 측정치의 신뢰도를 살펴보기 위하여 평가자 간에는 급내상관계수(intraclass correlation coefficient, ICC)를 조사하였으며, 평가자 내에는 일원변량모형, 평가자 간에는 이원혼합모형을 적용하여 단일측도로 하였다. 후두의 높이 조건(고, 중, 저)에 따른 비교를 수행하기 위해 반복 측정 분산분석(repeated measures of analysis of variance)을 시행하였다. 구형성 가정을 만족하지 못하는 경우 그린하우스-가이서(Greenhouse- Geisser) 방법을 이용하였으며, 사후분석으로는 본페로니 방법을 이용하였다. 후두의 상대적 높이와 음향학적 측정치 간 상관관계를 알아보기 위해 피어슨 상관분석을 시행하였다. 마지막으로 유의한 상관관계가 나타난 음향학적 측정치를 이용하여 후두의 상대적 높이를 예측할 수 있는지 알아보기 위해 단계적 회귀분석(stepwise regression)을 시행하였다. 통계 분석에는 SPSS Statistics 25 소프트웨어(IBM-SPSS, Armonk, NY, USA)를, 시각화 프로그램으로는 Python 3.9를 이용하였고, 유의수준은 .05로 하였다.

3. 연구 결과

3.1. 후두의 상대적 높이

휴식 시의 후두 융기의 위치를 기준으로 고, 중, 저의 후두 위치 시 후두의 상대적 높이를 측정한 결과는 표 1과 같다. 평가의 신뢰도를 살펴보면, 평가자 간 신뢰도(ICC=.942)와 평가자 내 신뢰도(ICC=.997)가 모두 .9 이상으로 매우 높았다. 후두의 위치에 따라서는 후두의 상대적 높이에 있어 유의한 차이가 있었으며(F=898.482, p<.001), 사후분석 결과 고, 중, 저의 순으로 평균 높이가 높았고, 모든 대응 간 차이가 유의하였다(p<.001).

표 1. | Table 1. 고, 중, 저의 위치 시 후두의 상대적 높이 | Relative height of the larynx in high, middle, and low positions
Laryngeal positions Mean (cm) Standard deviation Maximum Minimum
High 0.134 0.317 −0.8 0.7
Middle −0.658 0.275 −1.4 −0.1
Low −1.750 0.304 −2.8 −1.1
Download Excel Table
3.2. 후두의 높이 조건에 따른 음향학적 측정치 비교

후두의 높이 조건에 따라 포먼트와 스펙트럼 에너지를 비교한 결과가 표 2에 제시되어 있다. 후두의 높이 조건에 따라 F0를 제외한 모든 변수에서 유의한 차이가 있었다(p<.001). 고, 중, 저 위치에서 포먼트 주파수의 범위를 살펴보면, F1은 각각 629.46– 767.29 Hz, 614–875.58 Hz, 541.89–821.25 Hz였고, F2는 각각 1,011.59–1,498.74 Hz, 958.42–1,262.01 Hz, 887.65–1,427.13 Hz였으며, F3는 2,109.50–3,044.12 Hz, 2,306.74–2,975.92 Hz, 2,098.69– 2,659.48 Hz였다. 평균 주파수 대역폭은 B1 145.57 Hz, B2 268.43 Hz, B3 237.09 Hz였다.

표 2. | Table 2. 후두의 위치에 따른 포먼트와 스펙트럼 에너지 측정치의 비교 | Comparison of formant frequencies and spectral energy measures according to the laryngeal positions
Laryngeal positions High Middle Low F-value p-value
F0 (Hz) 149.76±24.83 149.64±24.75 149.56±24.83 1.763 .177
F1 (Hz) 696.33±39.40 678.42±52.95 653.22±46.01 22.502 <.001***
F2 (Hz) 1,309.44±89.03 1,144.94±67.33 1,119.46±138.03 62.107 <.001***
F3 (Hz) 2,611.44±219.43 2,640.59±182.47 2,486.80±141.17 18.173 <.001***
H1 (dB) 12.94±2.98 15.02±2.57 16.53±2.17 154.701 <.001***
A1 (dB) 24.83±3.91 30.53±2.71 33.53±4.22 159.505 <.001***
A2 (dB) 19.17±4.94 22.72±4.37 25.18±6.33 530.711 <.001***
A3 (dB) 9.94±6.56 16.53±5.41 21.47±5.61 115.355 <.001***

Values are presented as mean±SD.

*** p<.001.

F0, fundamental frequency; F, formant frequency; H, amplitude of harmonic; A, amplitude of formant frequency.

Download Excel Table

사후분석 결과, H1, A1, A3는 고<중<저 순으로 모든 대응에서 차이가 유의하였다(p<.001). A2 또한 고<중(p<.001), 중<저(p=.001)로 저의 에너지가 가장 높았다. 반면 포먼트 주파수 중 F1의 경우 고>중(p=.011), 중>저(p=.002), 고>저(p<.001) 수준의 차이로 고 위치의 주파수가 가장 높았다. F2의 경우 중과 저 간 차이는 유의하지 않았으며(p=.285), 고의 F2만이 중, 저보다 높았다(p<.001). 고의 F3는 중과 차이가 없었던 반면(p=.781), 저의 F3는 고(p=.002)와 중(p<.001)에 비해 낮았다.

후두의 위치에 따라 음질과 관련된 음향학적 측정치를 비교한 결과는 표 3에 제시되어 있다. 후두의 위치에 따라 σCPP를 제외한 모든 변수에서 유의한 차이가 있었다(p<.05).

표 3. | Table 3. 후두의 위치에 따른 음질 관련 음향학적 측정치의 비교 | Comparison of acoustic measures related to voice quality according to the laryngeal positions
Laryngeal positions High Middle Low F-value p-value
Jitt (%) 0.47±0.27 0.37±0.25 0.35±0.19 3.275 .042*
Shim (%) 2.39±0.97 2.11±0.97 2.02±0.72 1.855 .002**
NHR 0.13±0.01 0.13±0.02 0.13±0.02 4.074 .020*
CPP (dB) 13.83±2.00 13.64±1.48 13.34±1.22 9.388 .001**
σCPP (dB) 0.53±0.22 0.50±0.11 0.49±0.11 1.736 .189
SR (dB) 37.49±6.43 40.46±4.50 41.48±4.33 19.649 <.001***
σSR (dB) 1.48±0.54 1.46±0.50 1.28±0.37 3.501 .034*
CSID –3.87±13.01 –6.35±9.17 –7.56±8.99 6.26 .006**

Values are presented as mean±SD.

* p<.05,

** p<.01.

*** p<.001.

Jitt, jitter%; Shim, shimmer%; NHR, noise-to-harmonic ratio; CPP, cepstral peak prominence; SR, L/H spectral ratio; σ, SD; CSID, Cepstral Spectral Index of Dysphonia.

Download Excel Table

사후분석 결과, Shim(p=.001)과 NHR(p=.021)은 고 위치의 측정치가 저 위치보다 높았고, CPP의 경우 고와 중 위치의 측정치가 저 위치에 비해 높았다(p=.004). SR의 경우 고 위치의 측정치가 중과 저 위치에 비해 낮았다(p<.001). Jitt와 σSR의 경우 사후분석에서는 후두 높이 간 유의한 차이가 있는 대비가 없었다(p>.05).

3.3. 후두의 상대적 높이와 음향학적 측정치 간 상관관계

3.2.절에서 유의한 차이를 보인 음향학적 측정치와 후두의 상대적 높이 간의 상관관계 히트맵(heatmap)을 그림 3에 제시하였다. 전반적으로 포먼트 주파수는 후두의 상대적 높이와 약함–중간 수준(r=.29–.56)의 정적 상관관계를, 스펙트럼 에너지는 중간 수준(r=–.47– –.68)의 부적 상관관계를 보였다. 음질 관련 변수 중에서는 SR이 약함 수준의 유의한 부적 상관관계를 보인 것으로 확인되었다(r=–.23).

pss-14-2-55-g3
그림 3. | Figure 3. 후두의 상대적 높이와 음향학적 측정치 간 상관관계 히트맵 | Correlation heatmap between the relative height of the larynx and acoustic measurements F, frequency; H, harmonic; A, amplitude; Shim, shimmer%; CPP, cepstral peak prominence; SR, L/H spectral ratio.
Download Original Figure
3.4. 음향학적 측정치를 이용한 후두의 상대적 높이 예측

분석 결과 전체 모형은 유의하였으며(adjusted R2=.829), A1 (unstandardized B coefficient=–.027, p=.007), F3(B=.002, p<.001), A3(B=–.057, p<.001), F2(B=.003, p<.001), H1(B=–.033, p=.018), SR(B=.028, p=.001), A2(B=.018, p=.033), F1(B=.002, p=.039)로 8개의 변수 모두 유의한 예측 변수로 모형에 포함되었다. 모든 예측변인에서 다중공선성은 문제시되지 않았다(variance inflation factor<10). 후두의 상대적 높이와 회귀 표준화 예측값의 산점도는 그림 4에 제시되어 있다.

pss-14-2-55-g4
그림 4. | Figure 4. 후두의 상대적 높이와 회귀 표준화 예측값의 산점도 | A scatterplot of the relative height of the larynx and predicted Z-scores
Download Original Figure
표 4. | Table 4. 후두의 상대적 높이를 예측하는 단계적 회귀모형의 요약 | Summary of stepwise regression model predicting the relative height of the larynx
Acoustic parameters R R 2 R2 change Adjusted R2 F change df Beta p-value t-value VIF
A1 .683 .466 .466 .462 129.081 1,148 –.169 .007** –2.725 3.352
F3 .773 .597 .132 .592 48.049 1,147 .469 <.001*** 12.313 1.262
A3 .847 .717 .119 .711 61.495 1,146 –.514 <.001*** –9.159 2.736
F2 .892 .796 .080 .791 56.635 1,145 .476 <.001*** 9.029 2.415
H1 .905 .819 .022 .812 17.640 1,144 –.119 .018* –2.393 2.158
SR .908 .825 .006 .818 5.262 1,143 .180 .001** 3.468 2.351
A2 .913 .833 .008 .824 6.571 1,142 .123 .033* 2.157 2.805
F1 .915 .838 .005 .829 4.345 1,141 .092 .039* 2.084 1.703

* p<.05,

** p<.01.

*** p<.001.

A, amplitude of formant frequency; F, formant frequency; H, amplitude of harmonic; SR, L/H spectral ratio, VIF, variance inflation factor.

Download Excel Table

상기 회귀모형의 회귀식을 표현하면 아래와 같다(그림 4).

R e l a t i v e h e i g h t o f t h e l a r y n x = 9.813 .027 × A 1 + .002 × F 3 .057 × A 3 + .003 × F 2 .033 × H 1 + .028 × S R + .018 × A 2 + .002 × F 1
(1)

휴식 시의 후두 융기의 높이를 기준으로 후두의 상대적 높이를 실제 측정한 값, 그리고 이에 대비하여 상기 회귀식을 이용하여 계산된 후두의 상대적 높이에 대한 예측값이 표 5에 제시되어 있다. 후두의 높이 조건에 따라 상대적 높이 예측값의 유의한 차이가 있었으며(F=441.359, p<.001), 사후분석 결과 고, 중, 저의 순으로 모든 대응 간 차이가 유의하였다(p<.001).

표 5. | Table 5. 고, 중, 저의 후두 위치 시 후두의 상대적 높이의 실제 측정값 및 예측값 | Measured and predicted value of the relative height of the larynx in high, middle, and low laryngeal positions
Laryngeal positions Measured value Predicted value
High (cm) 0.134±0.317 0.107±0.439
Middle (cm) –0.658±0.275 –0.808±0.267
Low (cm) –1.750±0.304 –1.573±0.217

Values are presented as mean±SD.

Download Excel Table

1차로 구축된 회귀모형을 이용하여 교차검증(cross-validation)을 수행하기 위하여 선행연구들을 참고하여 아래와 같은 절차를 시행하였다(Awan & Roy, 2006; Lee et al., 2020). 먼저 전체 샘플의 75%에 해당되는 샘플을 무선으로 추출하였다. 다음으로 이 샘플들에 대하여 위의 모형을 이용하여 다중회귀분석을 시행하였다. 이와 같은 무선 추출을 통한 회귀분석을 100회 반복 시행하였다. 위의 교차검증을 통해 비표준화 및 표준화 계수들의 평균과 표준편차를 계산하였으며, 이 결과는 표 6에 제시되어 있다. 그 결과, R=.918±.006, R2=.842±.011, adjusted R2=.830±.012로 본래의 모형이 가진 설명력과 거의 일치함을 확인하였다.

표 6. | Table 6. 무선 반복 교차검증을 통한 비표준화 계수, 표준오차, 표준화 계수, 베타가중치 변동 계수 | The unstandardized coefficients, standard errors, standardized coefficients, and beta weight coefficients of variation for each predictor as determined via randomized and repeated cross-validation
Parameter Unstandardized B Standard error Standardized coefficients Beta weight coefficient of variation (%)
Constant –9.807±0.638 1.232±.062 - -
A1 –0.028±0.007 .012±.001 –.171±.043 26.17
F3 0.002±0.000 .000±.000 .471±.026 25.44
A3 –0.057±0.005 .007±.001 –.520±.043 31.38
F2 0.003±0.000 .000±.000 .473±.031 8.31
H1 –0.032±0.008 .016±.001 –.116±.030 35.94
SR 0.027±0.006 .009±.001 .178±.038 6.63
A2 0.018±0.006 .010±.001 .127±.040 5.45
F1 0.002±0.001 .001±.000 .091±.033 21.06

Values are presented as mean±SD.

A, amplitude; F, frequency; H, harmonic; SR, L/H spectral ratio.

Download Excel Table

4. 논의 및 결론

본 연구에서는 발성 시 고, 중, 저의 후두 위치에 따른 음성을 음향학적 측정을 통해 분석하고, 휴식 시 대비 후두의 상대적인 높이와 음향학적 측정치 간의 상관관계를 알아보며, 이러한 상관관계를 토대로 후두 높이의 예측 가능성을 확인하고자 하였다. 본 예비연구의 결과 우선 후두의 높이에 따라 포먼트 주파수와 이들 포먼트에서의 스펙트럼 에너지, 그리고 일부 음질 관련 측정치가 달라지며, 이러한 상관관계를 토대로 비침습적인 방법으로 후두의 상대적 높이를 예측할 수 있는 가능성을 일부 확인하였다고 할 수 있다.

먼저 훈련된 뮤지컬 가창 전공 학생이 후두의 높이 조절을 수행함에 따라, 후두 융기를 기준으로 하였을 때 그 상대적인 높이를 의미 있게 조절하는 것이 실제로 가능함을 확인하였다. 이러한 객관적 분석은 평가자의 주관적 판단 혹은 침습적인 비디오투시검사의 결과에 근거하였던 선행 연구 결과(Nam et al., 2004; Nam et al., 2010)와 일맥상통하면서도, 근거를 보탠 의의가 있다고 할 수 있다. 다만 기준이 되는 휴식 시의 후두 높이는 연령 및 성별에 따라 다르며, 특히 남성은 10대에 급격하게 후두가 하강하고, 여성은 40대에 남자에 비해 많은 하강을 보이는 것으로 알려져 있으므로 이 또한 고려되어야 한다(Hong et al., 1998). 또한 이러한 조절 능력에 있어서 훈련 정도에 따라 개인적인 편차가 있을 수 있으며, 이러한 개인차는 역설적으로 정량적인 모니터링을 통한 객관적이고 체계적인 훈련 프로그램의 필요성을 지지하는 것이라 볼 수 있다.

한 선행 예비연구에서는 후두에 2개의 컨덴서 마이크를 부착하고, 각 마이크에서 수음한 음성신호의 차이와 알고리즘을 토대로 후두의 수직 위치를 피드백해주는, 이른바 후두 고도계(laryngoaltimeter)가 제안된 바 있다(Pehlivan & İlter Denizoğlu, 2009). 이 선행연구는 후두 하강을 피드백하는 일의 중요성에 대한 인식은 본 연구와 함께 하였으나, 해당 연구 또한 일종의 예비연구로서 다음과 같은 한계가 있었다. 첫째, 후두의 높이를 정량적으로 제시해주는 것이 아니라, 램프의 점등을 통해 후두의 상승 여부에 대한 피드백만이 가능한 수준이었다. 둘째, 두 마이크의 신호를 토대로 후두의 상승을 인식하여 알려주는 알고리즘을 구체적으로 제시하지 못하였다. 셋째, 스마트폰 등 이미 상용화된 기기들을 이용한 손쉬운 활용 가능성을 제시하지 못하였다. 이에 비해 본 연구에서는 두 개의 마이크를 후두에 부착하는 등의 별도의 조치 없이, 일반적으로 획득할 수 있는 음성 신호의 음향학적 분석을 통해 얻은 측정치만을 이용하여 기준 위치에 비해 후두가 얼마나 상승 혹은 하강하였는지에 대한 구체적인 예측 회귀식을 제시하였다는 데서 연구의 의의를 일부 찾을 수 있다.

포먼트 주파수들은 대개 후두의 높이가 낮아짐에 따라 감소하는 양상을 보였다. 이는 기능적 부전실성증(functional dysphonia) 환자에서 후두주변부 근육에 대한 후두마사지(manual circumlaryngeal therapy)를 시행하여 후두 높이를 낮춘 결과 F1, F2, F3가 모두 유의하게 감소하였다는 Roy & Ferguson(2001)의 연구결과와도 맥을 같이 한다. F1과 F2가 각각 인두와 구강 전반부의 공간과 관련이 있고, 후두의 높이를 낮출 때 전반적인 성도의 길이가 증가할 수 있다는 점을 상기할 때 일견 납득할 만하다. 다만 Roy & Ferguson이 지적하였듯, 이러한 포먼트 주파수의 감소는 단순히 후두 높이에만 영향을 받는 것이 아니라, 발성 시의 조음 운동과 이로 인한 성도의 변화와 상호작용을 한 결과물로 나타나는 것이므로 해석에 주의가 필요하다. 즉 후두 하강 시 상대적인 하악/혀의 높이 변화, 혀의 전후 위치의 변화, 그리고 입술, 구개가 위치한 구강 전반부, 인두와 후두의 내강(lumen)의 변화가 상호작용한 결과물로서 이러한 유의한 변화가 달성된 것이라는 점이다. 예컨대 /아/ 모음은 저모음이므로 턱과 혀가 하강하면서 F1이 증가하는 경향을 보이겠으나, 후두가 하강할 때 성도의 길이는 길어지고, 여기에 입술을 다소 원순화하여 발성했다면 이러한 효과들이 상쇄되어 결과적으로 감소된 F1이 나타났을 수 있다. 따라서 본 연구의 결과를 성급하게 일반화하기보다는 연구 설계를 보완하여 후속 연구를 통해 검증할 필요가 있다고 본다.

F3의 경우 원순성과 입술 퍼짐에 따른 구강 구조 및 성도의 길이 변화에 영향을 받는 것으로 알려져 있는데(Heo & Kang, 2017), 본 연구 결과에서는 후두를 가장 낮추었을 때에만 유의미하게 감소하였다. 이는 후두의 위치가 평상시보다 일정 정도 이상 낮아질 때에야 비로소 성도의 길이가 유의미하게 증가한다는 것을 의미할 수 있다. 또한 후두가 낮아질 때 하악이 함께 하강함에 따라 구강 입구가 자연스럽게 커지면서, 보상적으로 입술을 원순화시켜 이를 보상하고자 하면서 앞쪽 성도의 길이가 함께 증가하였을 가능성 또한 배제할 수 없는 것으로 보인다.

각 포먼트에서의 스펙트럼 에너지의 변화를 살펴보면, H1, A1, A3가 모두 후두가 하강함에 따라 유의하게 증가하였으며, 이는 상관관계 분석에서도 확인되었다. 이 중에서 특히 A3를 주목할 만한데, 이는 A3가 형성된 F3의 값이 대략 2,400–2,700 Hz로서, 이른바 가수 음형대(singer’s formant)가 형성되는 주파수대이기 때문이다. 가수 음형대는 주로 전통적인 성악 발성을 하는 가수에서 일어나는 공명작용으로 음향기기의 도움을 받지 않고도 음성이 전달되는 기전으로 알려져 있으며, 공명강의 모양에 따라 소리의 증폭과 음색의 형성이 좌우되는 관악기로서의 음성의 성격을 잘 반영하는 현상이라 할 수 있다(Kim, 2011). 이러한 가수 음형대가 형성되는 과정에서 진성대의 상부의 2.5–3 cm 정도 길이의 좁은 관, 즉 전후두관(epilaryngeal tube)의 단면적이 전체 공명강 단면적보다 일정 정도 이상으로 작아져야 한다(Sundberg, 1972). 이를 위해서는 성도의 길이가 상당부분 길어져야 하는데, 후두의 하강이 위의 기전을 작동시키는 데 결정적인 역할을 한다는 것이다(Nam et al., 2010). 이러한 소리의 증폭은 단순히 음량의 차이가 아니라 노래가 명료하게 전달되는 것과 관련되어 있으므로(Jin, 2017), 장르와 무관하게 이익을 볼 수 있는 부분이 있다고 추론할 수 있다.

후두를 하강시키는 기술을 구체적으로 습득하는 일은 특히 뮤지컬 가창을 배우는 학생에서 중요할 수 있다. 성악가와 실용음악 가수의 발성을 비교한 국내 선행연구에서도 특히 남성 성악가의 경우 스펙트럼의 2,200–3,200 Hz의 구간에서 강화된 제3음형대가 형성된 반면, 실용음악 가수는 성별과 무관하게 가수 음형대가 형성되지 않았다고 보고하였다(Nam et al., 2010). 또한 저음에서 점차 고음으로 진행할 때 남성 성악가는 후두 위치가 고정되는 반면 대부분의 실용음악 가수는 후두 위치가 상승하여, 실용음악 가수가 후두를 상대적으로 낮게 위치시키는 데 어려움이 있는 것으로 나타났다. 이러한 결과로 미루어볼 때, 다음과 같은 연구의 의의를 찾을 수 있다. 먼저 크게 보아 벨팅과 같이 비클래식 발성을 하는 뮤지컬 전공 남학생들이 후두를 낮게 유지하는 것이 어려울 수 있으나, 본 연구의 대상자들과 같이 훈련을 통해 후두의 위치를 낮게 조절하는 것이 가능하며, 이것이 후두의 육안 관찰로 확인된 점이다. 둘째는 후두의 위치를 낮게 조절함으로 인해 가수 음형대에 해당되는 스펙트럼 구간에 풍부한 에너지를 형성할 수 있다는 것을 실증적으로 확인하였다는 점이다.

음질과 관련된 음향학적 측정치들을 살펴보면 SR을 제외하고는 후두의 상대적 높이와 큰 상관관계는 없는 것으로 나타났다. 오히려 기식음과 부적 상관관계를 보이는 것으로 알려진 CPP의 경우 후두의 높이가 낮아질수록 오히려 감소하는 모습을 보였다. 그러나 이러한 결과가 후두가 낮아지면 기식성을 증가시키는 문제가 있다는 결론으로 이어진다면 다소 성급한 일이 될 것이다. 그 이유는 첫째, 낮은 위치에서의 CPP가 13.34±1.22 dB로 나타났는데, 한국인 정상 성인 남성 자료가 14.614±1.557 dB이며(Lee et al., 2018b), CSL과 스마트폰 녹음 샘플의 병리적 음성 집단 절단점이 각각 11.647 dB과 10.394 dB인 점(Lee et al., 2018a)을 고려하였을 때 결코 유의미하게 낮은 편은 아니기 때문이다. 둘째, 전반적 중증도(0–100, 0이 정상)를 예측하는 것으로 알려진 CSID 또한 –7.56±8.99의 측정치로 지극히 정상 수준의 음성을 시사하였기 때문이다. 즉, 후두를 낮춘다고 해서 병리적으로 기식성이 증가하는 것은 아니라 할 수 있다. 이는 본 연구의 대상자가 모두 정상 음성을 가진 자였기 때문에 나타난 효과로도 볼 수 있다. 다만 차후 음성 오남용으로 인해 목소리의 문제를 보이거나, 장르의 특성상 다소 기식성을 동반하는 가창 스타일을 가진 가수나 음성장애 환자의 경우, 이와 같은 음질 관련 변수들의 활용도가 오히려 더욱 높아질 가능성을 완전히 배제할 수는 없으므로 이에 대한 후속 연구가 필요하다고 본다.

후두의 상대적 높이를 예측하는 회귀모형은 후두의 상대적 높이와 유의한 상관관계를 보인 8개의 변수를 모두 포함하였으며, 후두의 상대적 높이 측정값의 분포의 82.9%를 예측하는 비교적 우수한 성능을 보였다. 포먼트와 스펙트럼 에너지 변수들이 골고루 모형에 포함되었으며, 음질 관련 변수들 중에서는 SR이 유일하게 포함되었다. 사실 SR은 ADSV 프로그램을 통해 측정 가능하며 CSID의 예측변인으로도 포함되어 그간 많은 켑스트럼 분석 연구에서 함께 보고되어 왔지만(Awan et al., 2016; Lee et al., 2021b), 정작 한국인을 대상으로 한 연구에서 병리적 음성에 대한 스크리닝 도구로서의 유용성을 나타낸다고 할 수 있는 ROC 곡선 분석의 곡선 아래 면적(area under the curve)이 CPP(CSL, .828; 스마트폰, .815)에 비교하였을 때 SR이 다소 낮은 편(CSL, .699; 스마트폰, .693)인 것으로 보고되어 왔다(Lee et al., 2018a). 그러나 4 kHz를 기준으로 스펙트럼 에너지의 비율(ratio)을 나타내는 특성상 후두의 높이에 따른 음향학적 변화를 반영하는 지표 가운데 하나로 활용될 가능성이 본 연구를 통해 일부 확인되었으므로, 추후 여성을 포함하고 다양한 음도에서 이루어지는 발성에 대하여 후속 연구를 진행하여 활용도를 높일 수 있을 것이라 여겨진다.

본 연구는 예비연구의 특성상 여러 한계를 가지고 있다. 먼저 후두의 위치를 능숙하게 조절할 수 있는 뮤지컬 가창 학생으로 한정하였기 때문에 대상자 수가 5명으로 매우 적었으며, 후두 융기의 정확한 위치를 신뢰성 있게 확인하기 위하여 남성 대상자로 한정한 한계가 매우 명확하다. 여성의 경우 후두 융기의 정점을 확인하는 일이 어려운 경우가 많으므로 본 연구의 모형을 그대로 적용하기는 어려울 가능성이 클 것이다. 또한 가창 시 다양한 음역대로 음도를 조절하다 보면 포먼트 주파수 또한 당연히 이에 영향을 받으며, 후두의 높이 조절 양상에 가창 훈련 여부, 음도, 성구 등의 요인이 영향을 줄 수 있으므로(Traser et al., 2014), 위의 회귀모형을 다양한 조건에서 적용하는 후속 연구가 필요하다. 더욱이 모음에 따라 비강 공명 등 공명의 특성이 영향을 받을 뿐만 아니라, 본 연구와는 달리 상황에 따라 마스크 착용 등이 필수적인 상황에서는 청지각적인 발성 및 공명 특성이 영향을 받을 수 있으므로, 연구 결과 적용에 신중해야 한다(Lee, 2021). 그리고 다양한 모음에 따른 변화와 후두의 3차원적인 운동의 영향을 모두 살펴보지는 못하였다. 또한 후속 연구에서는 발성 시 상체와 얼굴이 보다 안정적으로 유지되어 측정의 정확도를 보장할 수 있는 방법이 강구되어야 할 것이다. 마지막으로 개인에 따른 차이를 고려하면 훨씬 더 많은 대상자가 참여하는 연구가 필요할 것이다.

본 연구의 결과를 이용하여 다음과 같은 응용 연구들이 가능할 것으로 여겨진다. 먼저 본 연구의 대상자를 정상 음성 대상자로 한정한 것은 모형의 구축을 위한 것이기는 하나 실제 전문적으로 가창을 배우는 학생에서 많은 경우 음성질환이 동반되어 있거나, 부적절한 음성위생 습관으로 음성질환의 고위험군이라는 측면을 고려하면, 이러한 대상자를 포함한 후속 연구가 절실히 요구된다. 또한 음성장애 임상현장에서 후두외근, 특히 설골 상부 근육의 과도한 긴장으로 후두가 전반적으로 상승되어 있는 환자를 대상으로 과연 그러한 특성이 정확하게 예측되는지, 또 나아가 언어재활사의 행동적 중재 이후 이러한 치료 효과가 정확하게 반영되는지에 대한 반응도 연구 또한 가능할 것으로 본다. 마지막으로 이러한 연구를 통해 궁극적으로는 비침습적, 객관적, 그리고 실시간으로 대상자의 후두 높이를 시각적으로 모니터링함으로써 가창 훈련 및 음성치료에 활용할 수 있는 플랫폼을 개발하는 후속 연구 또한 가능할 것으로 판단된다.

Notes

* 이 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No. 2021R1G1A1094247).

* This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government (MSIT) (No. 2021R1G1A1094247).

References/참고문헌

1.

Awan, S. N., & Roy, N. (2006). Toward the development of an objective index of dysphonia severity: A four factor acoustic model. Clinical Linguistics & Phonetics, 20(1), 35-49.

2.

Awan, S. N., Roy, N., Zhang, D., & Cohen, S. M. (2016). Validation of the cepstral spectral index of dysphonia (CSID) as a screening tool for voice disorders: Development of clinical cutoff scores. Journal of Voice, 30(2), 130-144.

3.

Deer, J., & Dal Vera, R. (2008). Acting in musical theatre: A comprehensive course. Abingdon, UK: Routledge.

4.

D’haeseleer, E., Claeys, S., Meerschman, I., Betens, K., Degeest, S., Dijkmans, C., De Smet, J., Luyten, A., & Van Lierde, K. Vocal characteristics and laryngoscopic findings in future musical theater performers. Journal of Voice, 31(4), 462-469.

5.

Heo, S., & Kang, H. (2017). Formant frequency changes of female voice /a/, /i/, /u/ in real ear. Phonetics and Speech Sciences, 9(1), 49-53.

6.

Hong, K. H., Kim, H. K., Jeong, K. S., Yoon, H. W., & Kim, S. (1998). A study for the changes of laryngeal position and vocal pitch with aging process. Journal of the Korean Society of Logopedics and Phoniatrics, 9(1), 79-85.

7.

Jin, S. M. (2017). Anatomy and physiology in vocal technique. Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics, 28(1), 5-10.

8.

Kayes, G., & Welch, G. F. (2017). Can genre be “heard” in scale as well as song tasks? An exploratory study of female singing in Western lyric and musical theater styles. Journal of Voice, 31(3), 388.e1-388.e12.

9.

Kim, H. S. (2011). Divine instrument: Voice. Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics, 22(2), 103-105.

10.

Klimek, M. M., Obert, K., & Steinhauer, K. (2005). Estill voice training level two workbook: Figure combinations for six voice qualities. Pittsburgh, PA: Estill Voice International.

11.

Lee, E. H., & Kim, Y. J. (2020). Application and practice of Estill Vocal Training (EVT) through theatrical and musical analysis of musical songs. Journal of the Korea Entertainment Industry Association, 14(8), 91-102.

12.

Lee, J. H., Kim, G. W., & Kim, S. T. (2021a). Laryngeal height and voice characteristics in children with autism spectrum disorders. Phonetics and Speech Sciences, 13(2), 91-101.

13.

Lee, S. J. (2021a). Discussions on auditory-perceptual evaluation performed in patients with voice disorders. Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics, 32(3), 109-117.

14.

Lee, S. J., Choi, H. S., & Kim, H. (2021b). Acoustic Psychometric Severity Index of Dysphonia (APSID): Development and clinical application. Journal of Voice, 35(4), 660.e19-660.e25.

15.

Lee, S. J., Lee, K. Y., & Choi, H. S. (2018a). Clinical usefulness of voice recordings using a smartphone as a screening tool for voice disorders. Communication Sciences & Disorders, 23(4), 1065- 1077.

16.

Lee, S. J., Pyo, H. Y., & Choi, H. S. (2018b). Normative data of cepstral and spectral measures in Korean adults using vowel phonation and passage reading tasks. Communication Sciences & Disorders, 23(1), 208-217.

17.

Lee, Y. E. (2021b). A study on the vocalization and utilization method for musical singing: Focusing on SLS and EVT vocalization (Master’s thesis). Chung-Ang University, Korea.

18.

Lee, Y. W., Park, H. J., Bae, I., & Kim, G. H. (2020). The usefulness of multi voice evaluation: Development of a model for predicting a degree of dysphonia. Journal of Voice.

19.

Lloyd, A. T., Gerhard, J., Baker, P., Lundy, D. S., Diaz, J., Bretl, M. M., Landera, M. A., ... Rosow, D. E. (2020). Prevalence of vocal fold pathologies among first-year singing students across genres. Laryngoscope, 130(8), 1996-2002.

20.

Nam, D. H., Choi, S. H., Choi, J. N., Chun, S. P., & Choi, H. S. (2004). Analysis of singer’s formant & close quotient during change of the larynx position. Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics, 15(2), 98-111.

21.

Nam, D. H., Kim, W. S., Yoo, H. G., & Choi, H. S. (2010). Comparison between operatic singing and applied music singing. Phonetics and Speech Sciences, 2(4), 11-18.

22.

Neuschaefer-Rube, C., Wein, B., Angerstein, W., & Klajman, S. (1996). Kernspintomographische untersuchung der kehlkopfstellungen beim singen von vokalen. Folia Phoniatrica et Logopaedica, 48(4), 201-209.

23.

Park, I. (2012). Modern musical vocalization. Seoul, Korea: Theatre & Man Press.

24.

Pehlivan, M., & İlter Denizoğlu, I. (2009). Laryngoaltimeter: A new ambulatory device for laryngeal height control, preliminary results. Journal of Voice, 23(5), 529-538.

25.

Roy, N., & Ferguson, N. A. (2001). Formant frequency changes following manual circumlaryngeal therapy for functional dysphonia: Evidence of laryngeal lowering? Journal of Medical Speech Language Pathology, 9(3), 169-176.

26.

Shue, Y. L., Keating, P., Vicenik, C., & Yu, K. (2011, August). VoiceSauce: A program for voice analysis. Proceedings of the 17th International Congress of Phonetic Sciences (pp. 1846- 1849).Hong Kong.

27.

Sundberg, J. (1972). A perceptual function of the ‘singing formant’. Speech Transmission Laboratory Quarterly Progress and Status Report, 13(2-3), 61-63.

28.

Titze, I. R. (1993). Raised versus lowered larynx singing. National Association of Teachers of Singing Journal, 50, 37.

29.

Traser, L., Burdumy, M., Richter, B., Vicari, M., & Echternach, M. (2014). Weight-bearing MR imaging as an option in the study of gravitational effects on the vocal tract of untrained subjects in singing phonation. PLOS ONE, 9(11), e112405.

30.

Yoo, J. Y. (2017). The SLP’s perspectives for the vocal elites and singing voice. Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics, 28(1), 11-13.

31.

Yu, M., Choi, S. H., Choi, C. H., & Lee, K. (2017). Usefulness of cepstral acoustic index for estimating objective dysphonia severity. Communication Sciences & Disorders, 22(3), 587-596.

32.

김한수(2011). 신이 주신 악기: 목소리. 대한음성언어의학회지, 22(2), 103-105.

33.

남도현, 김화숙, 유현지, 최홍식(2010). 성악발성과 실용음악발성의 비교연구. 말소리와 음성과학, 2(4), 11-18.

34.

남도현, 최성희, 최재남, 전석필, 최홍식(2004). 후두위치의 변화에 따른 singer’s formant와 성대접촉률의 변화 연구. 대한음성언어의학회지, 15(2), 98-111.

35.

박일규(2012). 현대 뮤지컬 발성법. 서울: 연극과 인간.

36.

유미옥, 최성희, 최철희, 이경재(2017). 객관적인 음성장애 중증도 측정을 위한 캡스터럼 음향 지표의 유용성. 언어청각장애연구, 22(3), 587-596.

37.

유재연(2017). 가수 음성에 대한 언어재활사의 관점. 대한후두음성언어의학회지, 28(1), 11-13.

38.

이승진(2021a). 음성장애 환자에서 시행되는 청지각적 평가에 대한 논의. 대한후두음성언어의학회지, 32(3), 109-117.

39.

이승진, 이광용, 최홍식(2018a). 음성장애 선별검사 도구로서 스마트폰을 이용한 음성 녹음의 임상적 유용성. 언어청각장애연구, 23(4), 1065-1077.

40.

이승진, 표화영, 최홍식(2018b). 모음 발성 및 문단 읽기 과제 시 한국 성인의 켑스트럼 및 스펙트럼 측정치 정상 규준 연구. 언어청각장애연구, 23(1), 208-217.

41.

이영은(2021b). 뮤지컬 가창을 위한 발성법과 활용 방법 연구: SLS 발성법과 EVT 발성법을 중심으로. 중앙대학교 석사학위논문.

42.

이은혜, 김유정(2020). 뮤지컬 노래의 극과 음악 분석을 통한 조 에스틸 보컬 기법(EVT)의 적용과 실제. 한국엔터테인먼트산업학회논문지, 14(8), 91-102.

43.

이정헌, 김고운, 김성태(2021a). 자폐스펙트럼장애 아동의 후두 높이 및 음성 특성. 말소리와 음성과학, 13(2), 91-101.

44.

진성민(2017). 후두의 해부생리 및 발성원리. 대한후두음성언어의학회지, 28(1), 5-10.

45.

허승덕, 강희라(2017). 실이에서 여자 음성 /ㅏ/, /ㅣ/, /ㅜ/의 포먼트 주파수 변화. 말소리와 음성과학, 9(1), 49-53.

46.

홍기환, 김현기, 정경수, 윤희완, 김성완(1998). 연령에 따른 정상인의 후두 위치 및 발화 기저주파수의 변화에 대한 연구. 대한음성언어의학회지, 9(1), 79-85.