1. 서론
‘아’, ‘어’, ‘음’은 상대의 말을 듣고 공감을 했거나, 이해를 했거나, 잘 모르겠다는 반응을 할 때 사용하는 표현이다. 품사로 보면 감탄사에 해당하나, 형태론 혹은 품사론에서는 별로 관심을 두지 않는 대상이다. 그러나 화자와 청자 사이의 의사소통이 이루어지는 과정 혹은 그 원리를 밝히고자 하는 화용론이나, 언어 자료의 연구 대상을 ‘문어’가 아닌 ‘구어’에 관심을 두는 구어 연구자들에게는 관심을 많이 받는 언어 표현이다. 화용론이나, 구어 연구자들은 이를 ‘담화 표지’ 혹은 ‘간투사’라고 부른다. 이 연구에서는 화자의 말에 대한 이해, 공감, 의문 등의 포괄적 의미를 지닌 담화 표지 ‘아’, ‘어’, ‘음’이 성별과 연령별로 어떠한 차이를 보이는지를 밝히는 것을 목적으로 한다. 구체적으로 성별과 연령별 사용 빈도, 발화 내 출현 위치, 음성학적 길이 등에 대해서 그 차이를 밝히고자 한다.
지금까지 ‘아, 어, 음’에 대해서는 문장에서 독립적으로 쓰인다는 점에 주목하여 감탄사로서의 문장 내 기능을 밝히거나(Kim, 2005; 2006), 구어에서의 다양한 쓰임에 주목하여 의미적 다양성을 밝히거나(Shin, 2001), 담화 내 의사소통 기능에 주목하여 의사소통 기능을 밝히고자 하는 연구(Ahn, 2012; Kang, 2002) 등이 진행되어 왔다.
‘감탄사’로서의 뜻을 기술하고자 했던 대표적인 연구인 Kim(2005, 2006), Kang(2002)를 보면 의미를 매우 포괄적으로 기술했거나 특정하지 않았다는 것을 알 수 있다. Kim(2005, 2006)에는 ‘아’, ‘어’에 대하여 “놀람, 당황, 초조, 다급함 또는 기쁨, 슬픔, 뉘우침, 칭찬할 때 가볍게 내는 소리”라는 기술이 있고, Kang(2002)에는 ‘아’, ‘어’는 “뒷발화와 결합하여 사용될 때, 이들 단독으로 명제적 의미를 가지지 않는다”는 점을 강조하고 있다. Kim(2005, 2006)과 Kang(2002)의 서술이 표면적으로 다른 것 같아도, 결국 같은 뜻이다. ‘감탄’의 의미를 포괄적으로 서술한 것이나, 단독으로 명제적 의미를 가지지 않는다고 기술한 것은 모두 그 의미를 특정하기 어렵다는 뜻으로 해석할 수 있기 때문이다.
한편 ‘아’, ‘어’, ‘음’의 담화적 기능에 관심을 둔 학자들은 그 기능의 공통점과 차이점을 주목하였다. 예컨대 Ahn(2012)에서 ‘아’, ‘어’, ‘음’은 경청, 화제 전환, 말차례 유지의 공통적인 기능이 있다.”와 같은 공통점을, Shin(2001)에서 ‘아’는 감정적 감탄사, ‘음’은 의지적 감탄사로 차이점을 들어 설명했다. 그러나 대부분은 관찰한 것을 토대로 기술하는 ‘관찰적 기술’에 그쳤다는 아쉬움이 있다.
이처럼 ‘아’, ‘어’, ‘음’의 의미와 기능이 매우 포괄적이어서 단어 자체의 개념적 의미를 정의하거나, 용법적 의미를 특정하기가 어렵다. 비슷한 의미를 지닌 ‘네/예’, ‘응’과도 비교해 보면 그 의미를 특정하는 것이 얼마나 어려운지 알 수 있다.
(1)의 예에서 볼 수 있듯이 ‘아, 어, 음’은 뒤에는 ‘있었어요’와 ‘없었어요’가 모두 올 수 있다. 또한 ‘아, 어, 음’을 교체해서 써도 무방하다. 그런데 ‘네/예’ 혹은 ‘응’과 같이 명확히 ‘긍정’의 어휘적 의미를 가지는 단어 뒤에는 ‘있었어요’의 쓰임이 어색하다. 이를 통해서 보건대, ‘아’, ‘어’, ‘음’은 ‘네/예’나 ‘응’에 비해서도 ‘어휘적 의미’가 훨씬 덜한 표현이라 할 수 있다.
이러한 점에서 이 연구에서는 ‘아’, ‘어’, ‘음’을 특정한 의미를 지닌 ‘감탄사’로 접근하기보다 ‘담화’의 차원에서 청자가 ‘반응’을 보일 때 쓰는 ‘담화 표지’로 전제하고, 이 담화 표지가 의사소통 과정에서 ‘성과 연령’에 따라 다르게 실현되는 양상을 밝히고자 한다. 다시 말하자면, 이 연구에서는 담화 표지 자체의 의미나 기능에 관심을 두는 것이 아니라, ‘성과 연령’이라는 외적인 요인에 따라 담화 표지의 실현 양상이 어떻게 달라지는가에 관심을 두고자 한다.
2. 연구 자료 및 데이터 처리 방법
연구 자료는 2015년에 공개된 서울코퍼스(Yun et al., 2015: 104)를 이용하였다. 분석 대상 코퍼스인 서울 코퍼스의 특징은 다음과 같다. 첫째, 10대부터 40대까지 남녀 각각 5명씩 총 40명의 피험자가 진행자의 질문에 응답하는 형식으로 이루어져 있기 때문에 ‘성과 연령’이라는 담화 외적인 요인이 담화에 미치는 영향을 분석하기에 용이하다. 둘째, 진행자의 질문 발화는 제시되어 있지 않고, 피험자의 발화만 발화, 어절, 음소 단위로 구분되어 레이블이 되어 있기 때문에 담화 내에서 청자(피험자)의 반응만을 분석하는데 용이한 구조로 되어 있다. 셋째, 진행자의 질문이 (2)와 같이 유형화된 형태로 일관성을 갖추고 있기 때문에 피험자의 응답을 비교 분석하는데 적합하다.
-
(2) 서울코퍼스의 인터뷰 예시 중 일부(Yun et al., 2015:104)
‘아, 어, 음’의 사용 빈도, 발화 내 출현 위치, 음길이에 대한 정보는 Praat(ver.6.1.31)에서 사용되는 그림 1과 같은 TextGred 형식의 파일을 shell 명령어를 사용하여 그림 2와 같은 텍스트 파일로 전환하여 추출하였다.
이때, 중복 추출되지 않도록 한글 철자 전사의 발화 층위(7개의 층위 중에서 제7열)만을 추출의 대상으로 삼았다. ‘아, 어, 음’의 정보를 추출한 후에는 분석 대상을 맞게 추출했는지 전후 문장과 음성 파일을 모두 확인하였다. 검색에는 코퍼스 분석 도구인 Emeditor(ver.17.6.1)를 사용하였고 통계 분석에는 R(ver.3. 4.4)을 사용하였다.
발화 내 출현 위치를 추출할 때에는 조각문이 많은 구어의 특성을 고려하여 하나의 완결된 문장으로 끝나지 않았더라도 끊김이 존재하면 하나의 발화가 끝난 것으로 간주하여 처리하였다. 서울코퍼스는 발화의 끊김을 IVER(간격), NOISE(소음), SIL(휴지 혹은 묵음), VOCNOISE(유성 소음) 등의 태그로 구분하고 있다.
‘아, 어, 음’의 음길이는 그림 2에서 보듯이 ‘아, 어, 음’ 각각의 위치 정보인 ‘XMAX’(최대 시간)에서 ‘XMIN’(최소 시간)을 빼는 방식으로 계산하였다. 이때, <LAUGH-아>와 같이 웃음과 중복되어 표기되어 있거나 ‘아아, 어어, 음음’과 같이 중복으로 발화되어서 한 음절의 길이를 정확하게 측정하기 어려운 경우는 모두 분석 대상에서 제외하였다.
이러한 과정을 거쳐 최종 정리된 데이터 파일은 아래의 표 1과 같다.
3. 연구 결과
담화 표지의 전체 출현 빈도는 ‘아(a)’가 1,553회, ‘어(eo)’가 1,516회, ‘음(eum)’이 1,027회였다. ‘아’, ‘어’, ‘음’의 빈도 및 음길이 정보는 표 2와 같다.
발화 내 출현 위치 빈도는 담화 표지만 단독으로 출현한 단독 위치(이하 ‘단독 위치’)가 1,480회, 발화 시작 위치(이하 ‘시작 위치’)가 2,107회, 발화 중간 위치(이하 ‘중간 위치’)가 341회, 발화 종결 위치(이하 ‘종결 위치’)가 168회로, ‘시작 위치>단독 위치>중간 위치>종결 위치’의 순으로 나타났다. ‘아’와 ‘어’는 발화 시작 위치에서 고빈도로 발화된 반면 ‘음’은 단독으로 발화된 경우가 가장 많았다.
평균 음길이는 각각 ‘아’가 238 ms, ‘어’가 348 ms, ‘음’이 453 ms로, ‘음>어>아’ 순으로 나타났다. 발화 내 출현 위치에 따른 음길이는 단독 위치가 475 ms, 시작 위치가 259 ms, 중간 위치가 204 ms, 종결 위치가 257 ms로, ‘단독 위치>시작 위치>종결 위치>중간 위치’ 순으로, 평균적으로 단독 위치에서 가장 긴 음길이를 보였다. 관측값 중 가장 긴 음길이를 보인 것은 ‘음’으로 1,926 ms이었고, 가장 짧은 길이는 ‘어’로 19 ms이었다.
표 3은 성별에 따라 나타난 ‘아’, ‘어’, ‘음’의 출현 빈도 및 음길이와 관련한 정보이다.
성별에 따른 세 담화 표지의 전체 출현 빈도는 남성이 2,065회, 여성이 2,031회로 큰 차이를 보이지는 않았으며, 출현 위치에 따라서도 이 세 담화 표지의 출현 빈도 합이 ‘시작 위치>단독 위치>중간 위치>종결 위치’의 순서로 남녀 모두가 같았다. 그러나 ‘아’, ‘어’, ‘음’ 각 담화 표지별 출현 위치에 따른 빈도와 음길이에서는 특징적인 차이가 몇 가지 관찰되었다.
우선 표 3의 ‘빈도’의 ‘합’ 행에서 보듯이, ‘아’, ‘어’, ‘음’ 담화 표지별 출현 빈도에서 남녀의 차이를 찾을 수 있다. 남성은 세 담화 표지 중 ‘아(40.1%)>어(37.7%)>음(22.2%)’ 순의 출현 빈도를 보였으며 그 차이도 여성에 비해서는 비교적 뚜렷하였으나, 여성은 ‘어(35.6%)>아(36.3%)>음(28.0%)’ 순의 출현 빈도를 보였고, 세 담화 표지의 사용 빈도의 차이가 남성보다는 상대적으로 적었다.
두 번째는 담화 표지별로 출현 위치에 따른 사용 빈도의 차이를 볼 수 있다. 그림 3에서 보는 바와 같이 성별에 따라 단독 위치에서의 담화 표지별 사용 빈도의 차이가 두드러졌다. 시작 위치, 중간 위치, 종결 위치에서는 남녀 모두 ‘아>어>음’의 같은 출현 빈도 순서를 보였으나, 단독 위치에서는 남성의 경우 ‘어>음>아’, 여성의 경우 ‘음>어>아’의 순서를 보였다. 남녀 모두 단독 위치에서 ‘아’의 출현 빈도가 낮았던 것은 동일하나, ‘어’와 ‘음’의 경우 남성에서는 거의 차이가 없었던 데 비해, 여성에게서는 ‘음’의 출현 빈도가 높았다.
끝으로 성별에 따른 종결 위치에서의 음길이 차이를 볼 수 있다. 성별에 따른 담화 표지의 평균 음길이는 여성이 348 ms, 남성이 317 ms로 여성의 음길이가 더 길었다. 그러나 종결 위치에서 음길이는 남녀의 차이가 122 ms로 매우 컸다(남: 197 ms, 여: 319 ms). 단독 위치, 시작 위치, 중간 위치의 차이는 각각 1 ms, 2 ms, 21 ms인 것에 비하면 종결 위치에서의 차이가 매우 크다는 것을 확인할 수 있다.
이러한 종결 위치의 음길이 차이를 더욱 구체적으로 살펴보면 그림 4에서 보는 바와 같이 종결 위치에서 ‘음’의 음길이 차이에 의한 것이었음을 확인할 수 있다. 음길이를 종결 위치로만 국한해서 보면, ‘아’는 남성 170 ms, 여성 257 ms, ‘어’는 남성 214 ms, 여성 291 ms, ‘음’은 남성 238 ms, 여성 478 ms로 각각의 차이가 ‘아’가 87 ms, ‘어’가 77 ms, ‘음’이 240 ms로 ‘음’이 ‘아’나 ‘어’에 비해 여성에게서 더 길게 나타났음을 알 수 있다. 종결 위치에서 담화 표지 음길이 차이는 ‘음’에서 기인하는 차이가 주요한 영향을 미쳤다고 할 수 있다.
요컨대, 성별에 따른 두드러진 차이는 ‘음’이라고 할 수 있다. 성별에 따라 ‘음’은 단독 위치에서 출현 빈도의 차이를 보이며, 종결 위치에서 음길이의 차이를 보인다고 요약할 수 있다. 단독 위치에서 여성의 ‘음’의 사용 빈도가 상대적으로 높고, 종결 위치에서 여성의 ‘음’의 음길이가 상대적으로 길다.
표 4는 각 연령별로 담화 표지 ‘아’, ‘어’, ‘음’의 출현 빈도와 음길이 정보를 나타낸 것이다. 표 4에서 보듯이, 연령별 담화 표지 전체 출현 빈도는 10대 1,011회, 20대 859회, 30대 1,111회, 40대 1,115회로, ‘40대>30대>10대>20대’ 순서를 보였다. 다른 연령대에 비해 20대에서 전반적으로 출현 빈도가 낮았으나, 이는 특별한 이유를 찾기가 어렵다.
그림 5는 연령별로 발화 위치에 따른 담화 표지의 출현 빈도 차이를 보이기 위한 그림이다. 연령별로는 단독 위치와 시작 위치에서 보이는 세 담화 표지의 사용 빈도에서 흥미로운 점이 몇 가지 발견된다. 우선 그림 5의 시작 위치에서 10대의 ‘아’와 40대의 ‘어’가 두드러진 차이를 보인다는 것을 찾을 수 있다. 10대에서는 ‘아’의 출현 빈도가 294회로 ‘어’의 156회, ‘음’의 90회에 비해 상대적으로 높다. 그에 반해, 40대에서는 ‘어’의 출현 빈도가 290회로 ‘아’의 235회, ‘음’의 67회에 비해 상대적으로 높다. 즉, 발화 시작 위치에서 10대는 ‘아’를 많이 사용하고, 40대는 ‘어’를 많이 사용하는 양상을 보인다고 할 수 있다.
그 다음 단독 위치를 보면, 30대의 ‘음’의 두드러진 사용 빈도를 볼 수 있다. 단독 위치에서 ‘음’은 30대가 246회로, 10대 123회, 20대 147회, 40대 141회보다 높은 빈도로 나타났다. 30대의 ‘음’의 사용 빈도가 높은 빈도를 보이는 것은 다른 연령대에서는 보이지 않는 특징이다.
그림 6은 연령별로 발화 내 위치별 담화 표지 ‘아’, ‘어’, ‘음’의 음길이를 상자 도표(box plot)로 나타낸 것이다. 표 4, 그림 6에서 보듯이, 연령에 따른 평균 음길이는 10대 362 ms, 20대 310 ms, 30대 343 ms, 40대 313 ms로, 연령에 따른 평균 음길이의 차이에서는 뚜렷한 경향성을 발견하기 어렵다. 담화 표지별로 보아도 모든 연령에서 음길이는 ‘음>어>아’ 순서로 동일하다. 발화 내 출현 위치별로 보아도 연령별 차이 혹은 경향성을 찾기는 어렵다. 모든 연령에서 ‘단독 위치’의 음길이가 가장 길고, 발화 ‘중간 위치’에서의 음길이가 가장 짧다. 다만, 담화 표지별로 발화 위치별에 따라 나누어 조금 더 자세히 보면, 단독 위치에서 ‘음’의 평균 음길이가 10대 579 ms, 20대 572 ms, 30대 453 ms, 40대 448 ms와 같이 연령이 낮을수록 음길이가 길어지는 경향성이 있다는 것을 확인할 수 있다.
요컨대, 연령에 따라서는 발화 시작 위치에서 10대의 ‘아’와 40대의 ‘어’의 출현 빈도의 차이, 단독 위치에서 30대 ‘음’의 두드러진 사용 빈도를 찾을 수 있다. 음길이에서는 뚜렷한 경향성을 찾기는 어려우나, 발화 단독 위치에서 ‘음’만 연령이 낮을수록 음길이가 길어지는 경향성이 있다는 정도를 확인할 수 있다.
4. 논의
담화 표지 ‘아, 어, 음’은 성과 연령이 달라도 비슷한 특성을 드러내는 부분도 있었으나, 두 가지 정도의 특징적인 차이를 확인할 수 있다. 성별에 따라서는 ‘음’의 차이가, 연령별로는 10대의 ‘아’와 40대의 ‘어’의 차이가 비교적 두드러졌다. 이러한 차이에 주목하여 성별과 연령별 ‘아’, ‘어’, ‘음’의 사용 양상을 논하도록 한다.
3장에서 보았듯이, 발화 단독 위치에서는 성별에 따라 ‘음’의 사용 비율에 차이가 나타난다. 그림 7은 발화 단독 위치로만 한정하여 성별에 따른 ‘아’, ‘어’, ‘음’의 출현 비율을 보인 것이다.
그림 7에서 보듯이 발화 단독 위치만 보면(‘아’는 남녀의 차이가 거의 없으니 논외로 한다), 남성에게서는 ‘어’ 41.1%, ‘음’ 39.0%로 약 2.1% 정도의 차이가 있으나, 여성에게서는 ‘어’ 31.8%, ‘음’, 48.4%로 약 16.6%의 차이가 보인다. 즉, 발화 단독 위치에서 여성이 ‘음’을 특징적으로 많이 사용하고 있다고도 할 수 있다.
(3) 은 여성의 발화 단독 위치에서 나타난 ‘음’의 한 예시이다. 이는 그림 8과 같이 구체적인 음성으로도 확인할 수 있다.
그림 8을 보면, 화자가 ‘음’ 을 길게 끌면서 발화하는 것을 볼 수 있다. ‘재해석하기는’ 뒤에 ‘어렵다’등의 단정적 술어를 생략하고 휴지를 가진 후 ‘음’을 1초 이상 길게 발화하고 있다. 피험자의 발화 지연이 길어지자 진행자가 발화에 개입(IVER 부분)하고 나서야 다음 발화를 이어간다.
이 연구는 담화 표지 ‘음’의 기능을 살피기 위한 목적으로 설계되지 않았기 때문에, 단독 발화 위치에서 두드러지는 여성의 ‘음’의 사용 양상에 대한 화용론적인 해석은 어렵다. 그러나 (3)과 같은 예를 통해서 보건대, ‘시간 벌기’ 전략이라든가, ‘망설임’ 혹은 ‘끝맺음’ 등의 의도를 담화 표지 ‘음’을 통해 여성이 더욱 더 적극적으로 사용하고 있는 까닭이 아닐까라고 추정해 볼 수는 있다. 그러나 이에 대해서는 ‘아’, ‘어’, ‘음’의 화용론적 기능을 더욱 면밀하게 정리, 분류 및 태깅하여 성별에 따른 차이를 살피는 후속 연구가 있어야 정확한 해석이 가능할 것이다.
성별에 따른 ‘음’의 특징적인 또 다른 차이는 발화 종결 위치에서 여성의 ‘음’이 남성에 비해서 길게 나타났다는 것이다. 발화 종결 위치에서 남성의 ‘음’은 평균 238 ms인데 비해, 여성은 평균 478 ms를 보여, 약 2배의 차이를 보였다.
(4)는 발화 종결 위치에서 나타나는 여성의 ‘음’의 예이고, 그림 9는 구체적인 음성이다. (4)에서 ‘음’은 ‘그래요’라는 술어 바로 뒤에 953 ms 동안 이어지고 있다. 발화 종결 위치에서 ‘음’ 역시 다양한 화용론적 기능을 실현할 수 있으나, (4)에서 보는 바와 같이 ‘망설임’이나 ‘시간 벌기’의 의도로 사용하였다고도 볼 수 있다. 그러나 이 또한 여성 화자가 어떠한 이유에서 남성보다 ‘음’을 평균적으로 더 길게 사용하였는지 확인하기는 어렵다.
연령에 따른 담화 표지의 사용 양상에서 보이는 가장 두드러진 차이는 10대의 ‘아’와 40대의 ‘어’이다. 발화 시작 위치에서 10대의 ‘아’의 출현 빈도가 높고, 40대는 ‘어’의 출현 빈도가 높다. 10대는 ‘아’로 시작하는 발화가 많고, 40대는 ‘어’로 시작하는 발화가 많다는 것이다. (5)와 (6)은 각각 10대의 ‘아’와 40대의 ‘어’의 예이다. (5)는 그림 10에, (6)은 그림 11에 구체적인 음성의 예시를 제시하였다.
그림 10은 10대 발화 시작 위치에서의 ‘아’로, 28 ms로 매우 짧게 발화된다. 이는 후행하는 ‘그러니까’와 한 번에 발화되어 ‘아잉까’처럼 들릴 정도이다. 그리고 그림 10의 스펙트로그램에는 나타나지 않지만 이어지는 발화 역시 ‘아(95 ms)’로 발화를 시작하여 마치 말버릇처럼 사용되고 있다는 것을 알 수 있다. 그림 11은 40대의 시작 발화에서의 ‘어(871 ms)’를 길게 사용하고 있는 예시다. 이는 10대가 발화 시작 위치에서 ‘아’를 매우 짧게, 자주 발화한 것과 대조하면 매우 두드러진 특징이라 할 수 있다.
10대의 ‘아’와 40대의 ‘어’의 사용 양상의 차이가 있다는 것까지는 확인할 수 있으나, 담화 기능을 분류하지 않은 자료의 한계로 인해 그 구체적인 내용까지는 확인하기 어렵다. 이 역시 후속 연구를 통해 이어 가는 것이 타당하리라 생각한다. 또한 이러한 ‘아’와 ‘어’가 Gries(2013)에서 울타리어(Hedge)로 분석한 영어의 ‘uh’와 ‘um’, Watanabe & Ishi(2000) 등에서 삽입어(Filler)로 해석한 일본어의 ‘e’나 ‘ma’ 등과도 유사한 점을 살필 수 있다. 이후 담화 표지의 언어 간 분석을 통해 공통점과 차이점을 파악하려는 연구도 전망해 볼 수 있다.
5. 결론
이 연구는 담화 표지 ‘아, 어, 음’의 출현 빈도와 발화 시간, 발화 위치 등을 계량적으로 관찰하여 성별과 연령별 차이를 보이고자 하였다. 이를 위해 대용량 음성 코퍼스인 서울코퍼스를 이용하였고, Praat(ver.6.1.31)으로 음길이와 실제 발화를 확인하고, Emeditor(ver.17.6.1)로 코퍼스를 분석하고, R(ver.3.4.4)로 통계 분석하여 결과를 제시하였다. 성별에 따라 보면 여성의 경우 남성보다 단독 발화에서 ‘음’이 고빈도로 사용되었고, 발화 종결 위치에서의 평균 음길이 또한 길었다. 연령에 따라 보면 발화 시작 위치에서 10대에서는 ‘아’가, 40대는 ‘어’가 고빈도로 출현하는 것이 특징적이었다.
이제까지 화자 변인을 중심으로 담화 표지 ‘아, 어, 음’을 살펴보았다. 언어 외적 요소들이 담화표지에 어떻게 개입하는지를 살펴 본 것이다. 따라서 이 연구에서는 ‘성과 연령’에 따른 차이의 양상이 담화 표지의 어떠한 화용론적 기능에 의한 것인지까지는 그 해석을 넓히지 못하였다. 이후 논의를 이어가기 위해서는 담화 맥락을 고려한 정밀한 고찰이 이루어져야 할 것이라 생각한다. 후속 연구를 통하여 담화 기능을 좀 더 분명히 세분화하여 분석할 필요가 있다. 또한 다른 언어에서 울타리어 또는 삽입어로 분류되었던 단어들과의 범언어적인 고찰을 통해 명제적 의미를 지니지 않지만 고빈도로 발화되는 담화 표지들의 속성을 파악하는 연구도 고려해 볼 수 있을 것이다.