음파
소리가 만들어 내는 파동으로 단순파(simple wave, sine wave)와 복합파(complex wave)로 나뉜다. 복합파는 주기성을 갖는 주기파(periodic wave)와 aperiodic wave)로 나뉨
소리의 강도
정해진 면적에서 소리의 세기는 지름의 제곱에 반비례한다. 따라서 음원의 위치에서부터 지름(거리)이 3배로 늘어나면 소리의 강도는 1/9로 줄어든다. I=1/d^2 (I=intensity, d=distance)
단순배음운동
무게추를 정지위치로부터 진동시키면 일정한 속도로 움직이는 무게추가 진동하는 흔적이 종이위에 곡선으로 나타나는데 이 곡선은 가장 단순한 방식의 진동을 나타내면 이러한 진동을 정현진동(sinusoidal vibration) 또는 단순배음운동(simple harmonic motion)이라 한다.
파형
파형은 단순파와 복합파로 나누어진다. 순음(pure tone)은 하나의 주파수만을 가지고 단순배음운동을 하는 단순파이지만 대부분의 언어음은 복합파로 하나 이상의 주파수를 가진다. 2개 이상의 파형들 사이에는 시간관계, 즉 위상차가 존재한다. 복합파는 음파가 같은 모양을 일정하게 되풀이되는 주기파와 불규칙한 형태의 진동주기로 인해서 반복적인 형태를 갖고 있지 않은 비주기파로 구분할 수 있는데 공명음과 같은 연속적 진동은 주기적이기 때문에 악음(musical tone)이 되고 장해음은 비주기적이기 때문에 소음(noise)이다. 각 공명체들의 감폭 정도가 다르기 때문에 가장 흔하게 나타나는 음파의 형태는 준주기적 파형(quasiperiodic wave)이다.
음파의 간섭현상
같은 진동수로 동일한 소리가 나오는 두개의 스피커로부터 같은 거리에 앉아있으면 중첩효과로 소리는 커진다. 그러나 스피커를 약간 옮겨서 경로차이가 반파장이 되게 하면 한 스피커의 희박이 다른 스피커의 압축을 채우게 되어서 아무소리도 들리지 않게 된다.
진동수가 약간 다른 두개의 음정의 소리가 합쳐지면 합성음의 소리가 작아졌다 커졌다를 반복한다. 이와 같은 주기적인 진동은 간섭때문에 일어나며 맥놀이(beat)라고 부른다. 예를 들어 소리굽쇠 한개가 1초마다 262번 진동하고 다른 하나는 264번 진동한다면 두 소리굽쇠는 1초마다 두번씩 박자가 맞게 된다. 즉 2Hz의 맥놀이를 들을 수 있다. 전체적으로는 평균진동수인 263Hz에 해당하는 음질이 된다.
스펙트럼과 스펙트로그램
스펙트럼
순음의 스펙트럼은 특정한 주파수에서 위치한 하나의 선으로 구정된다. 청자가 판단한 주기적인 복합음의 피치는 배음의 기본주파수와 일치한다. 기억해야할 사실은 배음 간에 기본주파수(F)가 존재하지 않아도, 청각체계는 좀 더 낮은 배음의 상실을 보상하여 기본주파수를 듣게 된다. 예를 들어 600Hz, 900Hz, 그리고 1200Hz로 구성된 복합음은 최대공약수인 300Hz의 피치로 인식된다.
복합파를 구성하는 성분음들의 주파수와 진폭을 명시한 것을 그 음파의 스펙트럼(spectrum)이라고 한다. 소리의 음파를 분석하여 어떠한 재료들이 이 소리를 이루고 있는가를 알려주는 것이다.
스펙트로그램
시간에 따른 각 주파수의 음향에너지를 시각화한 것으로 주파수와 진폭의 시간에 따른 변화를 보여주는 3차원적인 그림이하고 할 수 있다. x축은 시간, y축은 주파수, z축은 진폭인데 z축은 진하기로 표현해서 평면에 표시되도록 한다. 스펙트로 그램은 그 대역폭에 따라 협대역 스펙트로그램과 광대역 스펙트로그램으로 나눌 수 있다.
광대역 스펙트로그램의 가장 큰 특징은 음형대를 나타내는 에너지의 주파수대가 상대적으로 넓다는 것이다. 성도의 공명곡선에서 나타나는 음형대 사이의 상대적으로 넓은 수평의 빈공간은 비공명을 나타낸다. 광대역 스펙트로 그램을 형성하는데 이용되는 여과기(filter)의 주파수 대역은 일반적으로 300-500Hz 사이다. 넓은 주파수 대역의 여과기는 그 범위안에 들어오는 하나, 둘, 셋 또는 그 이상의 배음에 동일하게 반응하게 되어 여과기가 그 주파수 대역내의 에너지를 개별적인 배음으로 변형시키지 않는다.
이에 비해 협대역 스펙트로그램 여과기의 주파수 대역폭(bandwidth)은 보통 30-50Hz사이이다. 협대역 스펙트로그램은 각각의 배음 주파수들을 나타내고 있어서 기본 주파수의 계산이 가능하다. 다시 말해서 맨 밑에서부터 배음을 헤야려서 보통 다섯번째에 있는 배음을 5로 나누면 그 값이 바로 기본주파수가 된다. 따라서 협대역 스펙트로그램에서는 배음 주파수들의 변화가 그대로 드러나므로 억양의 변화를 파악하는데 이용된다.
기본주파수와 옥타브
기본주파수(fundamental frequency, F0)
하나의 복합주기 가운데 가장 낮은 주파수의 구성성분으로 가장 낮은 배음을 가리키며 사람의 목소리에서는 성대의 진동주파수와 같은 주파수를 갖고 있다.
귀로 들어온 언어음의 자극은 청각중추로 전달되지만 청각중추에서는 자연 음향의 주파수 상태로 지각하는 것이 아니라 기본 주파수로 지각한다. 예를 들어 어떤 특정 복합음의 기본주파수가 300Hz 이고 600Hz, 900Hx, 1200Hz, 1500Hz 라는 배음구조를 가지고 있어도 우리는 기본주파수인 300Hz 만을 듣게 된다. 이때 기본 주파수 300Hz 보다 높은 배음을 통틀어 상음(overtone)이라고 한다.
주기적 복합파에서는 세로축 진폭, 가로축 주파수를 표시하는 스펙트럼을 만들면 각 배음별 수직선으로 표시되지만 비주기적 복합파의 스펙트럼은 수직선으로 배음이 구별되지 않고 fugure 2의 좌측처럼 곡선으로 표현된다.
옥타브
배음은 기본주파수의 배수관계로 소리의 높낮이를 분석한 반면, 옥타브는 기본주파수를 기준으로 하여 상하 대수적 관계로 소리를 분석하는 방법이다. 한 옥타브란 8도 음정을 말하지만, 주파수의 관점에서 보면 1 옥타브는 최고 주파수가 최저주파수의 두 배가 되는 주파수 대역을 의미한다(figure 3). 음향학에서 옥타브에 관심을 가지는 이유는 가청주파수 범위인 20Hz~2000Hz의 넓은 범위의 주파수 범위를 손쉽게 나타낼 수 있고 또한 인간이 느끼는 주파수 변동이 옥타브와 밀접한 관련을 갖고 있기 때문이다.
감폭
진동의 진폭은 각 진동 사이클마다 줄어들기만 진동의 주파수는 동일하다. 연속적인 진동에서 진폭이 감소하는 것을 감폭(damping)이라 하고 진폭의 감소비율을 감폭률이라고 한다.
감폭의 속도는 진동체에 따라 다르게 진행되는데 소리굽쇠가 진동할 때는 감폭이 느리게 진행된다. 이렇게 감폭이 느릴수록 한번 시작된 진동이 그치는데 시간이 더 오래 걸리며 또 그러한 진동체가 공명을 할 때에도 다른 진동체보다 시간이 더 오래 걸린다. 반대로 감폭이 빠른 진동체일수록 진동을 시작했다가 그치는 데 걸리는 시간도 짧고 공명하는데 걸리는 시간도 짧다.
sound pressure level, spl
Watt/m^2와 파스칼(PaP은 모두 소리의 절대적인 힘을 나타내는 단위이고, 소리의 상대적인 힘을 나타내는 단위가 데시벨(dB)이다. 데시벨은 인간의 청각기관이 음의 강도를 감지하는 방식을 연구한 것을 바탕으로 산출된 단위로 로그단위를 바탕으로 하고 있다. dB=20log(Pa/Pb) 로 표현하는데 Pa는 측정한 에너지값, P는 기준이 되는 에너지값이다. Pb로 많이 쓰는 기준은 절대가청임계값(absolute sound threshold)인 20microPa이다. 따라서 이값을 기준으로 계산된 강도의 수준을 음압수준 SPL이라하고 0dB SPL이라 함은 우리 귀가 들을 수 있는 최소한의 소리를 의미한다.
주파수
주파수는 주기파에서 반복적으로 관찰되는 한 단위의 패턴이 일정한 시간 내에 얼마나 반복되는 가를 나타내는 것이다. 1Hz라 함은 1초에 반복적으로 관찰되는 한 단위의 패턴이 1번 있음을 의미한다. 비교하여 피치는 어떤 주파수의 음을 듣고 어떻게 느끼는가를 표현하는 단어이다. 따라서 주파수가 클수록 피치는 높다고 표현한다.
젊고 건강한 인간의 귀에는 20Hz-20000Hz늬 진동을 감지할 수 있다. 그런데 대부분의 유용한 음성정보는 200-5000Hz에 담겨있다. 20Hz 이하의 소리를 초저음속 또는 아음속이라하고 20000Hz 이상의 소리를 초음파라고 한다.
공명
진동계가 그 고유진동수와 같은 진동수를 가진 외부로부터의 힘을 주기적으로 받아 진폭이 뚜렷하게 증가하는 현상. 이러한 주파수들을 그 진동계의 공명주파수라고 한다.
figure 4에서 막혀있는 쪽에서는 성대의 떨림으로 소리를 만들어내는 음원이 위치한 부분이고 반대편의 열린 부분은 입술이라고 가정한다. 음원이 시작되는 지점은 소리가 밀려나오는 압력파가 시작되는 곳이기 때문에 압축 상태이고 이것이 전달되어 튜브를 따라서 열려있는 입술 부분까지 오면 갑자기 열린 공간을 만나면서 희박의 상태로 변하는데 이때 이 희박의 규모가 압축의 규모와 비슷한 크기가 되면서 압력파의 압력이 거의 0에 가까워져서 열린 공간으로는 압력파가 거의 진행해나가지 못하는 현상이 생긴다. 즉 입술 근처는 압력이 거의 0이되고 압축도 희박도 아닌 상태로 된다. 그런데 음파의 진행에 있어서 매질 내에서 그 음향학적 저항이 갑작스럽게 변화되는 상황에서는 반사파를 만드는 현상이 발생하는데, 이 경우도 동일한 현상이 일어나서 반사파가 음원이 있는 부분으로 진행하게 된다. 이와 같은 과정이 한 번의 왕복 과정이 되며 음원으로 만들어지는 파형들은 이런 왕복과정을 되풀이 하게 된다. 이 과정에서 정상파가 만들어지는데, 막혀있는 부분은 두개의 파가 합해지면서 압력이 두배가 되고 열려있는 부분은 두개의 파가 서로 상괘되면서 압력이 0이 된다.
figure 4를 보면 가장 낮은 음형대가 만들어지는 파의 파장은 튜브길이의 4배인 경우를 나타낸다. 즉 튜브의 길리가 파장의 1/4일 때 가장 낮은 음형대가 형성되는 것이다. 마찬가지로 figure 4에서 튜브의 길이가 파장의 3/4일 때 두번째 음형대가 만들어지는 것을 알수있다. 이러한 방식으로 3번째는 5/4, 네번째는 7/4에서 음형대가 만들어진다.
조음과 음향특성
조음과 음형대 주파수
전설모음: 형의 최고점이 앞쪽에 ㅣ, ㅔ, ㅐ, ㅟ, ㅚ
후설모음: 성도의 좁아지는 위치가 혀를 기준으로 혀의 뒤쪽과 연구개 사이에서 발음 ㅗ, ㅜ
고모음: 혀를 입천장 가까이. ㅣ, ㅜ
저모음: 혀를 입천장에서 멀리. ㅏ
비음: m, n, ng
제 1음형대(F1)는 인두강의 면적과 입의 개방정도와 관계가 있다. 제 2음형대(F2)는 구강의 길이와 밀접한 관련이 있다. 구강의 면적이 작아진다는 것은 인두강의 면적이 커진다는 것을 의미한다. 인두강이 커지면 F1이 작아진다. 반대로 저모음의 경우에는 인두강이 좁아지기 때문에 F1의 값이 커지게 된다.
또한 공명강의 앞부분인 구강은 전설모음에서는 줄어들고 후설모음으로 갈수록 늘어난다. 혀를 앞쪽으로 이동시키면 구강의 길이가 감소하게 되고 이에 따라 F2가 상승한다.
예를 들어 Figure 5에서 /i/에서는 혀가 높아지고 개구도가 감소하기 때문에 F1이 매우 낮고 인두강의 크기가 최대가 되기 때문에 F2는 매우 높이 실현된다. 반대로 /a/에서는 턱과 혀의 하강으로 개구도가 커지기 때문에 전반적으로 F1은 높아지고 F2는 감소한다. 다만 실제 음향자료가 반드시 조음상의 특징을 그대로 반영하지 않을 수 있다. 전반적인 특징은 아래 표와 같다.
비음화된 모음은 여과기 구실을 하는 성도가 연구개를 내려서 비강을 열고 구강과 비강으로 이중화되어 작용하므로 일반 모음시 발견되는 비교적 단순한 음형대가 나타나지 않는다. 이러한 이중 공명체계는 낮은 공명주파수들의 에너지는 증가시키고 나머지 공명주파수들의 에너지는 감소시키는 반공명 작용을 한다. 비음의 생성 시 연구개의 출구를 개방함으로써 야기되는 성도의 연장은 더 넒은 주파수 대역을 만들게 되고 넓게 맞춰진 공명기는 좁게 맞춰진 공명기보다 더 크게 감폭된다. 이것은 동일한 압력아래에서는 체적이 커지면 압력이 떨어진다는 보일의 법칙으로 설명할 수 있다.
성도의 길이에 따른 스펙트럼의 변화
사람에게 성도는 곡선으로 되어 있거나 거의 90도에 가깝게 구부려져 있지만 성도의 많은 음향학적 성질은 하나의 공명하는 tube로 이해될 수 있다. 성도의 길이는 공명주파수를 결정하는 데 중요한 변수로 작용한다. 즉, 공명주파수는 성도가 길면 길수록 그 값이 낮아지고 길이가 짧으면 높아진다.
청자가 판단한 주기적인 복합음의 피치는 배음의 기본 주파수와 일치한다. 상음이 섞인 복합음에서도 청각체계는 기본주파수를 인식한다.