사람의 목소리의 높이는 음향적으로는 f0 값으로 나타낸다. 보통 청각적으로 느끼는 음의 높이를 염두에 두고 피치가 높다 낮다라고 표현하기도 한다.

 f0는 기본주파수(fundamental frequency)라고 부르기도 하는데 말하는 사람의 감정과 정서의 변화에 따라 달라진다.

 피치 값은 성대의 진동이 1초에 몇 번 있는가를 나타내는 것으로 성대의 크기와 길이, 질량 등에 영향을 받는다.

성대의 크기가 클수록 진동하는 속도가 느리기 때문에 여성보다 상대적으로 큰 성대를 가진 남성의 피치 값은 약 120 Hz가 된다.

 여성은 평균 약 230 Hz로 진동하며 어린아이는 300 Hz전후로 매우 높다.

 피치분석 알고리즘은 여러 가지가 나와 있으나 아직까지 소음이 섞인 음성이나 자음부분에 대한 측정상의 오류가 많이 나기 때문에 구한 값을 해석할 때 매우 주의해야 한다.

 특히, 성대 진동의 변화는 신체구조 상 서서히 변하는 데 비해, 음성분석은 지정한 크기의 창안에 있는 자료 앞뒤와는 별개로 분석하여 급작스럽게 변하는 오류 값을 나타내는 경우가 많기 때문에 주의해야한다.





PDA(Pitch detection algorithm)

Time domain과 Frequency domain 방식으로 나뉜다.


'Project > 음성평가시스템' 카테고리의 다른 글

Pratt 기능을 Matlab으로 구현  (0) 2013.09.12
LPC를 통한 포만트 분석  (0) 2013.09.10
특징추출4. Mel_filterbank  (0) 2013.08.21
현재 진행상황  (0) 2013.08.19
특징추출3. Mef filter bank 영문설명  (0) 2013.08.14
Posted by 십자성군