https://cafe.naver.com/hfi/179
이글은 위키피디아의 글을 번역한 것으로 난해할 수 있습니다.
참고로 가청 최대음압은 120dBA이고 녹음 스튜디오의 실내소음기준이 25~30dBA, 음악당이 30dBA, 개인주택이 35dBA정도가 됨으로 소음기준이 제일 낮은 녹음 스튜디오로 따져도 필요한 다이나믹 레인지는 95dB정도입니다.
원문출처는 다음과 같습니다: https://en.wikipedia.org/wiki/Audio_bit_depth
오디오 비트 심도
4비트 PCM 디지털 샘플(파란색)로 인코딩된 아날로그 신호(빨간색); 비트 심도는 4이므로 각 샘플의 진폭은 16개의 가능한 값 중 하나입니다.
펄스 코드 변조(PCM)를 사용하는 디지털 오디오에서 비트 심도는 각 샘플의 정보 비트 수로, 각 샘플의 해상도와 직접적으로 일치합니다. 비트 심도의 예로는 샘플당 16비트를 사용하는 컴팩트 디스크 디지털 오디오와 샘플당 최대 24비트를 지원할 수 있는 DVD-오디오 및 블루레이 디스크가 있습니다.
기본적인 구현에서 비트 심도의 변화는 주로 양자화 오류로 인한 노이즈 음압, 즉 신호 대 잡음비(SNR)와 다이나믹 레인지에 영향을 미칩니다. 그러나 디더링, 노이즈 쉐이핑, 오버샘플링과 같은 기술을 사용하면 비트 심도를 변경하지 않고도 이러한 영향을 완화할 수 있습니다. 비트 심도는 비트 전송률과 파일 크기에도 영향을 미칩니다.
비트 심도는 PCM 디지털 신호를 설명하는 데 유용합니다. 손실 압축을 사용하는 형식과 같은 비 PCM 형식에는 관련 비트 심도가 없습니다.
이진수 표현
PCM 신호는 원본 아날로그 신호를 재구성하는 데 필요한 정보를 제공하는 데이터가 포함된 디지털 오디오 샘플의 순차적 배열입니다. 각 샘플은 특정 시점의 신호 진폭을 나타내며, 샘플의 시간 간격은 균일합니다. 진폭은 샘플에 명시적으로 저장된 유일한 정보이며, 일반적으로 정수 또는 부동 소수점 숫자로 저장되고, 고정된 자릿수의 이진수(샘플의 비트 심도, 워드 길이 또는 워드 크기라고도 함)로 인코딩됩니다.
해상도는 아날로그 값의 범위에서 표현할 수 있는 불연속 값의 개수를 나타냅니다. 이진 정수의 해상도는 워드 길이가 증가함에 따라 기하급수적으로 증가합니다. 비트를 하나 더하면 해상도가 두 배가 되고, 두 개를 더하면 네 배가 되는 식으로 증가합니다. 정수 비트 심도가 표현할 수 있는 가능한 값의 수는 2n을 사용하여 계산할 수 있으며, 여기서 n은 비트 심도입니다. 따라서 16비트 시스템의 해상도는 65,536(216)개의 가능한 값입니다.
정수형 PCM 오디오 데이터는 일반적으로 2의 보수 형식의 부호화된 숫자로 저장됩니다.
오늘날 대부분의 오디오 파일 포맷과 디지털 오디오 워크스테이션(DAW)은 부동소수점 숫자로 표현되는 샘플이 포함된 PCM 포맷을 지원합니다. WAV 파일 포맷과 AIFF 파일 포맷 모두 부동소수점 표현을 지원합니다. 비트 패턴이 단일 비트 계열인 정수와 달리 부동소수점 숫자는 수학적 관계를 형성하는 별도의 필드로 구성됩니다. 가장 일반적인 표준은 IEEE 754로, 숫자가 양수인지 음수인지를 나타내는 부호 비트, 지수, 지수에 의해 증가되는 가수(假受)의 세 가지 필드로 구성됩니다. 가수는 IEEE 기본 2 부동 소수점 형식의 이진 분수로 표현됩니다.
양자화
비트 심도는 재구성된 신호의 신호 대 잡음비(SNR)를 양자화 오류에 의해 결정되는 최대 음압으로 제한합니다. 비트 심도는 샘플 레이트에 의해 제약을 받는 주파수 응답에는 영향을 미치지 않습니다.
아날로그-디지털 변환(ADC)에서 발생하는 양자화 오류는 양자화 노이즈로 모델링할 수 있습니다. 이는 ADC에 대한 아날로그 입력 전압과 디지털화된 출력 값 사이의 반올림 오차입니다. 노이즈는 비선형적이며 신호에 따라 달라집니다.
최하위 비트(LSB)가 하이라이트된 8비트 이진수(십진수 149)
양자화 오류가 최하위 비트(LSB) 사이에 균일하게 분포되어 있고 신호가 모든 양자화 음압을 포괄하는 균일한 분포를 갖는 이상적인 ADC에서 신호 대 양자화 잡음비(SQNR)는 다음에서 계산할 수 있습니다:
여기서 b는 양자화 비트 수이며 결과는 데시벨(dB) 단위로 측정됩니다.
따라서 CD에서 볼 수 있는 16비트 디지털 오디오의 이론적 최대 SNR은 98dB이며, 전문가용 24비트 디지털 오디오는 146dB에 달합니다. 2011년 현재 디지털 오디오 컨버터 기술은 집적 회로 설계의 현실적인 한계로 인해 약 123dB (사실상 21비트)의 SNR로 제한됩니다. 그래도 이는 인간의 청각 시스템 성능과 거의 일치합니다. 여러 컨버터를 사용하여 동일한 신호의 다양한 범위를 커버할 수 있으며, 이를 결합하여 장기적으로 더 넓은 다이나믹 레인지를 기록하는 동시에 단기적으로는 단일 컨버터의 다이나믹 레인지로서 제한하는 것을 다이나믹 레인지 확장이라고 합니다.
비트 심도의 신호 대 잡음비 및 해상도(가중치 없음)
|
|||||
비트 수
|
SNR
(오디오)
|
SNR (비디오)
|
최소 dB
스텝 차이
(양자화
반올림 오차)
|
가능 수치 개수
(샘플당)
|
부호화된
표현을 위한 범위
(샘플당)
|
4
|
25.84 dB
|
34.31 dB
|
1.578 dB
|
16
|
−8 to +7
|
8
|
49.93 dB
|
58.92 dB
|
0.1948 dB
|
256
|
−128 to +127
|
11
|
67.99 dB
|
77.01 dB
|
0.0331 dB
|
2,048
|
−1,024 to +1,023
|
12
|
74.01 dB
|
83.04 dB
|
0.01806 dB
|
4,096
|
−2,048 to +2,047
|
16
|
98.09 dB
|
107.12 dB
|
0.00598 dB
|
65,536
|
−32,768 to +32,767
|
18
|
110.13 dB
|
-
|
0.000420 dB
|
262,144
|
−131,072 to +131,071
|
20
|
122.17 dB
|
-
|
0.000116 dB
|
1,048,576
|
−524,288 to +524,287
|
24
|
146.26 dB
|
-
|
0.00000871 dB
|
16,777,216
|
−8,388,608 to +8,388,607
|
32
|
194.42 dB
|
-
|
4.52669337E−8 dB
|
4,294,967,296
|
−2,147,483,648 to +2,147,483,647
|
48
|
290.75 dB
|
-
|
1.03295150E−12 dB
|
281,474,976,710,656
|
−140,737,488,355,328 to +140,737,488,355,327
|
64
|
387.08 dB
|
-
|
2.09836488E−17 dB
|
18,446,744,073,709,551,616
|
−9,223,372,036,854,775,808 to +9,223,372,036,854,775,807
|
부동 소수점
부동소수점 샘플의 해상도는 부동소수점 값의 간격이 균일하지 않기 때문에 정수 샘플보다 간단하지 않습니다. 부동소수점 표현에서 인접한 두 값 사이의 간격은 값에 비례합니다.
부동 소수점과 정수의 절충점은 큰 부동 소수점 값 사이의 공간이 같은 비트 심도의 큰 정수 값 사이의 공간보다 크다는 것입니다. 큰 부동 소수점 숫자를 반올림하면 작은 부동 소수점 숫자를 반올림하는 것보다 더 큰 오류가 발생하는 반면, 정수를 반올림하면 항상 같은 수준의 오류가 발생합니다. 즉, 정수는 반올림이 균일하여 항상 LSB를 0 또는 1로 반올림하고 부동 소수점은 균일 한 SNR을 가지므로 양자화 노이즈 음압은 항상 신호 음압에 대해 일정한 비율을 갖습니다. 부동 소수점 노이즈 플로어는 신호가 상승하면 상승하고 신호가 하락하면 하락하여 비트 심도가 충분히 낮으면 가청 변동 오류가 발생합니다.
오디오 프로세싱
디지털 오디오에 대한 대부분의 처리 작업에는 샘플의 재 양자화가 포함되므로 아날로그에서 디지털로 변환하는 동안 도입된 원래 양자화 오류와 유사한 추가 반올림 오류가 발생합니다. ADC 중 암시적 오류보다 큰 반올림 오류를 방지하려면 처리 중 계산이 입력 샘플보다 더 높은 정밀도로 수행되어야 합니다.
디지털 신호 처리(DSP) 연산은 고정 소수점 또는 부동 소수점 정밀도로 수행할 수 있습니다. 두 경우 모두 각 작업의 정밀도는 입력 데이터의 해상도가 아니라 처리의 각 단계를 수행하는 데 사용되는 하드웨어 작업의 정밀도에 의해 결정됩니다. 예를 들어, x86 프로세서에서 부동소수점 연산은 16비트, 32비트 또는 64비트 해상도에서 단일 정밀도 또는 배정밀도 및 고정 소수점 연산으로 수행됩니다. 따라서 인텔 기반 하드웨어에서 수행되는 모든 처리는 소스 형식에 관계없이 이러한 제약 조건에 따라 수행됩니다.
고정 소수점 디지털 신호 프로세서는 특정 신호 해상도를 지원하기 위해 특정 단어 길이를 지원하는 경우가 많습니다. 예를 들어, 모토로라 56000 DSP 칩은 24비트 곱셈기와 56비트 누산기를 사용하여 오버플로 또는 잘림 없이 두 개의 24비트 샘플에 대해 곱셈-누적 연산을 수행합니다. 대형 누산기를 지원하지 않는 장치에서는 고정 소수점 결과가 잘려서 정밀도가 떨어질 수 있습니다. 오류는 수행되는 연산에 따라 달라지는 비율로 여러 단계의 DSP를 통해 복합적으로 발생합니다. DC 오프셋이 없는 오디오 데이터의 상관관계가 없는 처리 단계의 경우, 오류는 평균이 0인 무작위라고 가정합니다. 이 가정하에서 분포의 표준 편차는 오류 신호와 양자화 오류 스케일을 연산 수의 제곱근으로 나타냅니다. 컨볼루션과 같이 반복 처리를 포함하는 알고리즘에는 높은 수준의 정밀도가 필요합니다. 무한 임펄스 응답 (IIR) 필터와 같은 재귀 알고리즘에서도 높은 수준의 정밀도가 필요합니다. 특히 IIR 필터의 경우 반올림 오류는 주파수 응답을 저하시키고 불안정성을 유발할 수 있습니다.
디더
디더 음압과 비교하기 위한 오디오 프로세스 단계의 헤드룸 및 노이즈 플로어
오디오 처리 중에 발생하는 반올림 오류 및 정밀도 손실을 포함하여 양자화 오류로 인해 발생하는 노이즈는 양자화하기 전에 신호에 디더라고하는 소량의 임의 노이즈를 추가하여 완화할 수 있습니다. 디더링은 비선형 양자화 오류 동작을 제거하여 매우 낮은 왜곡을 제공하지만 노이즈 플로어가 약간 높아지는 단점이 있습니다. ITU-R 468 노이즈 가중치를 사용하여 측정한 16비트 디지털 오디오에 권장되는 디더링은 정렬 음압보다 약 66dB 낮거나 디지털 풀 스케일보다 84dB 낮으며, 이는 마이크 및 실내 노이즈 음압과 비슷하므로 16비트 오디오에서는 거의 영향을 미치지 않습니다.
24비트 및 32비트 오디오는 디지털 컨버터의 노이즈 음압이 적용될 수 있는 디더링의 필요 음압보다 항상 더 크므로 디더링이 필요하지 않습니다. 24비트 오디오는 이론적으로 144dB의 다이나믹 레인지를 인코딩할 수 있고 32비트 오디오는 192dB를 달성할 수 있지만, 최고의 센서와 마이크도 130dB를 초과하는 경우가 거의 없기 때문에 현실에서 이를 달성하기는 거의 불가능합니다.
디더를 사용하여 유효 다이나믹 레인지를 높일 수도 있습니다. 16 비트 오디오의 인지된 다이나믹 레인지는 사람 귀의 주파수 응답을 활용하는 노이즈 쉐이핑 된 디더를 사용하여 120dB 이상이 될 수 있습니다.
다이나믹 레인지 및 헤드룸
다이나믹 레인지는 시스템이 기록하거나 재생할 수 있는 가장 큰 신호와 가장 작은 신호 사이의 차이입니다. 디더링이 없으면 다이나믹 레인지는 양자화 노이즈 플로어와 상관 관계가 있습니다. 예를 들어 16비트 정수 해상도는 약 96dB의 다이나믹 레인지를 허용합니다. 디더를 적절히 적용하면 디지털 시스템은 해상도가 일반적으로 허용하는 것보다 낮은 음압의 신호를 재생하여 유효 다이나믹 레인지를 해상도에 의해 부과된 한계 이상으로 확장할 수 있습니다. 오버샘플링 및 노이즈 쉐이핑과 같은 기술을 사용하면 양자화 오류를 관심 주파수 대역 밖으로 이동하여 샘플링된 오디오의 다이나믹 레인지를 더욱 확장할 수 있습니다.
신호의 최대 음압이 비트 심도에서 허용하는 음압보다 낮으면 레코딩에 헤드룸이 있는 것입니다. 스튜디오 레코딩 중에 더 높은 비트 심도를 사용하면 동일한 다이나믹 레인지를 유지하면서 헤드룸을 확보할 수 있습니다. 이렇게 하면 낮은 볼륨에서 양자화 오류를 증가시키지 않고 클리핑의 위험을 줄일 수 있습니다.
오버샘플링
오버 샘플링은 샘플 당 비트 수를 변경하지 않고 PCM 오디오의 다이나믹 레인지를 늘리는 대체 방법입니다. 오버 샘플링에서 오디오 샘플은 원하는 샘플 속도의 배수로 수집됩니다. 양자화 오류는 주파수에 따라 균일하게 분포되어 있다고 가정하기 때문에 양자화 오류의 대부분은 초음파 주파수로 이동하여 재생 중에 디지털-아날로그 컨버터에 의해 제거될 수 있습니다.
해상도를 n비트 추가에 해당하는 만큼 높이려면 신호를 다음과 같이 오버샘플링해야 합니다:
예를 들어, 14비트 ADC를 16배 오버샘플링, 즉 768kHz로 동작하여 16비트 48kHz 오디오를 생성할 수 있습니다. 따라서 오버샘플링된 PCM은 동일한 해상도를 얻기 위해 샘플 당 더 적은 비트를 더 많은 샘플과 교환합니다.
또한 소스에서 오버샘플링을 하지 않고 신호 재구성 시 오버샘플링을 통해 다이나믹 레인지를 향상시킬 수 있습니다. 재구성 시 16배 오버샘플링을 생각해 보겠습니다. 재구성 시 각 샘플은 원본 샘플 포인트 각각에 대해 16개의 샘플이 삽입되며, 모두 디지털 재구성 필터에 의해 계산된다는 점에서 고유합니다. 유효 비트 심도가 증가하는 메커니즘은 앞서 설명한 바와 같이 양자화 노이즈 파워는 감소하지 않았지만 노이즈 스펙트럼이 오디오 대역폭의 16배에 걸쳐 분산되는 것입니다.
역사적 참고 사항 - 컴팩트 디스크 표준은 소니와 필립스가 협력하여 개발하였습니다. 최초의 소니 소비자용 유닛에는 16비트 DAC가, 최초의 필립스 유닛에는 듀얼 14비트 DAC가 탑재되었습니다. 14비트 PCM은 16비트 PCM보다 12dB 낮은 84dB SNR을 허용하기 때문에 시장과 전문가들 사이에서조차 혼란을 겪었습니다. 필립스는 이론적으로 CD 형식의 전체 96dB 다이나믹 레인지를 실현하는 1 차 노이즈 쉐이핑으로 4 배 오버 샘플링을 구현하였습니다. 실제로 필립스 CD100은 소니의 CDP-101과 동일한 20Hz-20kHz의 오디오 대역에서 90dB SNR로 평가되었습니다.
노이즈 쉐이핑
신호를 오버 샘플링하면 모든 주파수에서 단위 대역폭 당 동일한 양자화 노이즈가 발생하고 오버 샘플링 비율의 제곱근으로만 개선되는 다이나믹 레인지가 생성됩니다. 노이즈 쉐이핑은 더 높은 주파수에서 노이즈를 추가하여 낮은 주파수에서 일부 오류를 상쇄하는 기술로, 오버샘플링시 다이나믹 레인지가 더 크게 증가합니다. n차 노이즈 쉐이핑의 경우 오버샘플링된 신호의 다이나믹 레인지가 노이즈 쉐이핑을 적용하지 않은 오버샘플링에 비해 추가로 6n dB 향상됩니다. 예를 들어, 20kHz 아날로그 오디오를 4배 오버샘플링하고 2차 노이즈 쉐이핑을 적용하면 다이나믹 레인지가 30dB 증가합니다. 따라서 176kHz에서 샘플링된 16비트 신호는 노이즈 쉐이핑 없이 44.1kHz에서 샘플링된 21비트 신호와 동일한 비트 심도를 갖게 됩니다.
노이즈 쉐이핑은 일반적으로 델타 시그마 변조로 구현됩니다. 다이렉트 스트림 디지털(DSD)은 델타 시그마 변조를 사용하여 64배 오버샘플링이 적용된 1비트 오디오를 사용하여 오디오 주파수에서 이론적으로 120dB의 SNR을 달성합니다.
'OneKey 메모장' 카테고리의 다른 글
[반 오디오 테크 노트] 비동기식 USB 오디오의 성능 (2) | 2024.12.01 |
---|---|
[iZOTOPE] 디지털 오디오 베이직: 오디오 샘플 레이트 및 비트 심도 (1) | 2024.12.01 |
미국의 하이파이쇼 (1) | 2024.12.01 |
2024년 11월 30일 실텍 마스터 크라운 런칭 행사 - 소리샵 (3) | 2024.11.30 |
[androidauthority] 위대한 오디오 신화: 32비트 DAC이 필요 없는 이유 (3) | 2024.11.30 |