https://cafe.naver.com/hfi/181
굉장히 민감한 내용이 될 수도 있겠습니다. 참고로 이 글은 2016년에 쓰인 글입니다.
원문출처는 다음과 같습니다: https://www.androidauthority.com/why-you-dont-want-that-32-bit-dac-667621/
위대한 오디오 신화: 32비트 DAC이 필요 없는 이유
플래그십 스마트폰에 32비트 DAC을 탑재하는 추세가 늘고 있지만 이는 마케팅 전략에 불과합니다. 그 이유를 알아보겠습니다.
로버트 트릭스 | 2016년 1월 19일
출처: Android Authority
이미 알고 계시겠지만, 최근 스마트폰 업계에서는 최신 플래그십 스마트폰에 '스튜디오 품질' 오디오 칩을 탑재하는 새로운 트렌드가 나타나고 있습니다. 192kHz 오디오를 지원하는 32비트 DAC(디지털-아날로그 컨버터)가 사양으로는 분명 좋아 보이지만, 오디오 컬렉션의 사이즈를 늘리는 데는 아무런 이점이 없습니다.
저는 이러한 비트 심도와 샘플 레이트 자랑이 오디오 업계가 소비자와 오디오 애호가들의 관련 지식 부족을 이용하는 또 다른 사례에 불과한 이유를 설명하기 위해 이 자리에 섰습니다. 공부벌레의 모자를 쓰고 프로 오디오의 안팎을 설명하기 위해 진지하게 기술적인 내용을 다뤄보겠습니다. 그리고 왜 대부분의 마케팅 과대광고를 무시해야 하는지 그 이유도 증명해 드리겠습니다.
들으셨어요?
본격적으로 설명하기 전에 디지털 오디오의 두 가지 주요 개념인 비트 심도와 샘플 레이트에 대한 몇 가지 필수 배경 정보를 제공합니다.
샘플 레이트는 신호에 대한 진폭 정보를 캡처하거나 재생하는 빈도를 나타냅니다. 기본적으로 파형을 여러 개의 작은 부분으로 잘게 쪼개서 특정 시점의 파형에 대해 더 많은 정보를 얻을 수 있습니다. 나이퀴스트 정리에 따르면 캡처하거나 재현할 수 있는 최고 주파수는 샘플 속도의 정확히 절반입니다. 파형의 주파수를 정확하게 알기 위해서는 파형의 상단과 하단의 진폭(두 개의 샘플이 필요)이 필요하기 때문에 이것은 상상하기 매우 쉽습니다.
Audacity 샘플 속도(위쪽)를 높이면 초당 샘플 수가 늘어나고, 비트 심도(아래쪽)가 커지면 샘플을 기록할 수 있는 값이 더 많아집니다.
오디오의 경우, 우리는 우리가 들을 수 있는 것에만 관심을 가지며 대부분의 사람들의 청력은 20kHz 바로 직전에 끊어집니다. 이제 나이퀴스트 정리에 대해 알았으니 44.1kHz와 48kHz가 우리가 들을 수 있는 최대 주파수의 2배가 조금 넘는 일반적인 샘플링 주파수인 이유를 이해할 수 있습니다. 스튜디오 음질인 96kHz 및 192kHz 표준을 채택하는 것은 더 높은 주파수 데이터를 캡처하는 것과는 아무런 관련이 없으며, 사실상 무의미합니다. 하지만 이에 대해서는 잠시 후에 자세히 살펴보겠습니다.
시간 경과에 따른 진폭을 살펴볼 때 비트 심도는 단순히 이 진폭 데이터를 저장하는 데 사용할 수 있는 해상도 또는 포인트 수를 나타냅니다. 예를 들어, 8비트는 반올림할 수 있는 256개의 포인트, 16비트는 65,534개의 포인트, 32비트 데이터는 4,294,967,294개의 데이터 포인트를 제공합니다. 물론 이렇게 하면 파일의 크기가 크게 증가합니다.
분당 스테레오 PCM 파일 크기
(대략적/비압축)
|
48kHz
|
96kHz
|
192kHz
|
16비트
|
11.5MB
|
23.0MB
|
46.0MB
|
24비트
|
17.3MB
|
34.6MB
|
69.1MB
|
32비트
|
23.0MB
|
46MB
|
92.2MB
|
진폭 정확도 측면에서 비트 심도를 바로 생각하기 쉽지만 여기서 이해해야 할 더 중요한 개념은 노이즈와 왜곡입니다. 해상도가 매우 낮으면 진폭이 낮은 정보를 놓치거나 파형의 윗부분이 잘려서 부정확성과 왜곡(양자화 오류)이 발생할 가능성이 높습니다. 흥미롭게도 저해상도 파일을 재생할 때 이런 현상이 종종 노이즈처럼 들리는데, 이는 캡처 및 재생할 수 있는 최소 신호의 크기를 효과적으로 늘렸기 때문입니다. 이는 파형에 노이즈 소스를 추가하는 것과 정확히 같은 원리입니다. 즉, 비트 심도를 낮추면 노이즈 플로어도 감소합니다. 최하위 비트가 노이즈 플로어를 나타내는 이진 샘플의 관점에서 이를 생각하면 도움이 될 수도 있습니다.
따라서 비트 심도가 높을수록 노이즈 플로어가 더 커지지만, 현실에서 이것이 얼마나 실용적인지에는 한계가 있습니다. 안타깝게도 모든 곳에 배경 소음이 존재하며, 이는 길거리에서 지나가는 버스를 말하는 것이 아닙니다. 케이블부터 헤드폰, 앰프의 트랜지스터, 심지어 우리의 머리 안에 위치한 귀까지, 현실 세계의 최대 신호 대 잡음비는 약 124dB이며, 이는 약 21비트 상당의 데이터로 계산됩니다.
전문 용어:
DAC- 디지털-아날로그 변환기는 디지털 오디오 데이터를 아날로그 신호로 변환하여 헤드폰이나 스피커로 전송합니다.
샘플 레이트- 헤르츠(Hz) 단위로 측정되며, 매초마다 캡처되는 디지털 데이터 샘플의 수입니다.
SNR- 신호 대 잡음비는 원하는 신호와 배경 시스템 잡음 사이의 차이입니다. 디지털 시스템에서 이것은 비트 심도와 직접적으로 연결됩니다.
출처: Android Authority
비교를 하자면 16비트 캡처는 신호 대 잡음비(신호와 배경 노이즈의 차이)가 96.33dB인 반면, 24비트는 144.49dB로 하드웨어 캡처와 인간의 인식 한계를 뛰어넘습니다. 따라서 32비트 DAC은 실제로는 최대 21비트까지만 유용한 데이터를 출력할 수 있고 나머지 비트는 회로 노이즈에 의해 가려집니다. 그러나 실제로는 대부분의 다른 회로 요소들이 자체 노이즈를 발생시키기 때문에 대부분의 중간 가격대의 장비는 100~110dB의 SNR로 최고치를 기록합니다. 그렇다면 32비트 파일은 이미 다소 불필요한 것처럼 보입니다.
이제 디지털 오디오의 기본 사항을 이해하였으니 좀 더 기술적인 부분으로 넘어가 보겠습니다.
천국의 계단
오디오에 대한 이해와 오해를 둘러싼 대부분의 문제는 교육 자료와 기업이 시각적 단서를 사용하여 이점을 설명하려는 방식과 관련이 있습니다. 오디오를 비트 심도를 나타내는 일련의 계단과 샘플 레이트를 나타내는 직사각형 모양의 선으로 표현한 것을 본 적이 있을 것입니다. 이는 매끄럽게 보이는 아날로그 파형과 비교할 때 그다지 좋아 보이지 않기 때문에 보다 정확한 출력 파형을 표현하기 위해 더 세밀하고 "매끄러운" 계단을 만들기가 쉽습니다.
이런 정보가 대중에게는 쉽게 팔릴 수 있지만, 이러한 일반적인 '계단식' 정확도 비유는 디지털 오디오가 실제로 어떻게 작동하는지를 제대로 이해하지 못하는 잘못된 표현입니다. 그냥 무시하십시오.
그러나 이러한 시각적 표현은 오디오의 작동 방식을 잘못 표현하고 있습니다. 지저분해 보일 수 있지만 수학적으로 샘플링 속도의 절반에 해당하는 나이퀴스트 주파수 이하의 데이터는 완벽하게 캡처되어 완벽하게 재생될 수 있습니다. 부드러운 사인파가 아닌 구형파로 표현되는 나이퀴스트 주파수에서도 특정 시점의 진폭에 대한 정확한 데이터만 있으면 충분하다고 생각하면 됩니다. 인간은 종종 샘플 사이의 공간을 잘못 보는 경우가 있지만 디지털 시스템은 같은 방식으로 작동하지 않습니다.
비트 심도는 종종 정확도와 관련이 있지만 실제로는 시스템의 노이즈 성능을 정의합니다. 즉, 감지하거나 재현할 수 있는 가장 작은 신호입니다.
재생의 경우, 설정된 샘플 레이트에서 단순히 값 사이를 전환하여 계단식 결과를 생성하는 "제로 오더 홀드" DAC의 이해하기 쉬운 개념 때문에 조금 더 까다로울 수 있습니다. 이것은 실제로 오디오 DAC의 작동 방식을 공정하게 표현한 것은 아니지만, 이 예제를 통해 계단식 결과물에 대해 걱정할 필요가 없다는 것을 증명할 수 있습니다.
주목해야 할 중요한 사실은 모든 파형은 여러 개의 사인파, 기본 주파수 및 고조파 배수의 추가 구성 요소의 합으로 표현할 수 있다는 것입니다. 삼각파(또는 계단형 스텝)는 진폭이 감소하는 홀수 고조파로 구성됩니다. 따라서 샘플 속도에서 매우 작은 스텝이 많이 발생하면 추가 고조파 콘텐츠가 추가되었다고 말할 수 있지만, 가청(나이퀴스트) 주파수의 두 배에서 발생하고 그 이상의 고조파도 몇 개 있기 때문에 어쨌든 들을 수 없습니다. 게다가 이것은 몇 가지 구성 요소를 사용하여 아주 간단하게 필터링할 수 있습니다.
DAC 샘플을 분리하면 원하는 신호가 DAC 샘플 레이트에서 추가 파형과 함께 완벽하게 표현되는 것을 쉽게 확인할 수 있습니다.
이것이 사실이라면 간단한 실험을 통해 이를 관찰할 수 있을 것입니다. 기본 0차 홀드 DAC에서 바로 출력을 가져와서 샘플 레이트의 절반으로 설정된 매우 간단한 2차 로우 패스 필터를 통해 신호를 공급해 보겠습니다. 여기서는 실제로 오실로스코프에서 출력을 볼 수 있도록 6비트 신호만 사용하였습니다. 16비트 또는 24비트 오디오 파일은 필터링 전과 후 모두 신호의 노이즈가 훨씬 적을 것입니다.
다소 조잡한 예시이지만, 이 지저분해 보이는 계단에서 오디오 데이터가 완벽하게 재현된다는 점을 증명합니다.
그리고 마치 마법처럼 사인파 출력을 방해하지 않는 로우 패스 필터를 사용함으로써 계단 단차가 거의 완전히 사라지고 출력이 "평활화"됩니다. 실제로 우리가 한 일은 어차피 듣지 못했을 신호의 일부를 걸러낸 것뿐입니다. 기본적으로 무료인 4개의 부품(커패시터 2개와 저항 2개는 5펜스(약80원) 미만)을 추가한 것에 비하면 나쁘지 않은 결과이지만, 실제로 이 노이즈를 훨씬 더 줄이기 위해 사용할 수 있는 더 정교한 기술들이 있습니다. 더 좋은 점은 이러한 기술이 대부분의 고품질 DAC에 기본으로 포함되어 있다는 것입니다.
좀 더 현실적인 예를 들자면, 오디오에 사용되는 모든 DAC에는 업샘플링이라고도 하는 보간(Interpolation) 필터가 있습니다. 보간은 두 샘플 사이의 중간 지점을 계산하는 아주 간단한 방법이기 때문에 DAC은 실제로 샘플 레이트를 두 배 또는 네 배로 늘리는 것보다 훨씬 더 많은 "다듬질(smoothing)"을 자체적으로 수행합니다. 더 좋은 점은 파일 공간을 추가로 차지하지 않는다는 점입니다.
모든 DAC에서 흔히 볼 수 있는 Ni 보간 필터는 샘플링 레이트가 더 높은 파일을 가지고 다니는 것보다 훨씬 더 나은 솔루션입니다.
이를 수행하는 방법은 매우 복잡할 수 있지만, 기본적으로 DAC은 오디오 파일의 샘플 주파수가 제시하는 것보다 훨씬 더 자주 출력 값을 변경합니다. 이렇게 하면 들리지 않는 계단식 고조파가 샘플링 주파수 밖으로 밀려나기 때문에 파문이 적은 느리고 쉽게 달성할 수 있는 필터를 사용할 수 있으므로 실제로 듣고 싶은 비트를 보존할 수 있습니다.
왜 우리가 들을 수 없는 이 콘텐츠를 제거하려는지 궁금하다면, 간단한 이유는 이 추가 데이터를 앰프와 같이 신호 경로의 더 아랫쪽에서 재생하면 에너지가 낭비되기 때문입니다. 또한 시스템내의 다른 컴포넌트에 따라 이 고주파 '초음파' 콘텐츠는 대역폭이 제한된 컴포넌트에 의해 실제로 더 많은 양의 상호 변조 왜곡을 유발할 수 있습니다. 따라서 실제로 해당 파일에 초음파 콘텐츠가 포함되어 있다면 192kHz 파일은 득보다 실이 더 많을 수 있습니다.
더 많은 증거가 필요하다면 시러스 로직 CS4272(위 사진)를 사용한 고품질 DAC의 출력도 보여드리겠습니다. CS4272는 보간 섹션과 가파른 내장 출력 필터를 갖추고 있습니다. 이 테스트에서는 마이크로 컨트롤러를 사용하여 DAC에 두 개의 각각 높고 낮은 16비트 샘플을 48kHz로 공급하여 24kHz에서 가능한 최대 출력 파형을 제공합니다. 이 출력은 다른 추가적 필터링 컴포넌트가 사용되지 않은 채 DAC에서 바로 나옵니다.
이 스튜디오급 DAC 컴포넌트의 24kHz 출력 신호(위)는 일반적인 마케팅 자료에서 볼 수 있는 직사각형 파형과는 확실히 다릅니다. 오실로스코프 하단에 샘플 레이트(Fs)가 표시됩니다.
출력 사인파(위쪽)가 주파수 클럭(아래쪽)의 정확히 절반 속도인 것을 확인할 수 있습니다. 눈에 띄는 계단식 계단이 없으며, 이 매우 높은 주파수 파형은 마케팅 자료나 출력 데이터만 봐도 알 수 있듯이 울퉁불퉁한 사각파가 아니라 거의 완벽한 사인파처럼 보입니다. 이는 단 두 개의 샘플로도 나이퀴스트 이론이 실제로 완벽하게 작동하며, 큰 비트 심도나 샘플 레이트 없이도 추가적인 고조파 성분이 없는 순수한 사인파를 재현할 수 있음을 보여줍니다.
32비트와 192kHz에 대한 진실
대부분의 일이 그렇듯이 전문 용어 뒤에 숨은 진실이 있으며, 32비트 192kHz 오디오는 여러분의 손안에 없을 뿐이지 실제적으로 사용할 수 있는 것입니다. 이러한 디지털 속성은 실제로 스튜디오 환경에 있을 때 유용하기 때문에 "스튜디오 품질의 오디오를 모바일로 가져온다"는 주장이 나오지만, 완성된 트랙을 주머니에 넣고 다니고 싶을 때는 이러한 규칙이 적용되지 않습니다.
먼저 샘플 레이트부터 살펴봅시다. 고해상도 오디오의 장점 중 하나는 들리지는 않지만 음악에 영향을 미치는 초음파 데이터를 보존할 수 있다는 것입니다. 하지만 대부분의 악기는 우리 청각의 주파수 한계보다 훨씬 전에 끊기고, 공간을 포착하는 데 사용되는 마이크는 기껏해야 20kHz 정도에서 롤오프가 일어나며, 사용 중인 헤드폰도 그렇게 높이까지 확장되지 않습니다. 설령 그 정도까지 도달한다고 해도 귀는 이를 감지할 수 없습니다.
Antonine Education 일반적인 사람의 청각 감도는 3kHz에서 정점을 찍고 16kHz 이후부터 빠르게 떨어지기 시작합니다.
그러나 192kHz 샘플링은 (다시 한번 강조하지만) 데이터를 샘플링할 때 노이즈를 줄이는 데 매우 유용하고, 필수 입력 필터를 더 간단하게 구성할 수 있으며, 고속 디지털 효과에도 중요합니다. 가청 스펙트럼을 초과하는 오버샘플링을 통해 신호를 평균화하여 노이즈 플로어를 낮출 수 있습니다. 요즘 대부분의 우수한 ADC(아날로그-디지털 컨버터)에는 64비트 이상의 오버샘플링이 내장되어 있습니다.
또한 모든 ADC는 나이퀴스트 한계를 초과하는 주파수를 제거해야 하며, 그렇지 않으면 더 높은 주파수가 가청 스펙트럼으로 '아래로 접혀서' 끔찍한 에일리어싱이 발생하게 됩니다. 20kHz 필터 코너 주파수와 최대 샘플 레이트 사이에 더 큰 간격이 있으면 이론상으로 필요한 필터만큼 가파르고 안정적일 수 없는 현실 세계의 필터에 더 잘 맞습니다. DAC 단에서도 마찬가지이지만, 앞서 설명한 대로 상호 변조를 사용하면 이 노이즈를 더 높은 주파수로 효과적으로 밀어올려 필터링을 쉽게 할 수 있습니다.
필터가 가파를수록 통과 대역에 더 많은 파문이 발생합니다. 샘플 레이트를 높이면 "더 느린" 필터를 사용할 수 있으므로 가청 통과 대역의 주파수 응답을 평탄하게 유지하는 데 도움이 됩니다.
디지털 영역에서는 스튜디오 믹싱 프로세스에서 자주 사용되는 필터에도 유사한 규칙이 적용됩니다. 샘플 레이트가 높을수록 제대로 작동하기 위해서는 추가적인 데이터가 필요한 더 가파르고 빠르게 작동하는 필터를 사용할 수 있습니다. 재생 및 DAC의 경우 실제로 들을 수 있는 것에만 관심이 있기 때문에 이 모든 것이 필요하지 않습니다.
32비트로 넘어가서 조금이라도 복잡한 수학을 코딩해 본 사람이라면 정수 데이터와 부동 소수점 데이터 모두에서 비트 심도가 얼마나 중요한지 이해할 수 있을 것입니다. 앞서 설명했듯이 비트가 많을수록 노이즈가 줄어들며, 이는 디지털 영역에서 신호를 나누거나 뺄 때 반올림 오류를 방지하고 곱하거나 더할 때 클리핑 오류를 피하기 위해 더욱 중요해집니다.
추가 비트 심도는 스튜디오 오디오 소프트웨어 내부에서와 같이 수학적 연산을 수행할 때 신호의 무결성을 보존하는 데 중요합니다. 하지만 마스터링이 끝나면 이 추가 데이터를 버릴 수 있습니다
예를 들어 4비트 샘플을 가져왔는데 현재 샘플이 13이고 바이너리로 환산하면 1101이라고 가정해 봅시다. 이제 이를 4로 나누려고 하면 0011, 즉 3이 남습니다. 추가적인 계산을 하거나 신호를 다시 아날로그 파형으로 바꾸려고 하면 약 ¼이 손실되어 오류가 발생합니다.
이러한 반올림 오류는 아주 작은 양의 왜곡이나 노이즈로 나타나며, 수차례의 수학적 계산을 통하여 누적될 수 있습니다. 하지만 이 4비트 샘플을 소인수 또는 소수점으로 사용할 추가 비트 정보로 확장하면 추가 데이터 포인트 덕분에 훨씬 더 오랫동안 나누기, 더하기, 곱하기를 계속할 수 있습니다. 따라서 실제 환경에서는 16비트 또는 24비트로 샘플링한 다음 이 데이터를 32비트 형식으로 변환하여 다시 처리하면 노이즈와 왜곡을 줄이는 데 도움이 됩니다. 이미 언급했듯이 32비트는 정확도가 엄청나게 높습니다.
이제 마찬가지로 인식해야 할 중요한 점은 아날로그 영역으로 돌아왔을 때 이러한 추가 헤드룸이 필요하지 않다는 것입니다. 이미 논의했듯이, 약 20비트 데이터(노이즈 -120dB)가 감지할 수 있는 절대 최대치이므로 '오디오 애호가'들은 데이터 손실에 대해 한탄하겠지만, 오디오 품질에 영향을 주지 않으면서도 더 합리적인 파일 크기로 다시 변환할 수 있습니다.
하지만 더 낮은 비트 심도로 이동하면 필연적으로 반올림 오류가 발생하고 이러한 오류가 항상 무작위로 발생하는 것은 아니므로 항상 약간의 추가 왜곡이 있을 수 있습니다. 24비트 오디오는 이미 아날로그 노이즈 플로어를 훨씬 뛰어넘기 때문에 이 문제가 발생하지 않지만, 16비트 파일에서는 '디더링'이라는 기술을 통해 이 문제를 깔끔하게 해결할 수 있습니다.
위키피디아 끊음(truncation)과 디더링으로 인한 왜곡을 비교한 예시
디더링은 오디오 샘플의 최하위 비트를 무작위로 추출하여 왜곡 오류를 제거하지만, 주파수에 걸쳐 퍼져 있는 매우 조용한 무작위 배경 노이즈를 도입하는 방식으로 수행됩니다. 노이즈를 도입하는 것이 직관적이지 않은 것처럼 보일 수 있지만, 실제로는 무작위성 때문에 가청 왜곡의 양이 줄어듭니다. 또한 16비트 디더링 오디오는 사람의 귀의 주파수 응답을 악용하는 특수한 노이즈 모양의 디더링 패턴을 사용하여 실제로 우리의 인지 한계에 해당하는 120dB에 매우 근접한 노이즈 플로어를 유지할 수 있습니다.
Shutterstock 32비트 데이터와 192kHz 샘플 레이트는 스튜디오에서 주목할 만한 이점을 제공하지만, 재생 시에는 동일한 규칙이 적용되지 않습니다.
간단히 말해, 스튜디오에서 고해상도 콘텐츠로 하드 드라이브를 꽉 채우더라도 고품질 재생에 있어서는 불필요한 데이터가 모두 필요하지는 않습니다.
결론
이 글을 스마트폰 오디오 구성 요소를 개선하기 위한 노력을 완전히 무시하는 것으로 해석하지 마시기 바랍니다. 숫자로 선전하는 것은 쓸모가 없을 수 있지만 고품질 부품과 더 나은 회로 설계는 여전히 모바일 시장에서 훌륭한 발전이며 제조업체가 올바른 것에 관심을 집중해야 할 필요가 있습니다. 예를 들어, LG V10의 32비트 DAC은 놀라운 사운드를 제공하지만, 이를 활용하기 위해 대용량 오디오 파일 크기에 신경 쓸 필요는 없습니다.
낮은 임피던스의 헤드폰을 구동하고, DAC에서 잭까지 낮은 노이즈 플로어를 유지하며, 왜곡을 최소화하는 기능은 이론적으로 지원되는 비트 심도나 샘플 레이트보다 스마트폰 오디오에서 훨씬 더 중요한 특성이며, 앞으로 이러한 점에 대해 더 자세히 살펴볼 수 있기를 바랍니다.
'OneKey 메모장' 카테고리의 다른 글
미국의 하이파이쇼 (1) | 2024.12.01 |
---|---|
2024년 11월 30일 실텍 마스터 크라운 런칭 행사 - 소리샵 (3) | 2024.11.30 |
[스테레오파일] 그라모폰 드림스: 소름, 눈물, 웃음 (5) | 2024.11.30 |
[Audiodraft] 오디오 레벨 101 - LUFS만 알면 되죠! (2) | 2024.11.30 |
[Roon 지식베이스] 다이내믹 레인지 (1) | 2024.11.30 |