https://cafe.naver.com/hfi/192
본문은 모조 오디오라는 R2R 래더 DAC을 제작하는 업체의 대표인 벤자민 즈윅켈씨가 쓴 글입니다. 여기에서 이야기 하는 델타시그마 DAC은 일반적으로 "델타시그마"라고 이야기 하는 단일비트 델타시그마 DAC을 이야기 하는 것으로서 링 DAC과 같이 멀티비트(혹은 와이드비트) 델타시그마 DAC과는 약간 다릅니다. 링 DAC에 관해서는 dCS의 기술 백서의 번역본을 보시면 되겠습니다: https://cafe.naver.com/hfi/172
DSD 대 PCM: 신화 대 진실
2023년 5월 26일 - 벤자민 즈윅켈
출처: Mojo Audio
업데이트: 21년 7월 26일
서문:
다이렉트 스트림 디지털(DSD)은 하이엔드 디지털 오디오의 대세로 자리 잡았습니다. 간소화된 인코딩 및 디코딩과 초고음질 샘플링 주파수는 비교할 수 없는 성능을 약속합니다. 이것이 우리 모두가 기다려온 것일까요, 아니면 대중 마케팅의 과대광고일까요? 이 블로그에서는 과대광고와 기술적 사실을 구분해보겠습니다. DSD의 장점은 무엇이고 펄스 코드 변조(PCM)가 어떤 면에서 더 나은지 설명하겠습니다.
오디오 애호가 업계의 마케팅 과대광고, 신화, 전설과 모순되는 이 블로그의 내용을 믿어야 할지 잘 모르시겠다면 블로그 말미에 있는 참고 문헌을 확인해 보십시오.
또한 "24비트 착각"이라는 저의 다른 블로그도 참조하실 수 있습니다. (주: 제가 여태까지 올리던 글과 비슷하여 생략합니다! ㅎ)
간략한 역사:
1857년, 에두아르-레옹 스콧 드 마르탱빌은 음파를 그래프로 기록할 수 있는 축음기를 발명하였습니다. 1877년 초, 찰스 크로스는 사진 판화에 이 과정을 역으로 적용하여 스타일러스로 추적할 수 있는 홈을 만들어 진동이 진동판에 전달되어 음파를 재현하는 방법을 고안하였습니다.
1877년 말, 토마스 에디슨은 크로스의 이론을 바탕으로 실린더 축음기를 발명하여 음악 애호가들이 처음으로 가정에서 녹음된 음악을 경험할 수 있게 하였습니다. 현대적 실린더 축음기를 상상할 수 있나요? 탄젠셜 트래킹(접선 추적)에 아크(원호) 오류나 스케이팅 오류가 전혀 없는 완벽한 개념이었습니다.
마케팅 팀이 더 작고 더 싼 제품을 원한다고 보고한 직후의 에디슨 (출처: Mojo Audio)
1887년, 에밀 베를리너는 기술적으로 열등한 디스크 축음기를 발명하였습니다. 디스크가 휘어지기도 하고 아크 오류와 스케이팅 오류가 발생하였습니다. 물론 탄젠셜 트래킹 방식의 에디슨 실린더 플레이어와 비교할 수는 없습니다.
하지만 디스크는 실린더보다 생산 비용이 훨씬 저렴하고, 매장 진열대에 잘 맞고 더 큰 커버 아트와 메모를 넣을 수 있었기 때문에 디스크가 표준이 되었습니다. 그렇게 해서 최적의 음질보다는 소비자의 편의와 최적의 수익에 더 중점을 둔 음반 산업의 오랜 역사가 시작되었습니다.
디지털 혁명도 다르지 않았습니다. 필립스와 소니는 1979년 소비자 디지털 형식의 새로운 표준을 위해 협력하였습니다. 필립스는 20cm 디스크를 원했지만 소니는 더 작은 휴대용 장치에서 재생할 수 있는 12cm 디스크를 고집하였습니다. 1980년 레드북 CD-DA 표준을 발표하면서 대중적인 디지털 음악이 탄생하였습니다. 디지털 초창기 음반 업계의 많은 사람들은 CD가 “절충해서 나온 디스크, Compromised Disc"의 약자라고 농담하였습니다.
1980년대 초, 디지털 레코딩을 쉽게 사용할 수 있게 되자 스튜디오는 비용을 절감하기 위해 아날로그에서 디지털로 전환하였습니다. 스튜디오 입장에서는 장비 비용이 적게 들고, 녹음과 보관을 위한 공간이 적게 필요하며, 포스트 프로덕션에서 트랙을 믹싱하고 편집하기가 더 쉬워졌습니다. 소비자에게는 이점이 많지 않았습니다. 대부분의 초기 디지털 레코딩은 상대적으로 낮은 해상도로 제작되어 귀를 찢어내고 싶을 정도로 피곤한 소리를 내었습니다.
소니 PCM-7030: 초기 스튜디오용 PCM 녹음기 중 한 제품 (출처: Mojo Audio)
PCM에서 DSD로의 전환도 마찬가지였습니다. 1990년대 초 소니는 아날로그 마스터를 보관할 미래지향적이고 저렴한 매체를 원하였습니다. 1995년 소니는 1비트 신호를 아날로그에서 디지털로 직접 저장하면 상상할 수 있는 모든 소비자 디지털 형식으로 출력할 수 있다는 결론을 내렸습니다(😂 나중에 소니가 이 결정으로 어떻게 실수했는지 설명하겠습니다). 이 새로운 1비트 기술은 크리스탈의 새로운 1비트 2.8Mhz 비트 스트림 DAC 칩의 모니터링 핀에서 출력하는 방식으로 구현되었습니다.
이후 소니의 소비자 사업부는 DSD에 주목하고 필립스와 협력하여 SACD 형식을 만들었습니다. 물론 SACD가 구상될 때부터 시장에 출시될 때까지 DAC 칩 제조업체들은 64fs에서 더 높은 128fs 샘플링 레이트(일명 더블 레이트 DSD)로, 1비트에서 더 높은 해상도의 5비트 와이드-DSD 형식으로 발전해 왔습니다. 만약 SACD 형식이 DSD64 대신 DSD128, 1비트 대신 5비트였다면 성능에 큰 차이가 있었을 것입니다. 안타깝습니다.
DVD, SACD 또는 DSD 형식이 개발되기 훨씬 전에 훨씬 더 비싼 R-2R 멀티비트 DAC 칩의 저렴한 대안으로 비트 스트림 DAC 칩이 소비자 시장에 소개되었습니다. 비트 스트림 DAC 칩에는 PCM 입력을 DSD로 변환한 다음 아날로그로 변환하는 알고리즘이 내장되어 있습니다. 다시 한번 말하지만, 그 결과 충실도를 희생하는 대신 엄청난 비용을 절감할 수 있었습니다.
비디오 형식에 내장된 최신 7.1채널 오디오를 개발할 수 있었던 것도 비트 스트림 DAC 기술 덕분이었습니다. 또한 전자제품 제조업체들이 70달러 미만의 저렴한 파워 서플라이(전원 공급 장치)를 갖춘 소형 섀시의 DVD 플레이어를 출시할 수 있게 되었습니다. 다시 한번 오디오 순수주의자들에게 기회는 주어지지 않았던 것입니다.
반면 멀티비트 R-2R DAC 칩은 싱글비트 DAC 칩보다 제조 비용이 훨씬 더 많이 들 뿐만 아니라 훨씬 더 크고 정교한 파워 서플라이가 필요합니다. 7.1채널 R-2R 멀티 디스크 플레이어를 만들려면 비트 스트림 기술 가격의 몇 배에 달하는 비용이 들고 크기도 몇 배나 커집니다. 일반 소비자들이 원하는 것은 분명 아닙니다.
요약하자면, 음반 업계는 오디오 순수주의자들을 희생시키면서까지 수익과 대중의 관심을 극대화하기 위한 결정을 거듭해 왔습니다. 여기까지 역사 수업이었습니다.
DSD 대 PCM 기술:
PCM 녹음은 16비트 또는 24비트, 44.1KHz에서 최대 192KHz까지 다양한 샘플링 레이트로 시판되고 있습니다. (주: 현재는 DXD형식인 24비트 384까지 가능) 가장 일반적인 형식은 44.1KHz로 샘플링된 16비트의 레드북 CD입니다. DSD 녹음은 샘플 레이트 2.8224MHz의 1비트로 시판되고 있습니다. 이 형식은 SACD에 사용되며 DSD64 또는 싱글 레이트 DSD라고도 합니다.
나중에 설명할 5비트~8비트 델타-시그마 디코딩을 사용하는 와이드-DSD 형식뿐만 아니라 DSD128, DSD256, DSD512와 같은 보다 최신의 고해상도 1비트 DSD 형식도 있습니다. 이러한 형식은 레코딩 스튜디오를 위해 만들어졌으며 시중에서 판매되는 레코딩 중 극히 일부에 불과합니다.
DSD와 PCM의 해상도를 직접 비교할 수는 없지만, 여러 전문가들이 시도해 보았습니다. 한 가지 추정에 따르면 1비트 2.8224MHz DSD64 SACD의 해상도는 20비트 96KHz PCM과 비슷하다고 합니다. 또 다른 추정치는 1비트 2.8224MHz DSD64 SACD가 20비트 141.12KHz PCM 또는 24비트 117.6KHz PCM과 같다는 것입니다.
다시 말해, DSD64 SACD는 16비트 44.1KHz 레드북 CD보다 해상도가 훨씬 높고, 24비트 88.2KHz PCM 레코딩과 해상도가 거의 같으며, 24비트 176.4KHz PCM 레코딩만큼 해상도가 높지 않습니다.
DSD와 PCM은 모두 "양자화"되어 있으며, 이는 아날로그 신호에 근접하도록 숫자 값이 설정되어 있음을 의미합니다. DSD와 PCM 모두 양자화 오류가 있습니다. DSD와 PCM 모두 선형성 오류가 있습니다. 그리고 DSD와 PCM 모두 출력 단계에서 필터링이 필요한 양자화 노이즈가 있습니다. 다시 말해, 어느 쪽도 완벽하지 않습니다.
PCM은 일정한 간격으로 샘플링된 아날로그 신호의 진폭을 인코딩하며(그래프 용지처럼), 각 샘플은 디지털 스텝 범위 내에서 가장 가까운 값으로 양자화됩니다. 스텝의 범위는 레코딩의 비트 심도를 기준으로 합니다. 16비트 레코딩은 65,536스텝, 20비트 레코딩은 1,048,576스텝, 24비트 레코딩은 16,777,216스텝을 갖습니다.
양자화에 사용되는 비트가 많거나 샘플링 레이트가 높을수록 이론적 해상도가 높아집니다. 따라서 16비트 44.1KHz 레드북 CD는 초당 28,901,376개의 샘플링 포인트(44,100 x 65,536)가 있습니다. 그리고 24비트 192KHz 레코딩은 초당 32,212,254,000,000개의 샘플링 포인트가 있습니다(192,000 x 16,777,216). 즉, 24비트 192KHz 레코딩은 16비트 44.1KHz 레코딩의 이론적 해상도보다 111,455배 이상 높습니다. 작은 차이가 아닙니다.
그렇다면 왜 HD 녹음이 동일한 마스터로 만든 16비트 44.1KHz 레코딩보다 약간만 더 나은 사운드를 내는 것일까요? 이 블로그의 뒷부분에서 이론적 해상도와 실제 해상도의 차이에 대해 설명하겠습니다.
DSD는 2.8224MHz의 샘플링 레이트에서 단일 비트 값의 시퀀스인 펄스 밀도 변조를 사용하여 음악을 인코딩합니다. 이는 레드북 CD 샘플링 레이트인 44.1KHz의 64배에 해당하지만, 16비트 해상도의 32,768분의 1에 불과합니다.
출처: Mojo Audio
위의 도표에서 PCM을 이중 축 양자화, DSD를 단일 축 양자화로 표현한 것을 보면 왜 DSD 재생의 정확도가 PCM보다 클럭의 정확도에 훨씬 더 크게 좌우되는지 알 수 있습니다. 물론 각 비트의 전압 정확도는 DSD에서 PCM만큼이나 중요하므로 두 유형의 컨버터 모두에서 기준 전압의 조절이 똑같이 중요합니다.
물론 상용 DSD64 SACD 및 16비트 44.1KHz PCM 레코딩의 몇 배에 달하는 해상도에서 이루어지는 레코딩 과정에서의 클럭킹 정확도는 재생 중 DSD나 PCM의 클럭킹 정확도보다 훨씬 더 중요합니다.
샘플링 레이트가 5.6448MHz인 DSD128(일명 더블 레이트 DSD), 샘플링 레이트가 11.2896MHz인 DSD256(일명 쿼드 레이트 DSD), 샘플링 레이트가 22.5792MHz인 DSD512(일명 옥튜플 레이트 DSD)와 같이 더 높은 샘플링 레이트를 사용하는 다른 DSD 형식도 있습니다. 또한 대부분의 최신 A-D 및 D-A 델타 시그마 컨버터는 5비트~8비트 디코딩을 병렬로 수행하는 멀티비트 와이드-DSD를 지원합니다. 이러한 고해상도 DSD 형식은 모두 일반 소비자용이 아닌 스튜디오용으로 고안되었지만, 일부 잘 알려지지 않은 회사에서 이러한 형식의 레코딩을 판매하고 있습니다.
더블, 쿼드, 옥튜플 DSD는 44.1KHz 배수와 48KHz 배수의 샘플 레이트를 100% 동일하게 분할하여 DSD64 SACD와 44.1KHz 레드북(모두 44.1KHz 배수) 또는 96KHz와 192KHz 고음질 PCM 형식(모두 48KHz 배수)으로 변환할 수 있다는 점에 유의하십시오.
물론 스튜디오에서 48KHz 멀티 형식을 44.1KHz 멀티 형식으로 변환하거나 그 반대로 변환하는 경우 양자화 오류가 발생합니다. 안타깝게도 90년대 중반 소니와 다른 회사에서 아날로그 마스터를 아카이브하는 데 사용한 것과 같이 DSD64 마스터에서 파생된 리마스터링된 24비트 192KHz HD 버전으로 출시되는 오래된 레코딩의 경우 종종 이런 문제가 발생합니다. DSD64 마스터에서 생성할 수 있는 최적의 HD PCM 형식은 24비트 88.2KHz입니다. 88.2KHz를 초과하거나 48KHz로 똑같이 나눌 수 있는 샘플링 레이트는 보간(interpolation)을 해야 합니다(좋지 않음). 하지만 소비자들은 예전부터 즐겨 듣던 모든 음원의 24비트 192KHz 버전을 요구하기 때문에 기업들은 이러한 결과를 알면서도 이를 제공합니다.
문제점:
양자화 오류, 양자화 노이즈, 비선형성이라는 세 가지 주요 영역에서 PCM과 DSD 모두 완벽하지 못합니다.
양자화 오류는 여러 가지 방식으로 발생할 수 있습니다. 디지털 레코딩 초기에 가장 흔했던 방식은 해상도가 너무 낮은 것과 관련이 있습니다. 그래프 종이의 교차점을 생각해보십시오. 비트의 분수 단위로 정량화할 수 없고, 샘플링 레이트의 분수 단위로 정량화할 수도 없습니다. 비트 심도와 샘플링 레이트의 교차점에 해당하는 값으로만 양자화할 수 있습니다. 아날로그 신호의 값이 두 양자화 값 사이에 떨어지면 디지털 레코딩은 음량을 낮추거나 높이거나 주파수를 느리게 또는 빠르게 재생하여 원곡의 시간, 조율, 진폭을 왜곡하게 됩니다. 이로 인해 종종 부자연스럽고 이상한 고조파가 발생하여 초기 디지털 레코딩과 관련된 딱딱하고 피곤한 사운드가 만들어집니다. 아래 의 도표에서 파란색 실선은 실제 음악 파동을 나타내고 검은색 점은 가장 가까운 양자화 값을 나타냅니다.
양자화 오류 (출처: Mojo Audio)
최신 샘플링 레이트는 사람의 귀를 속일 수 있을 만큼 높지만, 한 형식에서 다른 형식으로 변환할 때 양자화 오류가 여전히 발생합니다. 예를 들어, 1995년 소니가 아날로그 마스터 라이브러리를 DSD64로 아카이브하기로 결정했을 때, 이러한 마스터가 미래에 대비하고 모든 소비자 형식을 재생할 수 있을 것이라고 믿었던 것은 잘못된 생각이었습니다. 사실 이 마스터들은 44.1KHz로 나눌 수 있는 형식만 제대로 재생할 수 있었습니다. 따라서 DSD64 마스터 파일로 만든 최신 96KHz 또는 192KHz 레코딩에는 양자화 오류가 있습니다.
이것은 제가 음반 엔터테인먼트 산업에 대해 분노하는 많은 것들 중 하나로 이어집니다. 44.1KHz가 덜 중요한 오디오 주파수에서 에일리어싱 오류가 발생하도록 설계된 표준이라면, 왜 48KHz의 배수를 사용하기 시작했을까요?!!!!!?? 최신 HD 소비자 형식으로 88.2KHz와 176.4KHz를 사용하기만 했어도 이 모든 혼란을 피할 수 있었을 것입니다. 그들은 24비트 352.8KHz 스튜디오 형식인 DXD를 44.1KHz로 똑같이 나눌 수 있게 만들었습니다. 도대체 어떤 멍청이가 96KHz와 192KHz HD 오디오 작업에 렌치를 꽂기로 결정한 걸까요?!!!?!??
48KHz 배수의 실제 이유는 비디오에 대한 최적의 동기화와 관련이 있습니다. 따라서 DVD와 블루레이의 7.1채널 오디오에 내장된 24비트 96KHz 형식과 같이 48KHz 배수로 녹음된 영화의 사운드 트랙을 사용하는 것이 합리적입니다. 그러나 전체 음악 레코딩의 90% 이상이 레드북 CD 또는 DSD64 SACD용 44.1KHz로 판매되고 있기 때문에 최적의 88.2KHz 및 176.4KHz HD 형식이 아닌 96KHz 또는 192KHz의 HD 음악을 제공하는 것은 다소 우스운 일입니다. 하지만 순진한 소비자들은 샘플링 레이트가 높을수록 충실도가 높아진다고 잘못 믿기 때문에 192Khz가 176.4KHz보다 낫다고 잘못 믿고 192Khz를 요구하고, 음반 회사들은 그렇게 마케팅합니다.
양자화 노이즈는 피할 수 없습니다. 어떤 형식으로 디지털화하든 초음파 흔적이 생성됩니다. 비트 수가 많을수록 노이즈 플로어가 낮아집니다. 노이즈 플로어는 각 비트마다 약 6db씩 낮아집니다. 따라서 상상할 수 있듯이 1비트 DSD는 16비트 PCM보다 훨씬 더 많은 초음파 노이즈가 있습니다. 이것이 바로 5비트~8비트 병렬 델타-시그마 디코딩을 사용하는 와이드-DSD 형식이 만들어진 이유 중 하나입니다. PCM을 사용하면 샘플링 주파수에서 상당한 노이즈를 처리해야 합니다. 이것이 바로 소니와 필립스가 인간의 고주파 청각 한계인 20KHz의 두 배가 넘는 44.1KHz에서 샘플링하도록 레드북 CD를 설계한 이유입니다.
PCM 레코딩의 샘플링 주파수 주변에는 양자화 노이즈가 존재하기 때문에 44.1KHz 레코딩에는 인간의 청각 한계인 20KHz보다 1옥타브 높은 양자화 노이즈가 있습니다. 이 양자화 노이즈는 필터링해야 하므로 모든 DAC에는 출력에 로우패스(저역통과) 필터가 있습니다. 양자화 노이즈는 가청 주파수보다 1옥타브만 높기 때문에 필터의 기울기가 매우 가파르기 때문에 바람직한 고주파를 걸러내지 못합니다. 이러한 가파른 경사의 로우패스 디지털 필터는 일반적으로 "장벽(Brick Wall)" 필터로 알려져 있습니다. 그렇기 때문에 88.2KHz 또는 176.4KHz로 업샘플링된 44.1KHz PCM을 재생할 때 이점이 있을 수 있습니다.
"장벽" 필터가 초기 레드북 CD 플레이어의 최상단에서 음 왜곡을 일으킨다는 이야기를 많이 듣지만, 사실 이는 초기 레드북 CD와 플레이어의 최상단 사운드가 부자연스러웠던 이유 중 일부에 불과합니다. 초기 디지털에서 딱딱하고 거칠고 부자연스럽게 들리는 고음역대의 대부분은 "장벽" 필터가 아니라 파워 서플라이의 결함이나 녹음 과정의 결함과 더 관련이 있었습니다.
거품을 터뜨려서 미안하지만, 많은 오디오 애호가들의 생각과는 달리 어렸을 때 20KHz 이상의 소리를 들을 수 있는 사람은 천 명 중 한 명도 안 되며, 40세 이상에서 15KHz 이상의 소리를 들을 수 있는 사람은 거의 없습니다.
물론 DSD64는 또 다른 이야기입니다. 25KHz 이상에서는 양자화 노이즈가 급격히 증가하여 훨씬 더 정교한 필터 및/또는 노이즈 쉐이핑(형성) 알고리즘이 필요합니다. 아래의 도표를 참조하십시오. 단순한 로우패스 필터로 DSD64의 출력을 필터링하면 위상/시간이 왜곡되고 가청 범위에서 다소 지저분한 흔적이 발생합니다. 해결책은 노이즈를 덜 가청적인 주파수로 이동 및/또는 더 높은 샘플링 레이트를 이용하는 노이즈 쉐이핑 알고리즘입니다. 이것이 바로 더블 레이트 DSD와 쿼드 레이트 DSD 형식이 탄생한 이유입니다. JRiver와 같은 고급 재생 소프트웨어가 더블 레이트 DSD 출력을 제공하는 이유이기도 합니다. DSD64를 DSD128 또는 DSD256으로 업샘플링하는 재생 소프트웨어를 사용하면 디지털 흔적을 가청 범위보다 높은 옥타브에 배치하여 고급 노이즈 쉐이핑 알고리즘과 덜 엄격한 디지털 필터를 사용할 수 있어 성능이 크게 향상됩니다. 이러한 매우 높은 샘플링 주파수 때문에 PCM 레코딩보다 DSD 재생에서 초정밀 클럭킹이 더 중요하다는 점에 유의하십시오.
DSD 노이즈는 25KHz이상에서 급격히 증가함 (출처: Mojo Audio)
지터는 부정확한 클럭킹으로 인해 발생하는 재생 주파수의 불일치로 정의됩니다. 그 결과는 음악의 시간과 곡조의 왜곡으로 관찰할 수 있습니다. 종종 주파수의 불일치 패턴으로 인해 부자연스러운 홀수 고조파 주파수를 갖는 아날로그 파형이 발생할 수 있습니다. 이로 인해 흔히 "디지털 통증(digititis)"으로 알려진 피곤한 특성이 발생합니다. 아래 두 도표를 참고하십시오: 지터는 수평 시간 축의 불일치이고, 비선형성은 수직 진폭 축의 불일치입니다.
좌: 지터 오류와 우: 비선형 오류 (주: 왜곡) (출처: Mojo Audio)
지터는 컨버터의 클럭 속도가 일정하지 않을 때 발생하고 비선형성은 컨버터의 기준 전압이 일정하지 않을 때 발생할 수 있습니다. 이것이 바로 "슈퍼 클럭"과 "펨토 클럭"에 대해 많이 듣는 이유입니다. 클럭이 정확할수록 아날로그 출력도 더 정확해집니다. 모조 오디오의 미스틱과 같은 초고성능 R-2R DAC이 선형성을 최적화하기 위해 제로 크로싱에서 최상위 비트(MSB)의 전압을 조정하는 방법을 사용하는 것도 이 때문입니다.
순수 DSD의 신화:
마케팅의 과대 광고에도 불구하고 소비자가 사용할 수 있는 순수 DSD 음원은 거의 없습니다. 이는 부분적으로는 최근까지 DSD 파일을 편집, 믹싱, 마스터링할 수 있는 방법이 없었기 때문입니다. 따라서 상업적으로 이용 가능한 대부분의 순수 DSD 녹음은 포스트 프로덕션 없이 DSD로 직접 녹음한 것입니다. DSD로 편집, 믹싱, 마스터링할 수 있는 새로운 스튜디오 소프트웨어 패키지가 몇 가지 있지만, 업계에서는 매우 드물고 대부분 소규모 부티크 레코딩 회사에서 사용합니다. 실제로 대부분의 DSD 녹음은 PCM으로 편집, 믹스, 마스터링한 다음 다시 DSD로 변환합니다. 아래에서 볼 수 있는 마케팅 과대 광고의 DSD 흐름도는 이론상으로는 거의 존재하지 않습니다. 어쩌면 좋죠?... 비밀이 밖으로 샜습니다!
다이렉트 투 DSD 흐름도(출처: Mojo Audio)
순수 디지털 DSD 레코딩에는 여러 세대와 수준의 품질이 있습니다. 가장 낮은 음질은 오래된 PCM 마스터로 만든 DSD 레코딩입니다. 이러한 PCM 마스터의 대부분은 해상도가 낮을 뿐만 아니라 양자화 오류가 현저히 높고 선형성이 최신 PCM 레코딩보다 낮습니다. 원본 마스터보다 더 좋은 음질을 얻을 수 없기 때문에, 이러한 DSD 레코딩은 원본 저해상도 PCM 마스터와 비슷하거나 더 나쁘게 들립니다. 가장 순수한 DSD 레코딩은 5비트에서 8비트까지 병렬 델타 시그마 인코딩인 5비트~8비트 와이드-DSD로 레코딩된 최신 DSD 마스터에서 나옵니다.
일반적인 DSD 녹음작업 흐름도
위의 흐름도에서 볼 수 있듯이, 시중에서 판매되는 대부분의 DSD 레코딩은 포스트 프로덕션 편집, 믹싱, 마스터링을 위해 PCM 형식으로 앞뒤로 변환해야 합니다. 이러한 각 변환 과정에서 더 많은 양자화 노이즈 및/또는 양자화 오류가 레코딩에 추가됩니다. 그렇기 때문에 샘플링 레이트가 엄청나게 높은 24비트 및 와이드-DSD 형식을 만들었습니다. 편집, 믹싱, 마스터링 과정에서 해상도가 높을수록 이러한 레코딩을 상용 형식으로 다운샘플링할 때 가청 스펙트럼의 디지털 노이즈가 낮아집니다.
현재 편집, 믹싱, 마스터링에 Wide-DSD를 사용하고 있는 레코딩 스튜디오 중 일부 또는 다수가 진정한 DSD로 편집, 믹싱, 마스터링할 수 있는 소프트웨어로 업그레이드할 가능성은 거의 없으며, DSD는 사실상 사용되지 않는 형식이기 때문입니다. 심지어 소니도 더 이상 DSD와 SACD를 지원하지 않습니다. 레코딩 스튜디오가 업그레이드할 최신 형식은 24비트 88.2KHz와 같은 PCM 형식으로 디코딩하고 스트리밍을 위해 DSD나 PCM보다 훨씬 더 잘 압축하는 MQA가 될 가능성이 높습니다. 그렇기 때문에 코부즈 및 타이달과 같은 HD 음악 스트리밍 서비스가 울트라 HD 선곡을 위해 MQA로 전환하고 있습니다. 따라서 MQA 압축의 발명과 함께 PCM은 빠르게 선호되는 HD 음악 형식이 되고 있습니다.
DSD와 PCM에 대한 또 다른 일반적인 마케팅 속설은 DSD와 PCM을 비교하는 블라인드 리스닝 테스트를 실시했을 때 PCM은 음질이 피로하고 DSD는 아날로그적인 음질이 더 좋다는 합의가 있었다는 것입니다. 이는 완전한 마케팅 사기극으로 판명되었습니다. 마케팅의 거짓말이 지속된 한 가지 방법은 동일한 디스크에 DSD64와 16비트 44.1KHz PCM이 있는 하이브리드 SACD였습니다. DSD64 트랙은 16비트 44.1KHz 트랙보다 해상도가 30배 이상 높기 때문에 비교를 통해 DSD가 PCM보다 더 나은 사운드를 낼 수 있었습니다. 사실 최근의 블라인드 연구에서 고해상도 PCM과 DSD는 통계적으로 서로 구별할 수 없다는 것이 입증되었습니다. 거의 모든 DSD 레코딩이 PCM으로 편집, 믹싱, 마스터링된다는 점을 고려하면 당연한 결과입니다.
그리고 DAC 칩의 작동 방식에도 차이가 있습니다. 대부분의 최신 DAC 칩은 네이티브 DSD를 디코딩하는 델타 시그마 방식입니다. R-2R DAC 칩은 네이티브 PCM을 디코딩합니다. 델타-시그마 DAC에서 PCM 파일을 재생하거나 R-2R DAC에서 DSD 파일을 재생하려면 파일을 실시간으로 변환해야 합니다.
대부분의 최신 델타 시그마 DAC 칩은 PCM, DSD, Wide-DSD를 포함한 여러 파일 형식을 디코딩할 수 있습니다. 델타 시그마 DAC 칩은 PCM을 디코딩할 때 먼저 칩의 기본 형식인 DSD로 변환해야 합니다. DSD가 PCM보다 성능이 좋다는 일반적인 오해의 또 다른 이유는 네이티브 DSD 델타-시그마 DAC에 내장된 실시간 PCM-DSD 컨버터의 품질이 좋지 않기 때문입니다. R-2R 래더 DAC 칩은 PCM 형식만 디코딩할 수 있기 때문에 일부 DAC 제조업체는 DAC의 입력 스테이지에 DSD를 PCM으로 변환하는 칩이나 FPGA를 사용합니다. 하지만 어떤 R-2R DAC 칩도 자체적으로 DSD를 디코딩할 수 없습니다.
거의 모든 경우에 DAC 칩이 디코딩하는 네이티브 형식으로 음악 파일을 재생하는 것이 좋습니다. R-2R DAC 칩의 경우 PCM, 델타 시그마 DAC 칩의 경우 DSD가 바로 그것입니다. 시중에는 여러 브랜드의 재생 소프트웨어가 있으며, 이 소프트웨어에는 실시간 PCM-더블 레이트 DSD 변환기가 있습니다. HQ 플레이어는 현재 시중에서 가장 정교한 재생 소프트웨어 패키지 중 하나입니다. HQ 플레이어는 실시간 PCM-DSD 변환은 물론 더블, 쿼드, 옥튜플 및 더 높은 레이트의 DSD 형식으로 실시간 DSD 업샘플링이 가능하도록 구성할 수 있습니다. PCM을 DSD로 변환하고 최소 쿼드 레이트 DSD로 업샘플링할 수 있는 재생 소프트웨어를 사용할 것을 적극 권장합니다.
결론:
정말 귀가 번쩍 뜨이는 내용이지 않습니까?
사람들이 PCM과 DSD 간에 상당한 차이가 들린다고 주장하는 것은 형식의 차이가 아니라 디지털 리마스터링의 품질이나 특정 DAC이 디코딩하는 기본 형식의 차이인 경우가 대부분입니다. 델타 시그마 DAC은 네이티브 DSD를 디코딩하고 R-2R DAC은 네이티브 PCM을 디코딩합니다.
대부분의 녹음은 하이엔드 오디오 애호가용 시스템이 아닌 카스테레오나 휴대용 장치에서 가장 잘 들리도록 설계되어 있다는 점을 명심하십시오. 아티스트와 프로듀서가 최종 믹스를 승인하기 전에 MP3 플레이어나 카 스테레오에서 트랙을 듣는 경우가 많다는 것은 잘 알려진 사실입니다.
음원의 품질은 음원이 배포되는 형식이나 해상도보다 훨씬 더 중요한 역할을 합니다. 그러나 많은 현대의 레코딩 스튜디오 경영진은 수익을 높이기 위해 포스트 프로덕션에서 오류를 편집하여 원본 마스터 테이프의 품질을 크게 떨어뜨리고 있습니다. 따라서 이러한 레코딩이 어떤 형식으로 출시되더라도 원본 마스터보다 더 높은 성능을 얻을 수 없기 때문에 음악은 항상 평범한 사운드로 들릴 것입니다.
이와는 대조적으로 제가 가장 좋아하는 디지털 레코딩 중 일부는 1950년대 아날로그 레코딩을 디지털 마스터링한 것입니다. 이러한 녹음은 대부분 뮤지션들이 한 공간에서 트랙당 한 테이크씩 연주하고 포스트 프로덕션 편집을 거치지 않은 채로 녹음되었습니다. 이러한 레코딩은 돌비 60dB 다이내믹 레인지 이전의 구식 마스터 테이프로 인해 배경 노이즈가 훨씬 더 높지만, 다른 방식으로는 복제할 수 없는 유기적인 특성과 실내 고조파 신호를 유지합니다.
'OneKey 메모장' 카테고리의 다른 글
[Roon 지식베이스] 다이내믹 레인지 (1) | 2024.11.30 |
---|---|
[TAS] 편집자의 글: 음악성이란... - 로버트 할리 (1) | 2024.11.30 |
가청 주파수와 위상에 대한 고찰 (1) | 2024.11.30 |
크리스탈케이블 브랜드 소개 (1) | 2024.11.30 |
[TAS] 공간을 향하여 (11) | 2024.11.28 |