본문 바로가기
OneKey 메모장

[iZOTOPE] 디지털 오디오 베이직: 오디오 샘플 레이트 및 비트 심도

by onekey 2024. 12. 1.

https://cafe.naver.com/hfi/177

 

[iZOTOPE] 디지털 오디오 베이직: 오디오 샘플 레이트 및 비트 심도

대한민국 모임의 시작, 네이버 카페

cafe.naver.com

 

ADC가 여기에서는 아날로그/디지털 컨버터가 아닌 오디오/디지털 컨버터라고 표기가 되어있습니다.

하이파이이머전은 녹음할 때 192kHz/32비트 부동소수점을 이용합니다. 이는 Zoom F8n Pro에서 가장 높은 설정입니다. 덕분에 피크는 걱정을 안해도 되게 되었습니다. 윈도우즈용 어도비 프리미어 프로에서는 최대 사용 샘플레이트가 96kHz입니다.

원본 사이트는 다음과 같습니다: https://www.izotope.com/en/learn/digital-audio-basics-sample-rate-and-bit-depth.html

 

Digital Audio Basics: Audio Sample Rate and Bit Depth

Learn the basics of digital audio and how a computer handles sound, from audio sample rate to bit depth.

www.izotope.com

 


디지털 오디오 베이직: 오디오 샘플 레이트 및 비트 심도

저는 제가 음악 프로덕션에 뛰어들고 싶다는 열망이 얼마나 컸는지 기억합니다. 편곡의 가능성은 무궁무진했고, 제가 들은 대로 음악을 믹싱하는 방법을 배울 수 있었으니까요. 하지만 안타깝게도 프로듀싱을 시작하면서 컴퓨터가 실제로 오디오를 어떻게 처리하는지에 대한 기본을 배우지 못했기 때문에 노트북으로 음악을 만든다는 개념 자체가 다소 추상적으로 느껴졌습니다.

첫 번째 트랙을 바운스하는 것조차 혼란스러웠습니다. 각 옵션은 어떤 기능을 하는지? 어떤 것이 가장 좋은 소리인지 구분을 하는지?

이 글에서는 디지털 오디오의 몇 가지 기본적인 측면과 이러한 측면이 제작 과정에 어떤 영향을 미치는지 살펴보겠습니다. 오늘은 오디오 샘플 레이트와 오디오 비트 심도, 그리고 이와 관련된 몇 가지 주제에 대해 집중적으로 살펴보겠습니다. 약간의 이론과 수학적 지식이 필요하지만, 디지털 오디오의 작동 원리에 대한 수수께끼를 조금이나마 풀 수 있기를 바랍니다.

디지털 오디오란 무엇인가?

디지털 오디오는 디지털 신호로 녹음되거나 변환된 소리를 표현하는 방법입니다. 아날로그에서 디지털로 변환하는 과정에서 아날로그 음파의 진폭은 지정된 샘플 레이트와 비트 심도로 캡처되어 컴퓨터 소프트웨어가 읽을 수 있는 데이터로 변환됩니다.

소리와 디지털 오디오의 주요 차이점은 디지털 오디오는 원래의 아날로그 음파를 재구성하는 데 사용되는 일련의 진폭 값인 반면, 아날로그 사운드는 어느 한 지점에서 무한한 진폭 값을 갖는 연속 신호라는 점입니다. 디지털 오디오는 점 잇기 게임을 하는 것과 같지만, 실제 소리는 원본 이미지 전체라고 보시면 되겠습니다.

양자화: 오디오-디지털 변환

아날로그에서 디지털로 변환하는 과정을 양자화라고 하며, 이는 카메라가 비디오를 캡처하는 방식과 매우 유사합니다. 비디오 카메라는 프레임이라고 하는 초당 수천 개의 이미지를 연속적으로 캡처하여 연속적인 순간을 재구성합니다. 프레임 속도가 높을수록 영상이 더 부드러워집니다. 디지털 오디오의 경우, 아날로그-디지털 컨버터는 지정된 샘플 레이트와 비트 심도로 초당 수천 개의 오디오 샘플을 캡처하여 원본 신호를 재구성합니다. 샘플 레이트와 비트 심도가 높을수록 오디오 해상도가 높아집니다.

 

출처: iZOTOPE

오디오 샘플 레이트란 무엇인가?

샘플 레이트는 불연속적인 디지털 신호를 생성하기 위해 파형에서 가져오는 초당 샘플 수를 말합니다. 샘플 레이트가 높을수록 오디오 신호의 스냅샷을 더 많이 캡처할 수 있습니다. 오디오 샘플 레이트는 킬로헤르츠(kHz) 단위로 측정되며, 디지털 오디오에서 캡처되는 주파수 범위를 결정합니다. 대부분의 DAW에서는 오디오 환경설정에서 조정 가능한 샘플 레이트를 찾을 수 있습니다. 이를 통해 프로젝트의 오디오 샘플 레이트를 제어할 수 있습니다.

평균적인 DAW에 표시되는 옵션(44.1kHz, 48kHz)은 다소 무작위로 보일 수 있지만, 그렇지 않습니다!

샘플 레이트는 임의의 숫자가 아닙니다. 컴퓨터가 인간의 청각 범위(인간은 20Hz에서 20kHz 사이의 주파수를 듣습니다) 내의 주파수를 재현하려면 최대 20kHz의 주파수를 가진 파동을 재현할 수 있어야 합니다. 하지만 컴퓨터가 이를 재현하려면 그 두 배의 샘플 레이트를 사용해야 합니다. 그렇다면 기술적으로 40kHz의 샘플 레이트가 적합할 것 같지 않습니까?

그렇긴 하지만, 가청 에일리어싱을 방지하려면 꽤 강력하고 (한때는 비쌌던) 로우 패스(저역 통과) 필터가 필요합니다. 44.1kHz의 샘플 레이트는 기술적으로 최대 22.05kHz의 주파수를 가진 오디오를 녹음할 수 있습니다. 나이퀴스트 주파수를 청각 범위 밖에 배치하면 보다 적당한 필터를 사용하여 큰 청각적 효과 없이 에일리어싱을 제거할 수 있습니다. 대부분의 사람들은 나이가 들면서 고역을 듣는 능력을 상실하고 최대 15kHz-18kHz까지의 주파수만 들을 수 있습니다. 그러나 이 '20에서 20' 규칙은 여전히 우리가 들을 수 있는 모든 음역대의 표준 범위로 받아들여지고 있습니다.

즉, 원래 사인파의 주파수를 최소 두 배 이상의 오디오 샘플 속도로 캡처하고 재구성할 수 있는데, 이를 나이퀴스트 속도라고 합니다. 반대로, 시스템은 오디오 샘플 레이트의 절반까지 주파수를 캡처하고 재생성할 수 있는데, 이를 나이퀴스트 주파수라고 합니다.

나이퀴스트 주파수를 초과하는 신호는 오디오/디지털 컨버터(ADC)에 의해 제대로 녹음되지 않고, 나이퀴스트 주파수에 다시 반영되어 에일리어싱이라고 하는 인공 주파수를 발생시킵니다.

에일리어싱을 방지하기 위해 오디오/디지털 컨버터에는 오디오가 컨버터에 도달하기 전에 나이퀴스트 주파수 이상의 주파수를 제거하는 저역 통과 필터가 선행되는 경우가 많습니다. 이렇게 하면 원본 오디오에서 원치 않는 초고주파가 에일리어싱을 유발하는 것을 방지할 수 있습니다. 초기의 로우 패스 필터는 오디오를 오염시킬 수 있었지만, 더 나은 기술이 도입되면서 이 문제는 최소화되고 있습니다.

 

어떤 샘플 레이트로 녹음해야 하는가?

녹음, 믹싱, 마스터링할 때는 항상 가능한 한 가장 높은 샘플 레이트와 비트 심도로 작업하는 것이 유리합니다: 48kHz, 96, kHz, 심지어 192kHz까지. 이렇게 하면 모든 믹싱과 효과에서 더 높은 해상도를 얻을 수 있고 배포 매체에 맞는 샘플 레이트로 유연하게 바운스 다운할 수 있습니다. 하지만 오디오를 바운스 다운하려면 배포 매체와 호환되는 비트 심도와 샘플 레이트를 선택해야 합니다.

CD, 스트리밍 및 소비자용 오디오의 표준 샘플 레이트는 44.1kHz이며, 비디오용 오디오에는 48kHz가, 아카이브 오디오에는 96kHz 또는 192kHz가 주로 사용됩니다.

44.1kHz대 48kHz

음악을 녹음하는 경우 표준 샘플 레이트는 44.1kHz 또는 초당 44,100샘플입니다. 이는 대부분의 소비자용 오디오의 표준으로, CD와 같은 포맷에 사용됩니다. 48kHz는 영화에 사용되는 또 다른 일반적인 오디오 샘플 레이트입니다. 기술적으로 샘플 레이트가 높을수록 초당 측정 횟수가 많아지고 원본 오디오를 더 가깝게 재현할 수 있으므로 일반적으로 큰 다이나믹 레인지가 필요한 비디오용 오디오에 48kHz가 자주 사용됩니다.

96kHz 대 192kHz

192kHz는 96kHz보다 초당 두 배 많은 샘플을 수집하므로 저장할 하드 드라이브 공간이 두 배 더 필요합니다. 96kHz 및 192kHz와 같은 높은 샘플 레이트를 사용하면 가장 높은 해상도의 오디오를 얻을 수 있지만, 처리 능력이 많이 필요하고 사람의 귀로는 그 차이를 거의 알아차리지 못합니다. 대부분의 음악 애플리케이션의 경우, 좋은 오디오 인터페이스를 통해 48kHz로 녹음하면 훌륭한 결과를 얻을 수 있습니다.

오디오 샘플 레이트의 차이를 느낄 수 있는가?

일부 숙련된 엔지니어는 샘플 레이트의 차이를 느낄 수 있습니다. 하지만 필터링 및 아날로그/디지털 변환 기술이 향상됨에 따라 이러한 차이를 구분하기가 점점 더 어려워지고 있습니다.

오디오 샘플 레이트가 높을수록 더 좋은가?

이론적으로는 176.4kHz 또는 192kHz와 같이 더 높은 오디오 샘플 레이트에서 작업하는 것이 나쁘지 않습니다. 파일 용량은 커지지만 최종 바운스까지 음질을 극대화하는 것이 좋을 수 있습니다. 그러나 결국 오디오는 44.1kHz 또는 48kHz로 변환될 가능성이 높습니다. 88.2를 44.1로, 96을 48로 변환하는 것이 수학적으로 훨씬 쉽기 때문에 전체 프로젝트에서 하나의 포맷을 유지하는 것이 가장 좋습니다. 하지만 일반적으로 44.1kHz 또는 48kHz로 작업하는 것이 일반적입니다.

시스템이 샘플 레이트를 48kHz로 설정하고 44.1kHz 오디오 파일을 사용하면 시스템이 샘플을 더 빨리 읽게 됩니다. 그 결과 오디오의 속도가 빨라지고 음정이 약간 높아집니다. 시스템 샘플 레이트가 44.1kHz이고 오디오 파일이 48kHz인 경우에는 그 반대의 현상이 발생하여 오디오가 느려지고 음정이 약간 낮아집니다.

초고음질 오디오 샘플 레이트를 창의적으로 활용하는 방법도 흥미롭습니다. 표준 44.1kHz 오디오 파일의 피치를 낮춰본 적이 있다면, 고역이 다소 비어 있는 것을 느꼈을 것입니다. 22.05kHz 이상의 주파수는 변환 전에 필터링되었기 때문에 피치를 낮출 주파수 콘텐츠가 없어 고음부에 빈 공간이 생깁니다.

그러나 예를 들어 이 오디오를 192kHz로 녹음하면 원본 오디오에서 최대 96kHz의 주파수가 녹음됩니다. 이는 분명히 사람이 들을 수 있는 범위를 벗어난 것이지만, 오디오의 피치를 낮추면 이렇게 들리지 않던 주파수가 들리게 됩니다. 따라서 고역 콘텐츠를 보존하면서 녹음의 피치를 크게 낮출 수 있습니다.

오디오 비트 심도란 무엇인가?

오디오 비트 심도는 각 오디오 샘플에 대해 녹음할 수 있는 진폭 값의 수를 결정합니다. 비트 심도가 높을수록 원본 오디오 신호를 재현하기 위해 샘플당 더 많은 진폭 값을 캡처할 수 있습니다.

가장 일반적인 오디오 비트 심도는 16비트, 24비트, 32비트입니다. 각 비트 심도는 가능한 여러 값을 나타내는 이진 용어입니다. 오디오 비트 심도가 높은 시스템일수록 더 많은 가능한 값을 표현할 수 있습니다:

 

· 16비트 65,536개 값

· 24비트: 16,777,216개 값

· 32비트 4,294,967,296개 값

비트 심도가 높을수록 더 고해상도의 오디오를 의미하며, 비트 심도가 너무 낮으면 원본 오디오 신호의 일부 정보가 손실됩니다. 오디오 비트 심도가 높을수록, 즉 해상도가 높을수록 더 많은 진폭 값을 녹음할 수 있습니다. 결과적으로 연속 아날로그 파의 정확한 진폭은 샘플링할 때 사용 가능한 값에 더 가까워집니다. 따라서 진폭의 디지털 근사치는 원래의 유동적인 아날로그 파동에 더 가까워집니다.

· 16비트: 65,536 증폭 값

· 24비트 16,777,217 증폭 값

· 32-bit: 4,284,967,296 증폭 값

오디오 샘플 레이트와 함께 오디오 비트 심도를 높이면 아날로그 웨이브를 재구성할 수 있는 총 포인트가 더 많이 생성됩니다.

 

출처: iZOTOPE

그러나 유동적인 아날로그 웨이브는 해상도에 관계없이 항상 가능한 값과 완벽하게 일치하지는 않습니다. 그 결과, 진폭을 나타내는 데이터의 마지막 비트는 양자화라는 프로세스를 통해 0 또는 1로 반올림됩니다. 이는 신호에 본질적으로 무작위화된 부분이 있다는 것을 의미합니다.

디지털 오디오에서는 이러한 무작위화가 낮은 백색 잡음으로 들리는데, 이를 노이즈 플로어라고 합니다. 아날로그 환경에서 발생하는 기계적 노이즈나 라이브 음향 환경의 배경 소음과 마찬가지로 디지털 양자화 오류는 오디오에 노이즈를 발생시킵니다.

비트 심도와 함께 샘플 레이트와 오디오 간의 고조파 관계로 인해 양자화에서 특정 패턴이 발생할 수 있습니다. 이를 상관 노이즈라고 하며, 특정 주파수의 노이즈 플로어에서 공진으로 들립니다. 여기서 노이즈 플로어는 실제로 더 높아져 녹음된 신호의 잠재적 진폭 값을 차지합니다.

하지만 이러한 패턴이 발생하지 않도록 인위적인 무작위화를 수행할 수 있습니다. 디더링이라는 프로세스를 통해 이 마지막 비트가 반올림되는 방식을 무작위로 변경할 수 있습니다. 패턴이 생성되지 않으므로 더 많은 잠재적 진폭 값을 남기는 무작위화된 '상관관계가 없는 노이즈'가 생성됩니다.

노이즈 플로어의 진폭은 가능한 다이나믹 레인지의 최하단이 됩니다. 반대로 신호가 이진 시스템이 생성할 수 있는 최대값을 초과할 때 진폭이 너무 높으면 디지털 시스템이 왜곡될 수 있습니다. 이 수준을 0dBFS라고 합니다.

결국 오디오 비트 심도는 노이즈 플로어와 0dBFS 사이에서 가능한 진폭 값의 수를 결정합니다.

오디오 비트 심도의 차이를 알 수 있는가?

"사람의 귀가 65,536과 4,294,967,296의 진폭 레벨 차이를 정말 구분할 수 있을까?"라고 생각할 수 있습니다.

이는 타당한 질문입니다. 16비트 시스템에서도 노이즈 플로어는 매우 낮습니다. 96dB 이상의 유효 다이나믹 레인지가 필요한 경우가 아니라면 프로젝트의 최종 바운스에는 16비트가 적합합니다.

하지만 프로젝트 작업 중에는 더 높은 오디오 비트 심도로 작업하는 것도 나쁘지 않습니다. 노이즈 플로어가 떨어지기 때문에 기본적으로 왜곡이 발생하기 전에 더 많은 공간(헤드룸이라고도 함)을 확보할 수 있습니다. 왜곡이 발생하기 전에 이 여분의 버퍼 공간을 확보하면 작업 시 좋은 안전장치가 되며 유연성이 향상됩니다.

샘플 레이트와 비트 심도는 얼마여야 하는가?

음악 프로덕션의 경우 24비트에서 48kHz의 샘플 레이트를 사용하십시오. 이는 음질, 파일 크기, 처리 능력 간에 적절한 균형을 이룹니다. 그러나 올바른 샘플 레이트와 비트 심도는 궁극적으로 오디오를 마스터링하는 배포 매체에 따라 달라집니다.

결론: 샘플 레이트 대 비트 심도

요약하자면, 샘플 레이트는 원본 음파를 재현하기 위해 취하는 스냅샷의 수를 결정하고 비트 심도는 각 스냅샷에 포함된 진폭 값의 수를 결정합니다. 비트 심도와 샘플 레이트는 함께 작동하여 오디오 해상도를 결정합니다. 가능한 가장 높은 값으로 제작하고 나중에 고음질 마스터를 배포하려는 매체에 적합한 비트 심도와 샘플 레이트로 바운스해야 합니다.