¿Qué es la frecuencia de muestreo?
La frecuencia de muestreo es el número de muestras por segundo en una pieza de audio. Se mide en hercios (Hz) o kilohercios (kHz).
¿Tener una frecuencia de muestreo más alta supone una mejora notable?
Tu DAW te da la opción de grabar audio a frecuencias de muestreo como 44.1kHz, 48kHz, 96kHz, etc. Entonces, ¿cuál es la diferencia? La investigación muestra que una frecuencia de muestreo capturará frecuencias a la mitad de su cantidad. Por ejemplo, una frecuencia de muestreo de 44,1 Hz representará con precisión frecuencias de hasta 22 kHz. Los seres humanos con gran capacidad auditiva pueden oír hasta 20 kHz. Esto nos dice que una frecuencia de muestreo de 44,1 kHz es perfectamente adecuada para grabar música. 44,1 kHz también consume menos almacenamiento en tu ordenador que las frecuencias de muestreo más altas. Algunas personas insisten en que pueden escuchar mejoras en el audio grabado a frecuencias de muestreo más altas. La ciencia simplemente no respalda estas afirmaciones. Mi consejo es seguir con 44,1 o 48 kHz. Y asegúrate de utilizar excelentes técnicas de ingeniería de audio para obtener el mejor sonido posible. Hay una excepción a mis declaraciones. Si estás grabando sonidos que tienen un extremo superior áspero (como metales o platillos), la grabación en 96 kHz puede ayudar a reducir los problemas de «aliasing«.
¿Qué es la profundidad de bits?
En informática y comunicación digital, la unidad básica de información se denomina bit. En ingeniería de audio digital, la profundidad de bits muestra una cantidad de bits en cada muestra. Dado que gráficamente, la onda de sonido analógica se representa con una curva sinusoidal, la profundidad de bits muestra cuántos puntos se utilizan para construir la onda sinusoidal. Los convertidores de audio y DAW modernos utilizan la tecnología PCM para transformar las ondas de sonido analógicas en señales digitales y volver a convertirlas. PCM significa modulación de código de pulso y muestrea la amplitud de la señal a intervalos regulares.
Los fundamentos de la profundidad de bits
La profundidad de bits muestra el número de dígitos binarios codificados en cada muestra. Básicamente, la profundidad de bits indica la resolución de la forma de onda dada. La resolución aumenta exponencialmente y cada bit agregado duplica la resolución. Lo importante a recordar es que la profundidad de bit no afecta la respuesta de frecuencia.
Dado que la profundidad de bits influye directamente en la resolución de una forma de onda, solo hay dos cosas que se ven afectadas por ella. En primer lugar, controla el rango dinámico del audio. Cuanto mayores sean los valores de profundidad de bits, mayor será el rango dinámico. En segundo lugar, la profundidad de bits influye en la relación señal/ruido. En ingeniería de audio profesional, la relación señal-ruido se abrevia como SNR.
El rango dinámico y la profundidad de bits
El rango dinámico muestra la diferencia entre los puntos más silenciosos y más fuertes de su audio. El rango dinámico se mide en decibeles, y cuanto mayor sea el número, mayor será la diferencia entre las partes más silenciosas y las más ruidosas.
Un rango dinámico promedio de audición humana se aproxima a 140 dB, pero este número depende en gran medida de la frecuencia y algunas otras circunstancias individuales. La profundidad de 16 bits, que es un estándar de audio de CD, le dará un rango dinámico de 96 dB. El audio digital de 24 bits tiene un rango de 144 dB, que coincide con las capacidades auditivas humanas. Pero hay una cosa que debemos aclarar. Suponiendo que está bastante claro lo que significaría el término «parte más ruidosa», las cosas son un poco complicadas con la parte más silenciosa.
Veamos un ejemplo:
Digamos que estamos grabando un piano acústico y, obviamente, la parte más alta de nuestro audio sería la nota más alta que podríamos tocar. Naturalmente, uno asumiría que la parte más silenciosa de nuestro audio sería la nota más silenciosa que podríamos tocar o incluso el ruido de los martillos. Esa suposición está tan lejos de la verdad como parece. Dado que estamos hablando específicamente de la grabación de audio, la parte más silenciosa de dicha grabación de piano sería el ruido de fondo de los micrófonos y otros equipos analógicos periféricos. Por lo tanto, en ingeniería de audio, el rango dinámico representa la diferencia entre la señal que tiene valor y la señal no deseada.
Desafortunadamente, todos los equipos analógicos, incluidos los convertidores A/D de tu interfaz de audio, tienen un nivel de ruido determinado. Incluso si no tienes un procesador de audio externo, tu PC todavía tiene convertidores que son parcialmente analógicos. Pero la buena noticia es que si grabaste tus partes en voz alta, a una profundidad de bit más alta, el ruido de fondo no sería audible.
Ruido digital en la profundidad de bits
El ruido del equipo de audio analógico representa un desafío solo cuando intenta capturar una interpretación muy suave y silenciosa. Pero, ¿y si no grabas ningún instrumento en vivo? No deberías tener ningún problema con el ruido, ¿verdad?
Bueno, eso no es exactamente cierto. Por supuesto, el uso de instrumentos virtuales y sintetizadores lo libera de tener que lidiar con micrófonos y preamplificadores. Pero resulta que el audio digital también puede introducir algo de ruido. Este ruido se introduce a partir de un error de cuantificación, que es típico del procesamiento de señales digitales.
Error de cuantización
La cuantificación es el proceso de convertir valores de entrada de un conjunto grande a valores de salida en un conjunto más pequeño. En el audio digital, la cuantificación se realiza mediante convertidores de analógico a digital y varias funciones algorítmicas integradas en el software. El proceso de cuantificación en audio es el proceso de reconstrucción de la amplitud analógica original de una señal en valores digitales. Los procesos de cuantificación suelen implicar redondeo y truncamiento, que introducen la diferencia entre el valor de la señal de entrada y su valor cuantificado. Esta diferencia suele denominarse error de cuantificación.
Por lo general, en la producción de audio, tratamos con una gran cantidad de muestras. Se produce una secuencia de errores de cuantificación, lo que da como resultado la introducción de una señal aleatoria sin ningún valor de producción. Generalmente, una profundidad de bit más alta significa una potencia de ruido de cuantificación más baja. Dado que los estándares de la industria actual son de 16 y 24 bits, significa que trabajar en un proyecto con una mayor profundidad de bits resultará en la adición de ruido de cuantificación en la exportación. Para solucionar este problema, los ingenieros de audio utilizan tramado y modelado de ruido.
Dithering y modelado de ruido
Dither es una forma de ruido que se utiliza para aleatorizar el error de cuantificación. Comúnmente, el error de cuantificación se correlaciona con la señal, lo que da como resultado una distorsión predecible. Cuando la señal se difumina, los armónicos no deseados se eliminan matemáticamente y se reemplazan con un nivel de ruido fijo constante.
La formación de ruido es el proceso de alterar la forma espectral del error de cuantificación. Disminuye el nivel de la potencia del ruido en las bandas de frecuencia en las que el ruido se considera no deseado y lo hace más alto en las bandas en las que es más deseable. La formación de ruido funciona colocando el error de cuantificación en los bucles, lo que hace posible filtrar el error. La mayoría de los algoritmos de modelado de ruido utilizados en el procesamiento de audio se basan en un umbral absoluto del modelo de audición, lo que hace posible que el ruido de cuantificación sea completamente inaudible.
¿QUÉ PROFUNDIDAD DE BITS USAR?
Dado que sabemos que los ingenieros de audio normalmente prefieren no profundizar demasiado en aburridas ecuaciones matemáticas, sería bastante útil conocer las aplicaciones prácticas reales de la profundidad de bits. Puede ser un poco obvio señalarlo, pero más grande no siempre significa mejor. En este caso particular, una mayor profundidad de bits le dará un mayor rango dinámico, pero dará como resultado un mayor uso de la CPU. Además, las muestras grabadas con mayor profundidad de bits tendrán un tamaño mayor y, dado que finalmente se cargarán en la memoria RAM, es posible que se quede sin ella mientras trabaja en un proyecto bastante grande.
Como ya sabemos, el rango dinámico promedio de la audición humana es de aproximadamente 140 dB. Y la profundidad de 24 bits dará un rango dinámico de 144 dB, que está dentro de nuestras capacidades auditivas. La mayoría de los equipos electrónicos en realidad no pueden manejar más de 120 dB de rango dinámico, por lo que no tendría sentido forzar su PC por algo que no se puede reproducir. Básicamente, todo se reduce a los estándares de la industria y los requisitos de cada proyecto.
Las transmisiones de televisión modernas requieren una profundidad de bits de audio de 24 bits. Lo mismo ocurre con los servicios de transmisión y YouTube. Si tiene la intención de imprimir su audio en el CD, tiene que ser exclusivamente de 16 bits. Pero dado que el audio del CD es posiblemente un formato en extinción y la mayoría de las personas tienden a no usar ningún almacenamiento físico para el audio que no sean unidades USB, no tiene sentido usar esa profundidad de bits.
Pero, por otro lado, el vinilo volvió con fuerza, y hoy en día se imprime mucha música en él. El vinilo puede tener un rango dinámico de 70 dB, más o menos, por lo que el audio de 16 bits debería ser suficiente. Sin embargo, se recomienda tener espacio libre en caso de procesamiento posterior adicional, por lo que generalmente se usa una profundidad de bit de 24 para vinilo. Entonces, como podemos ver claramente, la profundidad de bits de 24 es un punto óptimo.
Conclusión
Entonces, respondiendo a la pregunta de qué es la profundidad de bits en la producción de audio, descubrimos que es una cantidad de dígitos binarios que se usan para medir el audio muestreado. La profundidad de bits influye directamente en la resolución de la muestra y controla el rango dinámico del audio. Los ingenieros de audio profesionales utilizan una profundidad de 24 bits, ya que cumple con todos los requisitos y estándares actuales. El uso de profundidades de bits superiores a esa no proporcionaría ningún beneficio aparte del rango dinámico más alto, que, sin embargo, no podría ser reproducido ni escuchado por un ser humano. Si planea imprimir su música en el CD, aún puede usar un proyecto en 24 bits y reducir la profundidad de bits en la exportación y aplicar tramado y modelado de ruido.
Ahora que sabes esto tal vez te interese aprender más informática musical como qué es el procesamiento de señales DSP o igual te parece una tontería pero ¿sabes si puedes colocar tus altavoces tumbados o deben estar siempre en vertical? Te he abierto la curiosidad?
1980, Barcelona, España.
Ingeniero de sonido, mezcla y mastering.
Guitarrista y compositor de música.
Ha lanzado 4 álbumes, 9 EPs y decenas de sencillos de diferentes géneros musicales.
También ha mezclado, masterizado y grabado para innumerables artistas independientes.
Fotógrafo y dibujante por afición.