Portada del artículo 'Estructura de ganancia en la mezcla'

Estructura de ganancia en la mezcla

Por Jorge Rozas

- agosto 23, 2024 - 15 minutos de lectura

¿Te pasa de preguntarte cómo hacer para lograr mezclas claras, definidas y que no distorsionen?

La respuesta a esa pregunta es simple: un proceso llamado estructura de ganancia también conocido como etapa de ganancia o "gain staging" en inglés.

Empecemos por hablar de la distorsión y cómo encarar el problema:

La distorsión en la mezcla

La distorsión tiene muchos usos en la música popular pero, en general, es la enemiga de la mezcla.

Peor aún cuando se llega al clipping digital.

La distorsión es un cambio en la señal que estamos tratando producida por la no linealidad de los dispositivos que usamos. 

Esta ocurre, porque no existe un dispositivo capaz de amplificar linealmente una señal de manera infinita: a partir de cierto punto empiezan a introducir cambios.

La distorsión viene en diversos sabores: un cambio en la fase a la salida de un cierto dispositivo (distorsión de fase) o una distorsión en respuesta en frecuencia o nivel de la señal. 

Este tipo de distorsión consiste en la suma de una cantidad de armónicos a la señal que estamos tratando.

Dependiendo del grado o cantidad de distorsión puede ir desde un poco hasta una cantidad infinita teórica de armónicos si hablamos de la distorsión por clipeo o recorte de onda.

Imagen: vista de una forma de onda sinusoidal arriba, que equivale a un tono puro y una forma de onda cuadrada abajo. Las ondas cuadradas tienen una cantidad infinita de armónicos, por eso suenan distorsionadas.

Cuando subimos el nivel de nuestro equipo de música, pasado un cierto umbral vamos a empezar a escuchar como la señal se comienza a «ensuciar» progresivamente, perdiendo detalles como la reverberación.

El equipo pasó de su etapa en que es más lineal, donde solamente aumenta el nivel, a su etapa no-lineal en la que además de subir el nivel se agregaron una cantidad de armónicos o frecuencias que antes no estaban presentes en la señal.

Un caso especial de distorsión y tal vez la que peor suena es la distorsión por recorte de la señal o clippeo. 

Esta distorsión se produce cuando la señal llega al límite de capacidad de nivel del sistema y rebasa este punto.

Debido a que el sistema no puede reproducir los niveles superiores a ese punto debe «recortar» la forma de onda que rebasa dicho punto transformando la señal en una onda cuadrada, mientras dure el tiempo en la que se rebasa este punto.

Este tipo de distorsión también existe en la mezcla y lo que sucede típicamente es que al ir acercándonos al punto de recorte de la forma de onda vamos perdiendo progresivamente las cualidades antes mencionadas.

La mezcla va adquiriendo cualidades de un sonido rasposo, roto y ruidoso cada vez que la señal llega a la amplitud que significa distorsión.

El problema en las mezclas digitales es que es muy fácil llegar a distorsionar si no se toman algunas precauciones o estrategias al momento de dejar un cierto margen para mantenerse lejos de la distorsión y especialmente del recorte de la señal o clipping.

Headroom: alejándonos de la distorsión

El nivel máximo que puede tolerar una mezcla o señal digital es el 0 dB Full Scale o decibel de escala completa. 

El valor puede resultar engañoso, ya que en las consolas analógicas existe un 0 dB y al mezclar se puede rebasar de este punto sin inducir distorsiones audibles. 

Es más, mientras mejor es la consola analógica más decibeles podemos rebasar de este punto sin sonar distorsionados.

Todo el nivel que la consola pueda tolerar por encima del 0 dB hasta la distorsión se llama Headroom, concepto que podemos denominar como resto de señal.

Para hacer una analogía, el headroom equivale al espacio que hay en una puerta por encima de la altura de una cabeza, para evitar que nos golpeemos contra el marco de la misma.

El principio de las consolas analógicas se puede aplicar en la mezcla digital siguiendo algunos principios de ajustes de nivel óptimos de la señal, tanto en la grabación como en la mezcla.

La lógica en el sistema digital es que vamos a precisar generar este resto o Headroom, trabajando con los decibeles negativos y ajustando la ganancia de cada canal de la mezcla para tener un margen aceptable y que al sumar todas las señales aún mantengamos este margen.

Fabricando este headroom en tu DAW, siempre vas a estar lejos de la distorsión y de los malestares que genera al sonido.

El sistema de referencia K-20

Si bien se podría generar el headroom sin una referencia específica, existe un sistema de referencia en lo que respecta a niveles nominales y niveles de monitoreo para mezcla llamado K-20  sugerido por Bob Katz, prestigioso ingeniero de mastering. 

La escala K-20 emplea un medidor de nivel del tipo RMS o promediado en el tiempo, donde el 0 dB está calibrado para caer 20 decibeles menos que el 0 dB Full scale.

De esa manera cuando usamos este sistema cuando la señal marca 0 dB en el medidor en realidad está a -20 dB RMS, que es un muy buen valor para tener un headroom ideal.

Además, si estamos trabajando con el estándar de nivel de línea de salida profesional, +4 dBu, cuando la señal esté en -20 dB estaremos en los +4 dBu que es igual al 0VU.

Este es el nivel nominal operativo de consolas, ecualizadores y demás dispositivos periféricos profesionales con los que podemos interconectarnos.

La idea es ajustar la ganancia de cada canal en la mezcla para que las señales RMS caigan 20 dB debajo del 0.

Así, cuando sumemos todas las señales de la mezcla mantendremos el margen o resto en todo momento, produciendo mezclas consistentes y que no estén sobre comprimidas.

Medidor de nivel Inspector XL calibrado en el sistema K-20Imagen: vista de un medidor de nivel calibrado en el sistema K-20, en donde el 0 equivale a -20 dB RMS. 
Medidor de nivel Dorrough de Waves. Se resalta el ajuste para mezclar referenciando a -20dB RMS.Imagen: vista de un medidor de nivel Dorrough de Waves. En rojo se resalta el ajuste para mezclar con referencia a -20 dB RMS. En verde se resalta la franja de la escala que va a mostrar el nivel adecuado.

¿Que es la estructura de ganancia?

Es el control de nivel de nuestra señal o conjunto de señales que componen la mezcla en toda la cadena de procesamiento. 

El objetivo es mantener el mismo nivel desde el comienzo hasta el fin de la cadena. 

La idea detrás de la estructura de ganancia es conseguir el suficiente headroom para que al sumar los elementos de la mezcla no se sufra de los males de la distorsión o el sonido saturado.

Para lograrlo tenemos algunas opciones:

  • Plugin de manejo ganancia: existen plugins que nos permiten manejar la ganancia por separado de tal manera de poder subir o bajar una cantidad de decibeles la señal para ajustar al nivel óptimo de referencia. Algunos nombres son trim, gain o utility.
  • Ganancia desde la región: los DAW modernos permiten ajustar el nivel de las regiones de audio individualmente e incluso dividir por partes dentro de una misma pista.

Para lograr una correcta estructura de ganancia tenemos que tener en mente que nos vamos a encontrar con dos tipos de señales en mezcla: las RMS o promediadas y las peak o instantáneas.

Cuando hablamos de señales RMS nos referimos a: voces, guitarras, piano, bajo, cuerdas y cualquier sonido que tenga una duración significativa en el tiempo.

Por el contrario las señales peak o instantáneas se producen en baterías o percusiones varias y tiene la particularidad que son sonidos que tienen mucha amplitud inicial y decaen rápidamente. 

Esta división se hace necesaria ya que el medidor RMS no va a ser capaz de darnos una lectura certera de las señales del tipo peak y un medidor peak no va a ser capaz de mostrarnos lo que sucede con las señales promedio. 

Veamos el procedimiento para llegar a un nivel óptimo para los distintos tipos de señales

Señales Pico o Peak

Se recomienda que las señales con muchos transitorios ej. baterías, percusiones,etc. se manejen con un nivel de entre – 6 a  -10 dB debajo del 0. En la prácticasignifica que manejaremos un margen de señal al menos 6 decibeles por debajo del 0. 

Cuando evaluamos el nivel vamos a buscar que la señal esté la mayoría del tiempo en esos valores, por momentos va a tener un nivel inferior y por momentos superior.

Para este fin vamos a necesitar es un medidor del tipo peak, es decir con una respuesta muy rápida o instantánea. Es recomendable colocarlo en el master fader y luego solear una por una las señales que tenemos que medir. 

Afortunadamente la mayoría de los DAWs incorporan medidores de nivel Peak en la típica barra de nivel de cada canal..

Normalmente tu D.A.W te permite ver a que nivel llegó la señal, si clipeó. Con esta información podemos ajustar la ganancia de la pista como corresponda para obtener el nivel deseado.

Ventana de mezcla de Pro Tools. Se resalta dónde ver el nivel de lectura del tipo peak el medidor de nivel de barra.Imagen: vista de la ventana de mezcla de Pro Tools. en verde se resalta el lugar donde se puede ver la lectura del nivel peak de la señal. En rosado se resalta el medidor de nivel de barra del DAW.

Si por ejemplo al medir nuestra señal tiene un nivel superior al recomendado, vamos a usar el plugin de ganancia para reducir el nivel, en el caso de Pro Tools usamos el plugin "Trim".

Si tenemos que la señal está casi en 0dB FS vamos a tener que reducir en 6 dB su nivel, es decir colocar el valor – 6dB en el plugin de gain.

Plugin de ganancia "Trim" de Pro Tools.Imagen: vista de un plugin de manejo de ganancia llamado Trim en Pro Tools. Existen opciones similares en cada DAW bajo el nombre de gain o utility.

Señales RMS

Para el resto de señales con mayor duración se recomienda que las señales se trabajen a un nivel de -20 dB RMS.

Al evaluar el nivel RMS vamos a necesitar un medidor de nivel que tenga un modo RMS, average o promedio colocado en el master fader. En este tipo de señales la medición o lectura es más lenta y a veces puede ser engañosa.

La estrategia consiste en solear una pista por vez y mantener el medidor del master fader abierto, para ajustar la ganancia de cada pista buscando que ronde los -20 dB RMS.

Si usamos un medidor en el sistema K-20 en valor será el 0 dB del medidor.

Vista del plugin PAZ Meters de Waves. Se resalta el ajuste para evaluar el nivel RMSImagen: vista del plugin Paz Meters de Waves. En rosado se resalta el ajuste para evaluar el nivel RMS

Mantener la estructura de ganancia

Una vez tenemos el ajuste de ganancia correcto para cada tipo de señal en cada canal debemos mantener ese mismo nivel en toda la cadena de procesamiento y es tal vez ahí donde está el desafío más importante.

Con mantener el nivel nos referimos a que cuando usemos una instancia de procesamiento preservemos el mismo nivel de señal a la salida del plugin, valiéndonos del nivel de salida del mismo.

Si usamos por ejemplo un ecualizador para realzar alguna zona en la frecuencia, necesitamos compensar ese aumento atenuando a la salida.

Lo mismo ocurre cuando aplicamos compresión.

Si bien esto se puede hacer matemáticamente disminuyendo la salida con una cantidad específica de decibeles que se aumentaron en la ecualización, también se puede hacer a oído o subjetivamente.

Para este procedimiento nos valemos del botón de bypass que tienen los plugins y de escuchar atentamente cuanto sube o baja el nivel de salida de la señal después de procesada.

En el caso de notar un cambio de nivel compensamos ya subiendo el nivel o bajándolo, hasta que para nuestro oído ambas señales estén igualadas.

Imagen: vista de un plugin de compresión CLA-76. En rojo se resalta la opción para prender y apagar el plugin y poder evaluar la diferencia de nivel de entrada/salida. En celeste se resalta los controles para el nivel de entrada y salida. 

Para qué ecualizar o comprimir si el nivel no sube

En ambos casos vamos a usar ecualización para modificar el contenido en la frecuencia de un sonido y por tanto hacer que suene diferente, más allá de si sube el nivel o no.

Si le aumentamos graves a un bajo pero luego igualamos el nivel de salida en realidad cambiamos el sonido que es lo que buscábamos en primer lugar, por que de otra manera podríamos usar el fader.

Lo mismo aplica para la compresión, si bien en los libros y manuales nos dicen que hay que compensar los decibeles que se comprimieron esto no siempre es necesario.

Si comprimimos un tambor de batería para emparejar el nivel de los golpes no necesitamos subir el nivel desde el make up gain del compresor, si hiciera falta subir el nivel del tambor final lo podemos hacer desde el fader.

Ahí radica el cambio de paradigma al mezclar, en vez de subir el nivel de las cosas buscamos mantener el margen o resto todo el tiempo, para que al final podamos usar los faders para dar los planos finales que necesita la música en específico.

Imagen: vista de un ecualizador paramétrico típico. En celeste se resalta la parte de manejo del nivel de entrada y salida.

Nivel nominal de mezcla

Si seguimos los pasos anteriores y nos aseguramos que las señales del tipo peak/pico estén por los – 6dB FS y las señales promedio estén por -20dB RMS, vamos a llegar al nivel óptimo de mezcla sin hacer mucho más.

El nivel recomendado cuando tenemos todo funcionando en la mezcla también debe estar cerca de los -20 dB RMS y no debe llegar al 0 dB FS, es decir no debe clipear.

La buena noticia es que si se siguen las sugerencias anteriores se puede llegar a estos valores con mucha mayor facilidad.

Si bien estas son recomendaciones muy válidas hay veces que una mezcla queda un poco más fuerte o más baja que estos niveles y no debería causar mayores inconvenientes, siempre y cuando sean valores razonables. 

Conclusiones

Si hay algo que escucho seguido en mezclas en todos los estilos es que todo ha sido llevado al límite, lo que indefectiblemente nos lleva a un solo lugar: la distorsión. 

Este es un mal con el que todos en algún momento peleamos y la estructura de ganancia es la mejor estrategia para hacer que nuestras mezclan suban de nivel.

En este artículo nos centramos en las etapas de ganancia y los niveles recomendados para tener una mezcla lejos del ruido y de la distorsión pero esto no quiere decir que estos aspectos no deban preocuparnos al momento de grabar.

Estas técnicas de niveles óptimos operativos se aplican o deberían aplicar al momento de grabar, para obtener la mejor relación señal ruido y señal distorsión posibles. Para luego poder plantearse una mezcla en los mismos términos.

Yo solía pensar que estas técnicas eran algo matemáticas y rígidas en el contexto artístico de una mezcla o grabación, sin embargo una vez las adopte y me familiaricé con ellas me fue mucho más fácil llegar a buenos resultados en términos de distorsión y detalle en la mezcla,

Por eso te sugiero que pongas en práctica estas técnicas de ajustes de nivel y de seguro te llevarás más de una sorpresa en cuanto puede mejorar tus producciones con estos simples lineamientos.