Wie man Vocals richtig abmischt

Die größte Herausforderung der Musikproduktion ist es, Stimmen zu mixen. Denn: Jede Stimme. jede Aufnahme ist anders und verlangt nach einer individuellen Lösung von Fall zu Fall. Zeitgleich sind die Stimmen meist das lauteste Element eines Liedes, zudem weiß man, wie die menschliche Stimme klingt und ist mit ihr vertraut. Das lässt wenig Raum für Fehler, sodass schnell jede Unvollkommenheit auffällt. Es gibt eine Reihe an erfolgreichen Vorgehensweisen, die dabei helfen, Vocals richtig abzumischen und zu einem professionellem Ergebnis führen. Und dieser Artikel soll ein Leitfaden durch die wichtigsten Instrumente und Verfahren geben.

Dynamik anpassen

Im ersten Schritt geht es darum, die Lautstärken der Spuren anzugleichen und abzustimmen. Je nach Lied, Stimmung und Geschmack passt man grundlegend die Lautstärken der Audiospuren an und stimmt sie passend zum Beat. Dabei ist darauf zu achten, nicht über -6dB Lautstärke zu kommen, da wir die Lautsärken in den folgenden Schritten noch zielgerichtet bearbeiten wollen, ohne dabei zu übersteuern.

Nun ist es wichtig, die Lautstärke der einzelnen Audiospuren anzugleichen, um ein möglichst gleiches Signal zu erlangen, welches man in die Plug-Ins gibt. Dazu gebraucht man die Funktion der Audio-Automatisierung. So sorgt man dafür, die Lautstärken in einzelnen Bereichen anzuheben oder gegebenenfalls runter zu drehen. Auch wenn die folgenden Schritte dazu führen, dass sich die Lautstärken verändern, sollte man diesen Schritt ausführen. Es ist wichtig, immer von einer ausgeglichenen Position zu starten, um das Stimmbild nicht zu verzerren.

Operativer Equalizer

Im zweiten Schritt verwendet man nun den Equalizer, um Störbereiche zu erkennen und herauszunehmen. Zum Start sollte man im Equalizer alles bis 100Hz abschneiden, um die tiefsten Frequenzbereiche zu entfernen. Hier verbergen sich Hintergrundgeräusche und Störtöne. Auch im Bereich von 400 bis 500Hz kommt es oftmals zu Störsignalen – auch hier ist es sinnvoll, den Bereich etwas abzuschneiden.

Durch Sweeping findest du sehr schnell die richtigen Frequenzen, die abgeschwächt werden müssen. Dabei benutzt man einen der Parameter im EQ, stellt den Gain extrem hoch und wischt im Prinzip durch die Frequenzbereiche, bis man die Frequenz gefunden hat, die Störsignale enthält. Die letzten Störsignale befinden sich in den höchsten Frequenzen, daher sollte man alles ab 7kHz entfernen.

De-Esser

Der De-Esser wird benötigt, um schrille Zischlaute auf der Audiospur abzuschwächen. Der De-Esser kompressiert technisch gesehen das Zischen, indem er nur die hohe Frequenz der Zischlaute abschwächt, wenn diese zu laut werden. Der Frequenzbereich liegt bei den meisten Männern zwischen 5 bis 6kHz und bei Frauen bei 7 bis 9kHz.

Mit dem Threshold beziehungsweise der Sensibilität stellt man nun ein, wie laut das Signal sein muss, bis der De-Esser greift. Nun muss nur noch die Stärke der Reduktion eingestellt werden, um zum gewünschten Ergebnis zu kommen.

Bildquelle: Screenshot Logic Pro X (V10.5.1)

Klanglicher Kompressor

Nun benutzt man Kompressoren dazu, die Stimme zu formen, noch weiter nach vorne zu holen und die Lautstärken zu justieren. Hier sollte man langsame Attack- und Release-Zeiten benutzen. Die Attack-Zeit ist dabei der wichtigste Parameter, der den Ton der Stimme bestimmt. Starte bei knapp 15ms und taste dich dann an schnellere beziehungsweise langsamere Attack-Zeiten heran.

Ein schneller Attack (5ms) lässt die Stimme satter klingen, während eine schnellere Attack (30ms) die Stimme aggressiver wirken lässt. Die Release-Zeit sollte ungefähr im Bereich um 40ms liegen. Zuletzt passt man den Threshold und die Ratio an, um maximal 2 bis 3dB Verstärkungsreduktion zu erhalten. Der Threshold sollte dabei circa bei -24dB liegen, Make Up bei 2dB und der Knee sollte weich eingestellt sein.

Bildquelle: Screenshot Logic Pro X (V10.5.1)

Klanglicher Equalizer (Nie mehr als 5dB)

Im nächsten Schritt wenden wir nun einen Equalizer an, um verschiedene Frequenzbereiche der Stimmen zu formen und Akzente zu setzen. Wichtig ist dabei, die Frequenzen nie mehr als 5dB zu verändern, um das Stimmbild nicht zu verzerren und unnatürlich klingen zu lassen. Den Bereich in 100 bis 200Hz sollte man etwas anheben, denn so erhält man etwas Wärme und Körper in der Stimme.

Um die Nasalität der Stimme zu minimieren, kann man dazu auch um 800Hz schneiden. Danach hebt man die Bereiche von 1 bis 2kHz und 4 bis 5kHz nach Ermessen an, um die Stimme weiter in den Vordergrund zu holen. Im letzten Schritt wird im Bereich von 6 bis 7kHz dafür gesorgt, ein wenig Luft in die Stimme zu bekommen und Akzente in den Höhen zu setzen.

Bildquelle: Screenshot Logic Pro X (V10.5.1)

Dynamischer Kompressor

Mit diesem Kompressor versucht man nun die lautesten Frequenzen zu kompressieren. Dazu werden ein höherer Threshold und Ratio, eine schnellere Attack und ein hartes Knee benötigt. Die Attack sollte zwischen 2 und 10ms greifen, bei einer zeitgleichen Einstellung des Releases auf knapp 20ms. Danach gilt es, die Ratio und den Threshold so festzulegen, dass man wieder zwischen 2 bis 3dB Verstärkungsreduktion erhält. Auch hier sollte man wieder bei einem Threshold von -24dB starten und das Make Up auf circa 1dB einstellen.

Bildquelle: Screenshot Logic Pro X (V10.5.1)

Pitch Correction/Autotune

Pitch Correction oder Autotune wird dazu verwendet, die Tonhöhen der Audiospuren zu korrigieren und auf die Tonlage der Melodie anzupassen. Das stärkt die Stimme weiter und bringt den Beat mit der Audio in Einklang. Dazu gibt man den Grundton der Tonleiter an, in der sich die Melodie befindet und legt fest, wie schnell das Audiosignal die korrigierte Zieltonhöhe erreicht. Autotune bringt viele Möglichkeiten mit sich, die Stimme grundlegend zu verändern. Der richtige Umgang wird in einem weiteren Artikel genauer erklärt.

Send – Signals

Nun kommen wir zu den Send-Signalen. Man legt dabei die Plugins auf einen Bus und sendet nur ausgewählte Spuren in diesen. Dadurch, dass das jeweilige Plugin nur einmal benutzt wird, belastet man die CPU deutlich weniger, während man die Kontrolle über die einzelnen Spuren mit der Stärke des Bus Signals nicht verliert. Die Plugins sollten dabei auf jeden Fall in Stereo ausgesendet werden.

Reverb

Reverb wird dazu verwendet, der Stimme einen Hall-Effekt beizugeben. Im Prinzip gibt es unendlich verschiedene Reverbs, die diverse Räume, Konzertsäle und elektronischen Hall nachbilden. Dabei ist insbesondere auf die Hall-Zeiten zu achten, da eine lange Hall-Zeit die Stimme in den Hintergrund wirft und sich daher meistens nur für Hintergrundgesang und Adlips eignet.

Die Size dient dazu, die Größe des Raumes einzustellen. Mit dem Pre-Delay kann man dann bestimmen, inwieweit sich der Hall-Effekt nach Eingang des Audio Signals verzögert. Dieser sollte dabei zwischen 40 bis 120ms liegen. Alles, was darunter liegt, ist zu sehr mit der Audio verschmolzen, während darüberhinaus der Hall-Effekt abgetrennt klingt.

Danach benutzt man nun den meist eingebauten EQ, um den Reverb weiter zu formen. Man sollte den Bereich bis mindestens 80Hz und ab 3kHz schneiden, um die niedrigsten und höchsten Frequenzen zu entfernen und Störsignale zu minimieren. Danach kann man noch den Bereich um 300 bis 700Hz schwächen. Auch hier verbergen sich oft Störungen, die den Effekt unklar klingen lassen. Zum Schluss sollte Wet auf 100 Prozent eingestellt werden, da man den Anteil des Effekts auf die Audio über das Send-Signal einstellt und nicht über die Dry/Wet Regler.

Bildquelle: Screenshot Logic Pro X (V10.5.1)

Delay

Der Delay funktioniert im Prinzip wie ein extrem genaues Echo. Wie der Name es schon verrät, sorgt dieses Plugin dafür, dass eingehende Signal um vorgegebene Millisekunden zu verzögern. In Verbindung mit dem Ursprungssignal kann man damit interessante Klänge erzeugen und der Stimme mehr Volumen beziehungsweise mehr Flow geben. Auch auf dem Delay ist es sinnvoll, einen Equalizer anzuwenden, um das Klangbild zu säubern und Platz im Mix zu schaffen. Alles unter 200 bis 300Hz und über 5000Hz ist daher irrelevant, da diese Störungen enthalten und das Klangbild trüben.

Bildquelle: Screenshot Logic Pro X (V10.5.1)

Fazit

Von der Aufnahme der Vocals bis hin zur Nachbearbeitung ist oftmals ein erheblicher Aufwand notwendig, um professionellen Maßstäben gerecht zu werden. Mixing ist zeitaufwendig und beinahe frustrierend, wenn man keinem klaren Konzept nachgeht. Je öfter man die Techniken und sein Gehör jedoch übt, umso bessere Ergebnisse wird man erzielen. Möglicherweise muss man weitere Recherchen angehen, wenn bestimmte Probleme auftauchen oder weitere Effekte verwendet werden sollen, die diesen Leitpfaden übersteigen. Doch dazu muss man sich erst einmal den Problemen stellen und auf sein Gehör vertrauen und schon bald wird es eine eurer Stimme sein, die andere zum Vergleich heranziehen werden.

Bildquelle: Screenshot Logic Pro X (V10.5.1)