Kompresja dynamiki

Z Wikipedii

Skocz do: nawigacji, szukaj
Kompresja dynamiki – to proces polegający na zmniejszeniu dynamiki sygnału. Polega na zmniejszeniu amplitudy głośnych fragmentów i pozostawieniu cichych bez zmian. Sygnał poddany kompresji jest cichszy od pierwotnego, często więc po skompresowaniu jego głośność jest ponownie zwiększana. Powoduje z jednej strony wrażenie bliskości i intensywności dźwięku, ale jednocześnie spłaszczenie i monotonię, bardzo często nawet zniekształcenie, a w skrajnych przypadkach wystąpienie analogowego lub cyfrowego przesterowania sygnału (w zależności od metody kompresji). Działaniem odwrotnym jest ekspansja dynamiki.

Różnice między kompresją dynamiki a normalizacją

[edytuj] Przykład z samochodem

Kompresja ma sens tam, gdzie duża dynamika sygnału utrudniałaby odbiór, np. w samochodzie. Silnik samochodu jest stosunkowo głośny, co utrudnia ustalenie komfortowej głośności dźwięku. Gdyby muzyka miała dużą dynamikę (czyli była momentami bardzo głośna, a momentami bardzo cicha), to albo byłoby słychać jedynie głośne momenty a poza tym muzyka ginęłaby w huku silnika, albo byłaby słyszalna, ale wtedy głośne momenty byłyby za głośne. Kompresja dynamiki powoduje, że muzyka ma cały czas mniej więcej tę samą głośność i to umożliwia słuchanie jej w samochodzie. Nie tłumaczy to jednak dlaczego poddawane temu procesowi są praktycznie wszystkie dostępne obecnie w sklepach płyty muzyczne. Z nadużywaniem kompresji dynamiki wiąże się problem wojny głośności.

Kompresja dynamiki na płytach CD wynika z parametrów urządzeń domowego audio oraz z typowych warunków odsłuchowych. Większość sprzętu nie zapewnia dynamiki na poziomie płyty CD (ponad 96 dB). Jeśli chodzi o warunki odsłuchowe to musimy wziąć pod uwagę, że większość użytkowników nie słucha muzyki z naturalnym poziomem głośności (lecz ciszej), a samemu dźwiękowi towarzyszą odgłosy otoczenia (np. pracująca pralka czy sokowirówka, przy których obsłudze słuchający postanowił włączyć muzykę). Brak kompresji uniemożliwiałby poprawny odbiór dźwięku w niesprzyjających warunkach lub na sprzęcie niższej jakości.

[edytuj] Parametry kompresji

Istnieje wiele urządzeń i programów komputerowych umożliwiających kompresję na różne sposoby. Najczęstsze parametry kompresji, które można dostosować to:

  • Threshold - próg głośności powyżej którego ograniczana jest dynamika dźwięku. Sygnał o mniejszej głośności jest pozostawiany bez zmian.
  • Ratio - poziom kompresji, wyrażany stosunkiem n:1. Jeżeli sygnał wejściowy ma głośność o x decybeli wyższą od poziomu threshold, sygnał wyjściowy będzie miał głośność o x/n wyższą od threshold. Kompresory o ratio 10:1 lub większym nazywane są limiterami.
  • Attack - minimalny czas trwania dźwięku powyżej poziomu threshold, który powoduje zadziałanie kompresji (stłumienie głośności).
  • Release - czas po opadnięciu głośności poniżej poziomu threshold, po którym dźwięk przestaje być kompresowany.

[edytuj] Typowe nieporozumienie

Kompresja dynamiki jest czymś zupełnie innym niż kompresja dźwięku (danych) taka jak np. mp3. Kompresja dynamiki odnosi się do dynamiki (miejsc cichych i głośnych) w sygnale, natomiast cyfrowa kompresja dźwięku (danych) jest bezstratną lub stratną kompresją zgodną z definicją kompresji danych.