Formaty plików dźwiękowych

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Formaty plików dźwiękowych

CD-Audio[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: CD-Audio.

CD-Audio to standard cyfrowego zapisu dźwięku na płycie kompaktowej, wykorzystujący do tego celu kodowanie PCM o częstotliwości próbkowania 44,1 kHz i rozdzielczości 16 bitów na próbkę.

MIDI[edytuj | edytuj kod]

Przykład muzyki stworzonej w formacie midi
Information icon.svg Osobny artykuł: MIDI.

Plik formatu MIDI (Musical Instruments Digital Interface) ze względu na małe rozmiary plików jest często wykorzystywany do tworzenia podkładu muzycznego dla stron WWW, automatycznie odtwarzanego podczas jej oglądania w przeglądarce (poprzez użycie znacznika <EMBED> i odpowiedniej wtyczki). Plik w tym formacie charakteryzuje się małym rozmiarem - kilkuminutowy utwór muzyczny może być zawarty w pliku o rozmiarze 30-40 kB, w efekcie wczytanie takiego pliku nie zwiększa ogólnego czasu ładowania całej strony.

Mały rozmiar możliwy jest dzięki oparciu na innej zasadzie niż w przypadku pozostałych formatów dźwiękowych: plik nie zawiera spróbkowanego dźwięku, lecz specyficzny rodzaj zapisu nutowego danego utworu.

Standard MIDI opracowany został pierwotnie dla komunikowania się ze sobą elektronicznych instrumentów muzycznych; plik w tym formacie składa się z wielu tzw. ścieżek, z których każda odpowiada brzmieniu określonego instrumentu. Każda ścieżka zawiera szereg tzw. komunikatów MIDI, nakazujących w określonym momencie (każdy komunikat opatrzony jest kodem czasowym) zagrać dźwięk o określonej wysokości i czasie trwania, zmienić głośność danej ścieżki, zmienić tempo itd. Karta dźwiękowa odtwarza takie pliki wykorzystując brzmienia swojego wewnętrznego syntezatora zamiast reprodukować nagrany wcześniej oryginał. Plik taki może zawierać jedynie "czystą" muzykę - niemożliwe jest zawarcie w nim np. śpiewu, mowy czy efektów dźwiękowych (innych niż przewidziane w standardzie MIDI); do tego wszystkiego potrzebne byłoby wykorzystanie dźwięku spróbkowanego.

Konsekwencją założeń MIDI jest rzecz jasna fakt, że ten sam plik będzie brzmiał różnie na różnych kartach dźwiękowych. Najlepszą jakość dźwięku uzyskamy na kartach z tzw. syntezą wavetable, gdzie syntezator wykorzystuje zapisane w pamięci karty próbki dźwięku autentycznych instrumentów muzycznych, znacznie gorsze brzmienie (typowo "syntezatorowe") - na kartach ze "zwykłą" syntezą FM, gdzie dźwięki uzyskuje się poprzez składanie drgań o odpowiednio dobranych częstotliwościach (posiadacze tych ostatnich kart mogą natomiast wykorzystać odtwarzacze plików MIDI realizujące programową syntezę wavetable, jak np. TiMidity). Twórca pliku MIDI nie jest w stanie z góry przewidzieć, jak będzie brzmiało jego dzieło - może to określić jedynie w przybliżeniu.

Obecnie karty dźwiękowe korzystają z tabeli wavetable ładowanej do pamięci RAM komputera. Tabela wavetable może być instalowana wraz ze sterownikami karty dźwiękowej i wtedy można wybrać we właściwościach sterownika jej rozmiar, typowo 2, 4 lub 8 MB. Inną możliwością jest skorzystanie z gotowej tabeli instalowanej przez system Windows XP zawartej w pliku C:\Windows\System32\drivers\gm.dls o rozmiarze 3.28 MB. Rozwiązanie to wymaga dużej mocy obliczeniowej procesora, co obecnie nie jest problemem choć było w przeszłości, stąd wcześniejsze rozwiązanie polegające na wbudowaniu tabeli wavetable w kartę dźwiękową.

Pomimo bezpośredniego związku danych w plikach *.MID a sygnałami MIDI, nie należy utożsamiać tych dwóch standardów. Pliki te przechowują tylko podstawową część sygnałów jakimi opisuje się dźwięk generowany przez urządzenia MIDI. Innymi słowy utwór stworzony przy pomocy profesjonalnych urządzeń MIDI nie należy zapisywać do tego formatu, gdyż część z danych zostanie pominięta, więc niezapisana (bardziej finezyjne manipulacje dźwiękami i parametrami).

Rozszerzenia: *.MID, *.MIDI, *.RMI

Przed erą MP3 powstały pliki MOD, które korzystają z próbek dźwięku zawartych w samym pliku. Drugą ich część stanowi zapis komunikatów podobny do MIDI. Gdyby nie rozwój mp3, mogłyby być obecnie dużo popularniejsze.

WAV[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: WAV.

Format charakterystyczny dla platformy Windows, zawiera dźwięk w nieskompresowanym formacie PCM. Rzadko stosowany w internecie ze względu na rozmiary plików. Pozwala na zapis muzyki z jakością płyty kompaktowej (44.1 kHz, 16 bit, stereo) bez strat jakości (wtedy na 1 sekundę dźwięku potrzeba 172 kB)

Aby nagrać dźwięk w formacie WAV pod Windows można posłużyć się systemowym rejestratorem dźwięku lub skorzystać z bardziej zaawansowanych programów jak np. Cool Edit.

Ścieżki skopiowane z audio CD daje się zapisać w tym formacie za pomocą programów zwanych ripper.

Wielkość 1 sekundy pliku WAV[edytuj | edytuj kod]

8bit mono 16bit mono 8bit stereo 16bit stereo
8kHz 7,81kB 15,62kB 15,62kB 31,25kB
22kHz 21,48kB 42,96kB 42,96kB 85,93kB
44.1kHz 43,06kB 86,13kB 86,13kB 172,26kB

AIF, AIFF, AIFC, AIFR[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: AIFF.

Format popularny niegdyś na Macintoshach, obecnie rozpowszechniony również na pecetach. Pliki AIFF nie są kompresowane, chociaż istnieje format AIFF-C, który umożliwia kompresję nawet w stopniu 6:1.

Windows Media Player, QuickTime Player, DeliPlayer

MP2, MPG, MPE, MPEG, MPEG2[edytuj | edytuj kod]

Pliki o dużym stopniu kompresji, poprzednicy standardu MP3. Zapis muzyki w tym formacie łączy się ze stratami jakości. Pliki o takich rozszerzeniach mogą zawierać także filmy.

Programy: Windows Media Player, Deli Player, Winamp

MP3[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: MP3.

Format wykorzystujący standard kompresji MPEG-1 Audio Layer 3.

Grupa Motion Picture Expert Group przy współpracy z Instytutem Frauenhofera z niemieckiego Erlangen, stworzyła algorytm kompresji i zapisu plików multimedialnych, ze szczególnym naciskiem na obraz (format MPEG). Jednak format ten można było wykorzystać również do zapisu audio i tak powstał format MP3. Największą zaletą tego zapisu jest możliwość skompresowania pliku typu WAV do MP3 nawet 12,13-krotnie, czyli dużo bardziej niż przy pomocy popularnych algorytmów kompresujących (ZIP, RAR, ARJ).

Jakość bliska CD wymaga strumienia 128 Kbitów/sek, około 1 MB/minutę, spotykane zakresy od kilkunastu Kb/s (mowa, wiadomości strumieniowo, monofonicznie) do 320 Kb/s (wysoka jakość), stereofoniczne. Kodowanie VBR (Variable Bit Rate) daje nieco lepszą jakość przy tej samej wielkości plików.

Na popularność MP3 wpływa przede wszystkim wysoki stopień kompresji danych dźwiękowych, dzięki czemu pliki w tym formacie mają stosunkowo niewielkie rozmiary przy jednoczesnej wysokiej jakości brzmienia.

Pliki MP3 można odtwarzać przy pomocy różnych programów komputerowych (na przykład Winampa dla systemów Microsoft Windows, Macamp dla Macintosha, XMMS dla systemów uniksowych), natomiast do ich tworzenia służy na przykład program MP3 Compressor. Niektóre discmany potrafią odtwarzać płyty CD-R i CD-RW zawierające pliki MP3.

Mp3Pro[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: Mp3PRO.

Technologia opracowana przez szwedzką firmę Coding Technologies, a licencjonowana przez Thomson Multimedia. W założeniach miała ona całkowicie zastąpić bardzo popularny format MP3.

Nowa technologia, w której powstał Mp3Pro, pozwala na zmniejszenie objętości plików dźwiękowych nawet o 50% w porównaniu z MP3. Utwór zakodowany w MP3Pro z gęstością 64 kb/s odpowiada teoretycznie jakością utworowi MP3 zakodowanemu z gęstością 128 kb/s. W praktyce jakość tych plików jest wyższa, gdyż MP3Pro nie usuwa dźwięków o najwyższych częstotliwościach, jak to robi MP3. Zmniejszenie wielkości plików ma przede wszystkim zaspokoić potrzeby użytkowników Internetu - o wiele łatwiej przesyłać je pocztą elektroniczną. Ponadto pozwala to na zmieszczenie dwukrotnie większej liczby plików w pamięci przenośnych odtwarzaczy. MP3Pro jest w pełni kompatybilne jedynie z odtwarzaczami MP3 produkowanymi przez firmę Thomson, przez co format ten jest mało rozpowszechniony. Opłaty za korzystanie z nowego formatu są niewiele wyższe niż za "zwykłe" MP3.

Do konwersji na format Mp3Pro przydatne są programy Adobe Audition, Nero Wave Editor oraz darmowy Thomson mp3Pro audio player.

MP4[edytuj | edytuj kod]

Kodek o nazwie MP4 to swego rodzaju oszustwo (tak zwane zatargi o prawa autorskie). Format ten oparty jest na technologii MPEG-4 i standardzie AAC, lecz stanowi zastrzeżone rozwiązanie firmowe. Twórca formatu MP4, firma Global Music One, zdecydował się nazwać swoje dzieło w taki sposób licząc zapewne na "podczepienie się" pod ewentualny sukces formatu MPEG-4.

Format zapewniający wysoką jakość i dobrą kompresję. Każdy plik MP4 zawiera w sobie odtwarzacz, więc użytkownik nie musi posiadać programu obsługującego ten format. Pliki MP4 ?opakowane w format DAP (Digital Audio Postcard, czyli cyfrowa pocztówka dźwiękowa) mogą być rozprowadzane za darmo przez właściciela praw autorskich i przekazywane dalej przez użytkowników.

Pliki takie mogą zawierać łącza do witryn internetowych udostępniających dodatkowe informacje lub umożliwiających zakup albumu. Pomimo swoich zalet, format DAP nie rozpowszechnia się zbyt szybko. Firma Global Music, wraz z kilkoma wytwórniami, które do niej dołączyły, regularnie publikuje nowe utwory w formacie MP4, jednak działalność ta ma stosunkowo ograniczony zakres, a liczba dostępnych utworów MP4 jest praktycznie niezauważalna w stosunku do liczby legalnych i nielegalnych plików w formacie MP3 i innych.

Wielu uważa, że Global Music, poprzez zawłaszczenie nazwy nowo powstającego, otwartego standardu, postąpiła nieuczciwie. W ten sposób naraziła się na krytykę ze strony użytkowników innych formatów. Otwarte standardy, takie jak MPEG-4, zapewniają w pewnej mierze możliwość przenośności i współpracy różnych rozwiązań, zaś standardy zamknięte mają za zadanie jedynie opanować fragment rynku, przynosząc zysk pojedynczej firmie. Udostępnione w Internecie zamknięte rozwiązanie nie cieszą się więc wielkim zainteresowaniem. Poza tym, Global Music jak na razie woli współpracować bezpośrednio z wytwórniami i dotychczas nie udostępniła wersji kodera przeznaczonej dla zwykłych użytkowników. Powyższe cechy formatu MP4 przesądzają o jego przegranej w rywalizacji z MP3.

Ogg Vorbis[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: Vorbis.

Ogg i Vorbis to odpowiednio kontener multimedialny i stratny kodek audio stworzone i popularyzowane przez fundację Xiph.org, format jest rozprowadzony na zasadach FLOSS i nie jest ograniczony patentami. Pliki mają zazwyczaj końcówkę .ogg, co stało się źródłem pewnych nieporozumień. Zapewniany stosunek jakości dźwięku do objętości wynikowego pliku jest lepszy od tego, co oferuje MP3, kosztem jednak większych wymagań podczas odtwarzania. Jest praktycznie domyślnym formatem audio dla większości dystrybucji Linuksa, aczkolwiek jest też obsługiwany przez wiele sprzętowych i programowych odtwarzaczy na inne platformy. Mimo wszystko nie znalazł szerszego zastosowania w radiach internetowych, jak i sklepach on-line.

QuickTime Audio[edytuj | edytuj kod]

Pomimo długiej obecności na rynku QuickTime nie zdobył większej popularności jako format rozpowszechniania plików dźwiękowych. Co więcej, niewielu użytkowników wie, iż formatu QuickTime można używać także do tworzenia plików zawierających wyłącznie dźwięk. Z tego względu w Internecie bardzo ciężko znaleźć takie pliki. Wynika to zapewne z faktu, iż system ten nie oferuje możliwości ripowania płyt CDAudio, co utrudnia tworzenie plików dźwiękowych.

  • .qt

Do kompresji dźwięku użyto kodera QDesign, który charakteryzuje się bardzo dobrym współczynnikiem kompresji.[potrzebne źródło]

RealAudio[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: RealAudio.

Format RealAudio został przedstawiony w 1995 roku przez firmę RealNetworks specjalnie z myślą o Internecie. Obecnie jest on standardem strumieniowego przesyłania dźwięku przez Internet. Do odbioru jego zawartości wystarczy modem 28,8 Kbps, ale możliwe jest także przesyłanie dźwięku o bardzo wysokiej jakości dla odpowiednio szybkich łącz.

Przy odpowiednim oprogramowaniu system RealAudio pozwala na nadawanie audycji na żywo. Jakość dźwięku zależy głównie od możliwości naszego modemu i łącza. Kłopoty te można jednak ominąć wybierając podczas zapisu pliku Real Audio docelową prędkość transmisji. RealSystem G2, ma możliwość przesyłania również plików w innych formatach.

Obecne wersje kodera Real mogą generować pliki o wysokiej jakości przy praktycznie wszystkich gęstościach strumienia bitowego a jakość porównywalna z radiem FM osiągalna jest już przy gęstości 20 do 34 kb/s (przy wyższych gęstościach strumienia bitowego dokładne testy wykazują niewielkie zniekształcenia wysokich tonów).

Poza wysoką jakością kompresji, koder Real charakteryzuje się dużą szybkością działania. Być może jednym z najważniejszych powodów, dla których produkt firmy Real nie osiągnął popularności MP3, jest fakt, iż MP3 postrzegany jest głównie jako format plikowy, umożliwiający tworzenie i przechowywanie kolekcji utworów, podczas gdy Real kształtował swój obraz jako firmy zajmującej się głównie transmisją strumieniową.

Pliki RealAudio o jakości podobnej do MP3 są mniejsze i od razu gotowe do transmisji strumieniowej, jednak koszt oprogramowania serwera jest zbyt duży dla przeciętnego użytkownika co czyni tę cechę nieistotną.

Pliki *.ra *.rm możemy udostępnić do pobrania zamieszczając odsyłacz bezpośrednio do niego na stronie WWW. Poza innym formatem pliku, sytuacja ta nie różni się niczym od występującej w przypadku plików WAV czy MP3 - plik zostanie pobrany przez przeglądarkę na dysk, a następnie odtworzony przez odtwarzacz RealPlayer.

Możemy jednak go także strumieniować - wówczas na stronie umieścimy tylko odsyłacz do metapliku (tradycyjnie metapliki RealMedia mają rozszerzenie *.ram), a w metapliku wpiszemy adres właściwego pliku *.rm. RealPlayer będzie wówczas odtwarzał plik w miarę pobierania danych z sieci.

WMA (Windows Media Audio)[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: Windows Media Audio.

Windows Media Audio został stworzony przez firmę Microsoft.

Użytkownicy zauważyli, że o ile WMA znakomicie radzi sobie z kompresją muzyki, to kompresja nagranej mowy pozostawia wiele do życzenia. Wprawdzie wiele z tych wad wyeliminowano lub chociaż poprawiono w najnowszej wersji kodeka Windows Media Audio 8, ale jakościowo nadal ustępuje on MP3.[potrzebne źródło]

Zgodnie z zapewnieniem producenta funkcja kodowania Windows Media Audio 8 dostarcza dźwięk o jakości jak z płyty CD i rozmiarze dwukrotnie mniejszym niż pliki w formacie MP3, dzięki czemu podwaja ilość miejsca przeznaczonego na przechowywanie muzyki i skraca czas pobierania muzyki cyfrowej o jakości płyt CD.[potrzebne źródło]

Atutem tego standardu jest strumieniowa obsługa plików i łatwa integracja ze środowiskiem XML. Najczęściej dane zakodowane za pomocą WMA umieszcza się w kontenerze ASF.

Beatnik[edytuj | edytuj kod]

Beatnik, firmy Headspace, obsługuje format [RMF], czyli Rich Music Format. Jest to zaawansowana technika, pozwalająca uzyskać bardzo bogate brzmienie, przy niewielkiej objętości pliku.

Liquid Audio[edytuj | edytuj kod]

To szyfrowany format plików muzycznych zaproponowany przez wytwórnię EMI. Standard ten, jak twierdzą twórcy, ma zabezpieczać utwór przed nielegalnym kopiowaniem. Aktualnie format jest na dobrej drodze do sukcesu - w Internecie istnieje już firmowy sklep Liquid, w którym można kupić wybrane utwory, a niektórych posłuchać bezpłatnie.

Jakością jest zbliżony do mp3, a wielkie koncerny typu BMG Entertainment czy Universal Music skłaniają się do sprzedaży utworów swoich artystów właśnie w Liquid Audio.

Aby móc skorzystać z tej oferty, trzeba zaopatrzyć się w firmowy odtwarzacz Liquid Player i zarejestrować się na stronie producenta.

a2bmusic[edytuj | edytuj kod]

Firma AT&T Labs sprzedaje muzykę w formacie a2bmusic. Tak jak w Liquid Audio dźwięk przesyłany poprzez sieć jest zaszyfrowany, co ma uniemożliwić nielegalne kopiowanie, jakość zaś dźwięku jest porównywalna z muzyką z płyt CD. Sam plik a2bmusic zajmuje mniej miejsca niż mp3. Przy zakupie utworu dostaje się także okładkę płyty i teksty. Dotychczas w tym formacie wydanych zostało kilkaset utworów.

Zobacz też[edytuj | edytuj kod]