Cyfrowe audio jest od bardzo dawna, więc na pewno jest tam mnóstwo formatów audio. Oto niektóre z najczęstszych, co je wyróżnia i do czego ich używać.
Zanim porozmawiamy o codziennych formatach audio, ważne jest zrozumienie podstaw, a to oznacza zrozumienie PCM. Potem zajmiemy się skompresowanymi formatami.
Modulacja impulsów została stworzona w 1937 roku i jest najbliższym przybliżeniem analogowego dźwięku. Oznacza to, że przebieg analogowy jest przybliżany w regularnych odstępach czasu. PCM charakteryzuje się dwiema właściwościami: szybkością próbkowania i głębokością bitową. Częstotliwość próbkowania mierzy częstotliwość (w sekundach) amplitudy przebiegu, a głębia bitowa mierzy możliwe wartości cyfrowe. Pod względem formatów audio jest to podstawa.
Prawdziwy dźwięk w realnym świecie jest ciągły. W świecie cyfrowym tak nie jest. W jakiś sposób jest to bardziej mylące z dźwiękiem niż z wideo, więc spójrzmy na wideo jako punkt porównania. To, co interpretujemy jako "ruch" lub myślenie "płynne" i stale poruszające, jest w rzeczywistości serią nieruchomych obrazów. W ten sam sposób amplituda fal dźwiękowych w formacie cyfrowym nie jest "płynna" ani ciągle się zmienia. Zmienia się w oparciu o określone kryteria w określonych odstępach czasu.
Obraz z Wikipedia
Wiem, że jest tu wiele rzeczy, które mogą nie być drugą naturą, chyba że jesteś inżynierem, fizykiem lub audiofilem, więc zrównajmy to z analogią.
Powiedzmy, że woda płynąca z otwartego kranu jest twoim "analogowym" źródłem dźwięku. Temperaturę wody możemy porównać do amplitudy fali dźwiękowej; Jest to właściwość, która musi zostać zmierzona, abyś mógł ją dobrze się cieszyć. Próbkowanie to liczba razy na sekundę, w której zanurzasz palec w płynącej wodzie. Im częściej zanurzasz w nim palec, tym bardziej "ciągłe" stają się zmiany temperatury. Jeśli wsadzisz palec w bieżącą wodę 44,100 razy na sekundę, to prawie tak, jakbyś cały czas trzymał palec pod palcem, prawda? To podstawowa idea pobierania próbek.
Głębia bitowa jest nieco trudniejsza. Zamiast używać palca, powiedzmy, że użyłeś naprawdę termometru. Zasadniczo mówiło się "Gorąco" za cokolwiek powyżej temperatury pokojowej i "Zimno" za wszystko poniżej. Bez względu na to, ile razy zanurzysz go w wodzie, nie dostarczy Ci to zbyt wielu użytecznych informacji. Teraz, jeśli zamiast tylko 2 opcji, powiedzmy, że termometr ma 16 możliwych wartości, które można wykorzystać do pomiaru temperatury wody. Bardziej przydatne, prawda? Głębokość bitów działa w ten sam sposób, ponieważ wyższe wartości umożliwiają dokładniejsze odwzorowanie dynamicznych zmian amplitudy dźwięku.
Jak już wspomniano, PCM jest podstawą cyfrowego dźwięku, wraz z jego wariantami. PCM próbuje modelować kształt fali, w jak największej nieskompresowanej chwale. Jest wyjątkowy, gotowy do utknięcia w cyfrowym procesorze sygnałowym i jest mniej lub bardziej uniwersalny. Większość innych formatów manipuluje dźwiękiem za pomocą algorytmów, więc muszą być dekodowane podczas odtwarzania. Dźwięk PCM jest uważany za "bezstratny", jest nieskompresowany, a zatem zajmuje dużo miejsca na dysku twardym.
Obraz wg codepo8
Zarówno WAV, jak i AIFF są bezstratnymi formatami kontenerów audio opartymi na PCM, z niewielkimi zmianami w przechowywaniu danych. Dźwięk PCM dla większości ludzi jest dostępny w tych formatach, w zależności od tego, czy korzystasz z systemu Windows, czy OS X, i można je konwertować do siebie nawzajem bez obniżania jakości. Obie są również uważane za "bezstratne", nie są kompresowane, a stereofoniczny (2-kanałowy) plik audio PCM, próbkowany z częstotliwością 44,1 kHz (lub 44100 razy na sekundę) przy 16 bitach ("jakość CD") wynosi około 10 MB na minuta. Jeśli nagrywasz w domu w celu miksowania, właśnie tego chcesz użyć, ponieważ jest to pełna jakość.
Obraz wg CyboRoZ
Free Lossless Audio Codec, Apple Lossless Audio Codec i Monkey's Audio to wszystkie formaty kompresujące dźwięk, podobnie jak wszystko, co jest skompresowane w cyfrowym świecie: za pomocą algorytmów. Różnica pomiędzy spakowanymi plikami a plikami FLAC polega na tym, że FLAC jest zaprojektowany specjalnie dla audio, a więc ma lepsze współczynniki kompresji bez utraty danych. Zazwyczaj widzisz około połowę wielkości WAV. Oznacza to, że plik FLAC dla dźwięku stereo w "jakości CD" działa z grubsza 5 MB na minutę.
Od góry jest to, że jeśli chcesz manipulować dźwiękiem, możesz przekonwertować z powrotem na WAV bez utraty jakości. Jeśli jesteś audiofilem i słuchasz muzyki w dynamicznych zakresach, te formaty są dla Ciebie. Jeśli masz świetny zestaw głośników, puszek lub wkładek dousznych, te formaty wydobywają dźwięki, które je prezentują.
Obraz wg patrick h lauke
Większość formatów wyświetlanych w codziennym użyciu jest "stratnych"; pewien stopień jakości dźwięku poświęca się w zamian za znaczną poprawę rozmiaru pliku. Średnia jakość MP3 "CD quality" wynosi około 1 MB na minutę. Duża różnica w porównaniu do PCM, nie? Nazywa się to kompresją, ale w przeciwieństwie do formatów bezstratnych, nie można tak naprawdę odzyskać tej jakości, gdy usuniesz ją w stratnych formatach. Różne formaty stratne używają różnych algorytmów do przechowywania danych, dlatego zazwyczaj różnią się rozmiarem pliku dla porównywalnej jakości. Skalowane formaty używają również bitrate, aby odnieść się do jakości dźwięku, która zwykle wygląda jak "192 kbit / s" lub "192 kbps". Większe liczby oznaczają, że więcej danych jest wypompowywanych, więc jest więcej zachowywania szczegółów. Oto kilka szczegółów dla bardziej popularnych formatów.
Stratne formaty są tym, czego używasz dla wszystkich rzeczy, których słuchasz i przechowujesz. Zostały zaprojektowane tak, aby oszczędzać miejsce na dysku twardym. Wybór formatu zależy od tego, z jakiego cyfrowego odtwarzacza audio korzystasz, ile masz miejsca, jak duży jest twój nitpicker, oraz od mnóstwa zmiennych. W dzisiejszych czasach komputery będą odtwarzać wszystko, większość odtwarzaczy audio (oprócz Apple'a) będzie robić wiele stratnych formatów, a coraz więcej FLAC i APE. Apple przykleja się do MP3, ALAC i AAC.
Oczywiście, że tak. Ostatecznie to twoje uszy pochłaniają większość tych rzeczy, ale to jest poważny powód, by poważnie myśleć o jakości. Kiedy po raz pierwszy zacząłem tworzyć swoją kolekcję muzyki cyfrowej, nie mogłem odróżnić 128-bitowych plików MP3 i audio CD. Dla moich uszu nie było zauważalnej różnicy. Z biegiem czasu zauważyłem jednak, że 256 kbitów brzmi znacznie lepiej, a gdy dostałem naprawdę fajny (i drogi!) Zestaw słuchawek, wróciłem na pełne płyty audio! Zależy to również od gatunku muzyki.
Obraz wg jonchoo
Istnieje wiele zmiennych tutaj, ludzie, nie pomylcie się z tym. Minęło trochę czasu, zanim zdecydowałem się na używanie FLAC do muzyki i 320kbps MP3 do końca. Chodzi mi o to, że powinieneś eksperymentować, aby zobaczyć, co działa najlepiej dla ciebie i twojej muzyki, ale pamiętaj, że wraz ze zmianą twoich upodobań, twoje postrzeganie, twój sprzęt i znaczenie jakości też.
Wszystkie te rzeczy stają się jeszcze trudniejsze, gdy mówisz nie tylko o muzyce, ale o utworach głosowych, efektach dźwiękowych, biało-brązowym hałasie itp. Tam jest cały świat dźwiękowy, więc nie zniechęcaj się! Ucząc się tego, co możesz i słuchając samemu, możesz wykorzystać te informacje do swoich zalet w przyszłych projektach audio. Zostawię ci jedną z najlepszych rad, jakie kiedykolwiek otrzymałem: "rób to, co po prostu brzmi dobrze".