MP3

De la Wikipedia, enciclopedia liberă
Salt la: Navigare, căutare

MP3 (MPEG Layer 3) este un format audio multimedia, având la bază comprimarea sunetului cu ajutorul metodei numite în engleză „lossy MPEG compression” (adică, datele care nu pot fi auzite în mod normal nu sunt incluse în fișier). Dezvoltat de Institutul Fraunhofer din Germania, el a fost a treia reușită a acestuia, după MPEG Audio (folosit pentru casetele digitale Philips DCC) și MPEG Layer 2 (utilizat la sonorul Video CD-urilor). Avantajul său principal a fost (și este în continuare) spațiul redus ocupat, însă calitatea sunetului are de suferit în timpul comprimării.

Structura[modificare | modificare sursă]

Offset # dimensiune ( byte ) valoare ( hex ) descriere
0x 2 FF FB 40 HEADER: primii doi bytes identifica fisierul ca mp3.
2x 30 00 - FF structura datelor care delimiteaza MP3-ul. SEMNATURA
22x  ??1 MP3-RAW Octeti care formeaza continutul MP3
 ??2  ??2 MP3-TAG Structura identificator "TAG-ID3". Offsetul este declarat in SEMNATURA
 ??3  ??3 FF Structura semi-XML. Identificatorul suplimentar "TAG-ID3 v2"
 ??4  ??4 FF Structura semi-XML. Alti identificatori.
EOF - 1 1 E0F Ultimul byte.

Istorie[modificare | modificare sursă]

Încă din 1987, institutul Fraunhofer din Germania a început să lucreze la un proiect destinat compresiei audio cu metoda descrisă mai sus, bazat pe tehnica perceptual coding. Este vorba de un algoritm care exploatează slăbiciunile urechii umane, oferind un sunet cât mai apropiat de cel original.

Formatul MPEG Audio MPA ( mpeg audio ) este prima reușită a institutului si a fost folosit doar pentru casetele digitale Philips DCC (Digital Compact Casette, un competitor al lui MiniDisc-urilor Sony) între anii 1992 și 1996. Urmașul său, MPEG Layer 2 (MP2), a fost utilizat pentru sonorul Video CD-urilor și a altor dispozitive multimedia, fiind relativ răspândit și astăzi în domeniul video. A treia versiune a standardului, MPEG Audio Layer 3, are avantajul unei calități audio ridicate, ce i-a adus o popularitate foarte mare. Odată cu răspândirea Internet-ului și implicit a rețelelor de partajat resurse tip "P2P" ( o retea de partajat resurse tip 'peer to peer' permite accesarea concomitenta de fisiere intre mai multi utilizatori ), fenomenul MP3 a luat amploare, devenind un mijloc ilegal de transfer și stocare a muzicii ilegal ( vezi cazul Metallica-Napster ).

Modul de lucru[modificare | modificare sursă]

Perceptual coding este o tehnică ce permite eliminarea cu o acuratețe destul de mare a sunetelor pe care urechea noastră nu le poate distinge, bazându-se pe un model psihoacustic, adică modul în care urechea umană percepe undele sonore. În principiu, se caută crearea unui astfel de model care să ducă la înmagazinarea sunetului folosind cât mai puțini biți; nu se exclude posibilitatea unui sunet total diferit din punct de vedere matematic (eșantioane cu valori depărtate de original) în condițiile în care urechea umană nu observă nici o diferență.

Scăderea calității sunetului este datorată apariției de „goluri” în cazul frecvențelor înalte, ducând la apariția a două fenomene nedorite: dedublarea semnalelor și ringing-ul. Pentru a evita acest lucru, aceste frecvențe sunt pur și simplu eliminate din pasajul muzical, sunetul rezultat fiind „închis”, foarte asemănător cu cazul downsampling-ului. Cu alte cuvinte, downsampling-ul elimină prin natura sa frecvențele înalte, pe când la compresia MP3 această eliminare este necesară pentru păstrarea calității sunetului în limite decente. În plus, chiar dacă aliasing-ul nu este supărător într-un caz particular, frecvențele joase și medii sunt cele mai evidente într-un pasaj muzical, deci avem un motiv în plus pentru a nu ocupa relativ inutil biții (și așa puțini) cu frecvențele înalte.

Tehnic vorbind, este vorba de o combinație dintre doi algoritmi: subband și transform. În cazul unui codec de tip subband, informația audio este separată în funcție de frecvențe, segmentele fiind procesate independent, folosindu-se o acuratețe variabilă, potrivită modului de percepție al urechii. Pentru reținerea unui sunet de calitate este însă necesar un bitrate mare. Pentru un codec de tip transform, sunetul suferă o transformare cosinus (MDCT = Modified Discrete Cosine Transform). Această combinație mai mult sau mai puțin fericită duce la inferioritatea lui MP3 în fața multor alte formate subband, precum MPEG Audio și MPEG Layer 2, dar numai la bitrate-uri mari, adică exact în situațiile în care urechea umană nu (prea) mai face diferența. MP3 moștenește de la ambii algoritmi punctele slabe: calitatea slabă la bitrate-uri foarte mici, sub 128 kbps - de la subband, și imposibilitatea atingerii unei calități foarte bune la bitrate-uri mari - de la transform (materializată în problema pre-echo). El nu este altceva decât un compromis de calitate creat pentru necesitățile anilor '90.

Encodere și setări recomandate[modificare | modificare sursă]

LAME (Lame Ain't an MP3 Encoder), un encoder open-source, este pentru moment encoder-ul ce oferă calitate maximă în cazul comprimării sunetului folosind algoritmul MP3.

Începuturile lui LAME datează din 1998, când un anume Mike Cheng a modificat surselele standard de codare MP3, primele versiuni de LAME fiind simple patch-uri aplicate codului original. Cu timpul, LAME a fost îmbunătățit de numeroși programatori, codul fiind rescris și adăugându-i-se facilități deosebite, precum tehnica VBR. În anul 2000 a depășit din punct de vedere al calității concurentul direct sub acest aspect codarea FhG, în diversele sale variante comerciale[necesită citare].

Setările recomandate constau în folosirea unor preset-uri, care conferă o configurație optimă a parametrilor, determinând obținerea calității maxime la un anumit bitrate. Aceste preset-uri sunt --alt-preset standard, --alt-preset extreme și --alt-preset insane, ele generând un bitrate de aproximativ 192, 256 și respectiv exact 320 kbps. În general, nu este folosită direct aplicația Lame, ci se apelează la frontend-uri, ce au rolul de a ușura operația de comprimare și care deseori sunt însoțite de o funcție de ripping a pieselor muzicale de pe CD-urile audio.

Legături externe[modificare | modificare sursă]