Novi audio kodek kompanije Meta obećava 10 puta bolju kompresiju nego MP3

od strane piplmetar | nov 3, 2022 | Tech | 0 Komentara

Predstavnici kompanije Meta navode da ova tehnika može značajno da unapredi kvalitet glasa na konekcijama sa malim protokom poput telefonskih poziva u zagušenim okruženjima. Ova tehnologija takođe funkcioniše i sa muzikom.

Meta je predstavila novu tehnologiju 25. oktobra u dokumentu koji je nazvan Neuralna audio kompresija visokog kvaliteta, a na kojem je radilo nekoliko istraživača Meta AI tima. Kompanija je posle toga sumirala pomenuto istraživanje na svom blogu, prenosi ArsTechnica.

Meta opisuje svoj metod kao trodelni sistem koji je treniran da kompresuje audio na željenu ciljnu veličinu. Prvo, enkoder transformiše nekompresovane podatke u verziju sa manjem brojem frejmova. „Kvantizer“ zatim kompresuje te podatke na ciljnu veličinu dok vodi evidenciju o najvažnijim informacijama koje će se kasnije koristiti za rekonstrukciju originalnog signala. Ovaj kompresovani label je ono što se šalje kroz mrežu ili čuva na disku. Konačno, dekoder pretvara kompresovane podatke nazad u audio u realnom vremenu koristeći neuronsku mrežu na jednom CPU-u.

Meta koristi diskriminator koji se pokazao kao ključna stvar za stvaranje metoda za kompresiju zvuka što je više moguće, bez gubitka ključnih elemenata signala koji ga čine prepoznatljivim.

„Ključ kompresije sa gubicima je da se identifikuju promene koje ljudi neće moći da primete, pošto je savršena rekonstrukcija nemoguća pri niskim brzinama prenosa. Da bismo to uradili, koristimo diskriminatore da poboljšamo perceptivni kvalitet generisanih uzoraka. Ovo stvara igru mačke i miša, gde je posao diskriminatora da pravi razliku između stvarnih uzoraka i rekonstruisanih uzoraka. Mannequin kompresije pokušava da generiše uzorke kako bi prevario diskriminatore tako što gura rekonstruisane uzorke da budu perceptivno sličniji originalnim uzorcima.“

Vredi napomenuti da je korišćenje neuronske mreže za audio kompresiju i dekompresiju daleko od novog, posebno za kompresiju govora, ali Meta istraživači tvrde da su oni prva grupa koja je primenila tehnologiju na stereo zvuk od 48 kHz (malo bolje od brzine uzorkovanja CD-a od 44,1 kHz), što je tipično za muzičke fajlove koji se distribuiraju na Internetu.

Što se tiče aplikacija, Meta kaže da bi ova „hiperkompresija zvuka“ zasnovana na veštačkoj inteligenciji mogla da podrži „brže pozive boljeg kvaliteta“ u lošim mrežnim uslovima. I, naravno, budući da rade u kompaniji Meta, istraživači nisu propustili priliku da pominju korišćenje EnCodec tehnologije u metaverzumu.

Osim toga, možda ćemo jednog dana dobiti i zaista male muzičke audio datoteke. Za sada, nova Meta tehnologija ostaje u fazi istraživanja, ali ukazuje na budućnost u kojoj će visokokvalitetni zvuk moći da koristi manje propusnog opsega, što bi bila odlična vest za provajdere mobilnih širokopojasnih usluga sa preopterećenim mrežama od strimovanja video materijala.

Opširnije

Izvor: Benchmark.rs

Pročitajte još

AMD Strix Point APU sa 12 Zen 5 jezgara postiže impresivne performanse

apr 25, 2024

Zašto nas Windows 11 ponekada toliko nervira?

apr 25, 2024

Kako da promenite ime na vašem iPhone telefonu

apr 23, 2024

Huawei planira da lansira HarmonyOS na međunarodno tržište

apr 23, 2024

Najnovije

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.

Necessary

Always Enabled

Necessary cookies are absolutely essential for the website to function properly. These cookies ensure basic functionalities and security features of the website, anonymously.

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Functional

Performance

Analytics

Others