Използване на LAME mp3 енкодер предварително зададени настройки

По-долу ще опиша резултатите, които получих, които ще представляват интерес за широк кръг хора, интересуващи се от mp3 технология. В текста можете да намерите малко повече от обещаното в заглавието, но тази информация е добавена само за по-голяма прозрачност на материала. Тъй като често ми се налага да отговарям на въпроси от обществеността по разглеждания въпрос, ще се опитам да се спра по-подробно на неочевидни аспекти, дори ако те не са пряко свързани с темата.

Предполага се, че читателят има основни познания по дискутираната тема. Можете лесно да достигнете това ниво, като прочетете поне една от статиите за технологията за компресиране на аудио със загуби, базирана на психоакустичния модел (например MP3 Review. Част I., MP3 Review. Част II.).

Познаването на техническите подробности не е необходимо, за да се разберат основните констатации на тази статия. От друга страна, такива знания ще бъдат полезни за разбиране на междинни разсъждения (вж. Например Препоръки за използване на стандарта за компресиране на mp3).

Подходи за избор на параметри на компресия

Както знаете, технологията за компресиране на аудио със загуби включва определяне по някакъв начин на степента на компресия на изходния материал, което директно корелира с качеството на резултата: колкото повече компресия, толкова по-ниско е качеството. Много проблеми обаче възникват при опит да се дефинира ясно връзката компресия-качество. Първо, за различна музика една и съща компресия ще доведе до различно качество на резултата. На второ място, дебатът за метода за количествено измерване на това „качество“ все още продължава. Въпреки че съществуват доста обективни методи за количествено описание на изкривяванията на процеса на „компресия, декомпресия, сравнение с оригинала“, няма начин да се сравнят такива оценки с субективното възприемане на резултата. Днес по-голямата част от експертите и ентусиастите са на мнение, че няма обективна характеристика, която да определя самото качество (тоест, няма формули, по които да се изчисли точно това качество). Субективните оценки изискват големи разходи за тяхното изпълнение - това е кодиране на един и същ материал по няколко начина и слушане на резултата от много експерти и опити за намаляване на получените резултати до най-простата форма „а е по-добро от b, b е по-добро от ° С".

Вторият аспект на проблема - в истински mp3 енкодер съотношението на компресия се задава, като правило, от повече от един параметър. Кодерът LAME (за разлика от много търговски енкодери) предлага на потребителя възможността да променя десетки параметри. По този начин разходите за прослушване за получаване на субективна оценка се увеличават още повече.

Бих искал да подчертая два основни подхода за определяне на параметрите на компресия: теоретична и емпиричен. Разликата ще бъде по-лесно да се опише с пример. При равни други условия качеството на изходния поток ще бъде толкова повече, колкото повече бита за единица време е необходимо. Или колкото повече, толкова по-нисък е прагът на слуха (ATH, абсолютният праг на слуха, сигнали под това ниво изобщо не се въвеждат в изходния поток - енкодерът вярва, че ухото няма да ги различи). Или колкото по-висока, толкова по-висока е граничната честота на високочестотния филтър.

Забележка за експерти: в последните два примера се приема, че се използва алгоритъмът VBR, т.е. ширината на битовия поток се увеличава, ако съхраняваме повече информация.

Както беше отбелязано по-горе, има много такива параметри. Разбира се, можем да зададем максимално стойностите на всички параметри, но това ще доведе до много ниско съотношение на компресия. Намирането на компромис в тази ситуация ще доведе до промяна на огромен брой параметри на енкодера. Работейки с теоретичния метод за избор на параметри, всеки ще може да получи някои от своите емпирични резултати, разработки, опит: тази комбинация почти винаги ще даде по-добри резултати от всяка друга.

С теоретичен метод за избор на параметри е необходимо ясно да се разбере какво влияе всеки параметър и как в резултат на неговата промяна трябва да се промени резултатът от компресията. Така например, в документацията за LAME е посочено, че когато се използва режим VBR, психоакустичният модел може да подцени битрейта твърде много, така че той трябва да бъде изкуствено ограничен отдолу (съответства на бутона „куц-b“, дори когато се използва този ключ, акустичната тишина ще бъде кодирана на 32 kbps). По-голямата част от потребителите нямат такива знания. Освен това мнозина дори не търсят документацията за съвет относно избора на параметри за кодиране.

Потребителят, т.е. човек, който е далеч от процеса на разработване и тестване на кодера, би искал да получи прозрачна за използване линейна скала от настройки: лоша, по-добра, добра, много добра, отлична. Той не се интересува от стойностите на десетки параметри във всеки конкретен случай. Именно затова предварително зададени схеми за настройка, предварителни настройки. По принцип всяка предварителна настройка е набор от стойности за всички параметри на кодера. Комбинацията от тези стойности е избрана в резултат на продължително тестване от екипа на разработчиците и тестерите на кодера по такъв начин, че да изпълни най-ефективно задачата на тази предварително зададена на по-голямата част от аудио материала.

Лирично отклонение

Мисля, че си струва да се спомене, че LAME е проект с отворен код, т.е. всеки може потенциално да участва в създаването на енкодер. Естествено, за ефективно участие в проекта като програмист са необходими познания в областта на технологията за аудио компресия на много високо ниво. Броят на програмистите в LAME обаче е стотици. За да участвате в тестване, нивото на знания е значително по-ниско, тъй като броят на тестерите LAME се измерва в хиляди и десетки хиляди. Дори да вземем предвид, че в тази маса няма много професионалисти (музиканти, тунери и т.н.) - няколко процента - пак се оказва, че в развитието на проекта LAME участват много повече хора, отколкото, да речем, Кодер на Fraunhofer IIS, лидер в индустрията сред търговските продукти.

Известен ми е документ, описващ тестване от Fraunhofer IIS с няколкостотин експерти. "Цели няколкостотин!" - можем да кажем, като си представим мащаба на събитието и разходите за неговото изпълнение. - Само няколкостотин? - можем да спорим, като си спомняме хилядите хора по света, които правят една обща кауза под знамето на LAME.

По този начин ние идентифицирахме два подхода при избора на параметрите на компресия: теоретичен, който е добър само за човек с богат опит с mp3 и добри познания по теорията на разглеждания метод за звукова компресия, и емпиричен - прост и разбираем за използване за всички.

Описание на LAME предварителни настройки

Както се казва в документацията на LAME, „Предварителните настройки са преки пътища за общи или внимателно настроени настройки“ (предварителните настройки са удобни преки пътища към често използвани или спретнато настроени входни набори).

Основни предварителни настройки

Основните предварителни настройки използват режим на компресиране с постоянна скорост, освен ако не е посочено '-v'. Таблицата по-долу показва стойността, която трябва да се използва за компресия с постоянен битрейт. Използвайки тази стойност, можете да получите приблизителна представа за качеството на резултата.