Я пришёл разсказать об ещё одном улучшении кодировщика SVT-AV1, но мнѣ довольно трудно подобрать нýжныя словá.
Пóмните ли, что в январе 2022 года в сообщении https://410chan.org/b/arch/res/156266.html#175216 я впервые попробовал умѣстить «Basu bango yonbyakujuu バス番号四百十 ED FULL» в 410чановский предѣлъ объёма — и с первого раза это удалось, потому что тогда я использовал другой кодировщик (libaom-av1), который сжал видео довольно сильно, но и качеством пожертвовал тоже сильно?
Весною того же года я распробовал кодировщик SVT-AV1 (который работает быстрѣе, и лучше распараллеливается, и меньше багов), но при примѣненіи его к тому же видео немедленно упёрся в необходимость задать сáмое высокое значение CRF из возможных (то есть CRF=63) для того, чтобы сжать видео по максимуму и оставить для звука хоть немного оставшегося объёма файла. С той поры я уж не достигал первоначального битрейта звука, да и от разстановки ключевых кадров принуждён был отказаться для дополнительной экономии.
Исключением может считаться видеоролик, к сообщению https://410chan.org/b/arch/res/156266.html#185747 приложенный, потому что он закодирован при CRF=62; но позже оказалось, что это порождалось багами кодировщика (да и визуально в том видео наблюдается чрезмѣрная «блочность» ярких фоновых звёзд, напримѣръ).
Способы ещё усилить сжатие видео включали в себя использование фичи superres для подавления мелких деталей (>>201303) и использование другой метрики качества кадров (SSIM), проявляющееся как подзамыливание (>>202666).
Теперь появился ещё третий способ «пробить потолок» и оказался по своим итогам лучше каждого из двух способов, упомянутых в предшествующем абзаце.
Об итогах предлагаю судить самостоятельно — и для того прилагаю новый итог видеокодирования, вмѣщающійся в объём 5 мегабайтов несмотря на использование ключевых кадров (!) и на рост указуемого битрейта звука до величины «47.28k».
Этот итог достигнут вызовом FFmpeg с указанием (в его командной строке) параметров «-svtav1-params keyint=20s:scd=1:lookahead=120:enable-dlf=2:enable-variance-boost=0:ac-bias=2:tune=0:preset=0:lp=3:crf=63.25».