Что такое матрицы распределения квантов и с чем их едят.
Несмотря на то, что популярность стремительно набирают кодеки нового поколения, старому доброму XviD ещё жить и жить, пока люди не повыбрасывают на помойку свои старые консервные видео проигрыватели. Это ещё боюсь не год и не два. В общем дело вкуса, лично я сам давно для себя определил формат коллекции - AVC.
Тем не менее, XviD не так мало может, как может показаться на первый взгляд и у него есть одно неоcпоримое преимущество перед AVC(помимо консервной совместимости):
XviD - кодек, проверенный временем, стабильный и надёжный
Вот решил немного поделиться опытом кодирования с помощью XviD и ввести ещё несведущих в азы видеокомпресии. Если вы ничего не знаете о том, как работают видеокодеки - дальше лучше не читать, будет туго и бессмысленно.
Всем кому интересно - добро пожаловать. Материал собран с использованием информации, собранной по крупицам с doom9, моих комметнариев и дополнений. За подробные исследования respect Sharktooth, Didee, Dark Shikari и прочим мега кодерам с doom9
Приступим...
Что такое макроблоки? Плохо если вы не в курсе. Каждый фрейм mpeg4 поток состоит из типичных макроблоков размером 16x16 или 32x32. Каждый из макроблоков состоит в свою очередь из блоков 8x8, вокруг которых и пляшет алгоритм видеокомпрессии.
Самое ценное в видеокомпрессии - коэффициент сжатия, поэтому вместо того, чтобы хранить блоки в виде растрового изображения, макроблок хранится в виде сложной формулы, которая имитирует оригинальное изображение настолько точно, насколько это возможно в отведённые для конкретного макроблока биты.
Человеческий глаз наиболее чувствителен к изменениями в яркости изображения, чем к искажениям в цветах. Поэтому в mpeg4 заложено изначально резервировать больше битрейта для точной передачи яркости, чем для достоверной передачи цветов.
Каждый блок 8x8 представляется не в виде пикселей, а в виде единственной величины, которая передаёт среднее значение яркости или цвета в массиве 8x8, а все остальные значения представляют собой математические зависимости, в которых находится исходный блок от заданной величины яркости и цвета.
Другими словами, для конкретного макроблока задаётся некое значение, из которого путём математических преобразований восстанавливается блок целиком таким образом, чтобы он максимально был похож на исходный.
Всё остальное место занимают пиксели, точнее то, что мы привыкли называть пикселями, а на самом деле просто данные, которые передают геометрические детали изображения.
Присмотримся к блоку повнимательнее:
X X X X X X X X
X X X X X X X X
X X X X X X X X
X X X X X X X X
X X X X X X X X
X X X X X X X X
X X X X X X X X
X X X X X X X X
Значение в верхнем левом углу передаёт среднее значение макроблока. Т.е. если макроблок описывает кусочек неба, то грубо говоря в этом углу будет храниться среднее значение голубого цвета.
Вправо и вниз от этого угла расходятся значения отклонений от заданной величины.
Сверху вниз или справа налево в блоке по нарастающей описываются детали.
Если обратиться к исходному блоку 8x8, то детали трансформируются в значения в зависимости от частоты конкретной детали. Понятие частоты ту имеет несколько иной смысл. Чем тоньше деталь, тем выше частота, которая её описывает.
Таким образом, чем правее позиция в блоке, тем выше частота и соответсвенно более точно передаётся конкретная деталь.
Например:
В блоке 8x8 с кусочком неба почти нет деталей, поэтому частота в этом блоке очень низкая.
В блоке 8x8 в который попали 5 или 6 спичек появляется больше деталей, но не так много, поэтому частота такого блока находится на среднем уровне.
Блок 8x8, в который попали волосы крупным планом или трава или кусты, насыщен мелкими деталями, поэтому его частота высока.
Как видно, значение в блоках передают горизонтальные и вертикальные частоты деталей исходной картинки.
Формула, которая преобразует детали в частоты макроблока, называется Дискретная Косинусоидальная Трансформация (по англ. Discrete Cosine Transformation или DCT)
Теперь посмотрим на макроблок с учётом того, что мы уже о нём знаем.
Код:
Среднее значение цвета и яркости всего блока
I
I Низкие частоты (крупные детали)
I I
I I Средние частоты (обычные детали)
I I I
I I I
I I I Высокие частоты (самые мелкие детали)
I I I I
X--X--X--X--X--X--X--X
X--\--X--X--X--X--X--X
Низкие частоты -------- X--X--\--X--X--X--X--X
X--X--X--\--X--X--X--X
Средние частоты ------- X--X--X--X--\--X--X--X
X--X--X--X--X--\--X--X
X--X--X--X--X--X--\--X
Высокие частоты --------X--X--X--X--X--X--X--A
I
I
Математическое описание самой смой тонкой
детали по горизонтали и вертикали
I
I Низкие частоты (крупные детали)
I I
I I Средние частоты (обычные детали)
I I I
I I I
I I I Высокие частоты (самые мелкие детали)
I I I I
X--X--X--X--X--X--X--X
X--\--X--X--X--X--X--X
Низкие частоты -------- X--X--\--X--X--X--X--X
X--X--X--\--X--X--X--X
Средние частоты ------- X--X--X--X--\--X--X--X
X--X--X--X--X--\--X--X
X--X--X--X--X--X--\--X
Высокие частоты --------X--X--X--X--X--X--X--A
I
I
Математическое описание самой смой тонкой
детали по горизонтали и вертикали
Матрица распределения квантов (МРК) выглядит примерно так :
Код:
08 16 19 22 26 27 29 34
16 16 22 24 27 29 34 37
19 22 26 27 29 34 34 38
22 22 26 27 29 34 37 40
22 26 27 29 32 35 40 48
26 27 29 32 35 40 48 58
26 27 29 34 38 46 56 69
27 29 35 38 46 56 69 83
16 16 22 24 27 29 34 37
19 22 26 27 29 34 34 38
22 22 26 27 29 34 37 40
22 26 27 29 32 35 40 48
26 27 29 32 35 40 48 58
26 27 29 34 38 46 56 69
27 29 35 38 46 56 69 83
Чтобы приблизиться к пониманию процесса, опустимся до абстракции:
Представим себе блондинку с длинными волосами, стоящую перед светло-серой стеной за 2 прутьями тюремной решётки.
Представим, что это изображение помещается в блок 8x8
Блондинка и светлая стена будут близки по контрасту, поэтому разница между средними значениями яркости и контраста и их максимальными значениями будет невелика.
Значения в блоке будут ниже и практически могут не преодолеть порога потери детализации. Это значит, что разница между участками будет минимальной и картинка превосходно будет поддаваться компресии.
Если бы стена была чёрной, контраст был бы намного больше и разница между средними значениями и максимальными будет зашкаливать. Если в такой блок не попадёт достаточно высокий порог из значений МРК, то либо блондинка может оказаться брюнеткой за счёт стены за ней, либо стена из чёрной станет серой, а скорее всего обе потеряют свой первоначальный цвет. В любом случае при более высоком контрасте через порог DCT пройдёт значительно больше деталей и попадут дальше в конвеер видеокомпрессора, который уже будет думать как же это всё запаковать поуютнее.
Тюремные прутья перед девушкой - детали, но совсем не мелкие, они пойдут в макроблок по низкой частоте.
(По крайней мере, если они будут отличаться цветом от блондинки)
Мы забыли, что у девушки есть волосы и разумеется волосы имеют сложную текстуру. Поэтому волосы пойдут в макроблок по высокой частоте.
Как видно по МРК, порог для высоких частот намного выше, чем для низких. Поэтому, чтобы волосы попали в видеопоток, они должны значительно отличаться от среднего значение цвета, иначе, могут просто слиться со средним фоном. Поэтому если разница со средним значением невелика (как в этом случае), детализация волос просто пропадёт на этом этапе. Ситуацию могут спасти разноцветные ленточки в волосах, которые увеличат контраст. Таким образом, чтобы детали на выходе получились чётким и резким, контраст деталей должен быть как можно дальше от среднего значения, иначе чёрная кошка утонет в чёрной комнате. Это упрощённое представление процесса видеокомпрессии. Для полноты картины надо добавить, что всё, вышесказанное справедливо для I-фреймов. МРК к p- b- фреймам применяется не напрямую, а после распределения векторов направления движения, что должно учитываться при составлении матриц.
Теперь подбираемся к главному. XviD кодек (забудем про DivX вообще, для меня он умер ) по умолчанию использует либо H.263 матрицу либо MPEG. H.263 даёт на выходе более размытую картинку с более точными значениями яркости/цветов, а MPEG передаёт больше деталей, но теряет больше параметров яркость-цвет. Эти матрицы по-умолчанию хороши в среднем для обычной штамповки. С помощью спец. подобранных матриц можно значительно улучшить результаты работы видеокомпрессора за счёт снижения сжимаемости картинки. Как видно, матрица в примере - как раз снижает сжимаемость, значение в среднем очень низкие.
Для чего могут использоваться квантовые матрицы:
Матрица для максимального сжатия устанавливает жёсткий порог деталей, чтобы битрейт расходовался более эффективно
В идеале можно разработать матрицы для конкретного типа видеоряда: космические баталии, мультики, аниме т.д.
С помощью матриц можно фильтровать шумы и артефакты, вычислив помеховые частоты можно добиться довольно точной фильтрации
В заключение, привожу матрицы, разработанные уважаемым г. Sharktooth, как на мой взгляд наиболее удачные в качестве исходного материала для экспериментов. Лёгкая подгонка этих матриц к конкретному фильму - и XviD будет творить чудеса.
EQM v3hr
Матрица для высоких битрейтов для кодирования DVD в полный анаромфный размер на битрейтах 1600Kbps+ (для фильмов со средним экншном)
Код:
8 10 10 10 11 11 13 15
10 10 10 10 11 12 14 16
10 10 11 11 13 14 16 18
10 10 11 13 15 17 19 23
11 11 13 15 19 22 26 29
11 12 14 17 22 28 34 41
13 14 16 19 26 34 44 55
15 16 18 23 29 41 55 72
15 15 15 15 16 17 19 22
15 15 15 15 16 18 20 23
15 15 16 17 19 20 23 27
15 15 17 19 22 25 29 33
16 16 19 22 28 32 38 43
17 18 20 25 32 41 50 60
19 20 23 29 38 50 66 81
22 23 27 33 43 60 81 106
10 10 10 10 11 12 14 16
10 10 11 11 13 14 16 18
10 10 11 13 15 17 19 23
11 11 13 15 19 22 26 29
11 12 14 17 22 28 34 41
13 14 16 19 26 34 44 55
15 16 18 23 29 41 55 72
15 15 15 15 16 17 19 22
15 15 15 15 16 18 20 23
15 15 16 17 19 20 23 27
15 15 17 19 22 25 29 33
16 16 19 22 28 32 38 43
17 18 20 25 32 41 50 60
19 20 23 29 38 50 66 81
22 23 27 33 43 60 81 106
EQM V3LR:
Матрица для низких битрейтов до 1500Kbps для кодирования DVD на полном анаморфном разрешении. На более высоких битрейтах - отличный выбор для фильмов насыщенных экшном.
Код:
8 14 14 14 15 15 18 21
14 14 14 14 15 16 19 22
14 14 15 15 17 19 22 25
14 14 15 18 21 23 27 31
15 15 17 21 26 30 35 40
15 16 19 23 30 38 46 56
18 19 22 27 35 46 61 76
21 22 25 31 40 56 76 99
19 19 19 19 20 21 24 28
19 19 19 19 20 22 26 29
19 19 20 21 23 26 29 34
19 19 21 24 28 31 36 42
20 20 23 28 35 41 48 55
21 22 26 31 41 51 63 76
24 26 29 36 48 63 83 103
28 29 34 42 55 76 103 134
14 14 14 14 15 16 19 22
14 14 15 15 17 19 22 25
14 14 15 18 21 23 27 31
15 15 17 21 26 30 35 40
15 16 19 23 30 38 46 56
18 19 22 27 35 46 61 76
21 22 25 31 40 56 76 99
19 19 19 19 20 21 24 28
19 19 19 19 20 22 26 29
19 19 20 21 23 26 29 34
19 19 21 24 28 31 36 42
20 20 23 28 35 41 48 55
21 22 26 31 41 51 63 76
24 26 29 36 48 63 83 103
28 29 34 42 55 76 103 134
EQM V3ULR
Матрица для очень низких битретов:
- уменьшает артефакты насколько это возможно сохраняя хорошую картинку на низких битрейтах
- Одна из лучших матриц для кодирования на 1CD
Код:
8 14 20 28 38 45 56 65
14 20 26 37 44 56 64 70
20 26 36 43 55 64 70 75
28 37 43 54 63 70 76 79
38 44 55 63 70 77 80 83
45 56 64 70 77 81 84 88
56 64 70 76 80 84 89 95
65 70 75 79 83 88 95 102
18 19 20 22 24 26 28 30
19 20 22 24 26 28 30 34
20 22 24 26 29 30 34 40
22 24 26 30 32 36 44 50
24 26 29 32 38 48 55 60
26 28 30 36 48 58 74 80
28 30 34 44 55 74 92 104
30 34 40 50 60 80 104 128
14 20 26 37 44 56 64 70
20 26 36 43 55 64 70 75
28 37 43 54 63 70 76 79
38 44 55 63 70 77 80 83
45 56 64 70 77 81 84 88
56 64 70 76 80 84 89 95
65 70 75 79 83 88 95 102
18 19 20 22 24 26 28 30
19 20 22 24 26 28 30 34
20 22 24 26 29 30 34 40
22 24 26 30 32 36 44 50
24 26 29 32 38 48 55 60
26 28 30 36 48 58 74 80
28 30 34 44 55 74 92 104
30 34 40 50 60 80 104 128
EQM V3UHR
Матрица для очень высоких битрейтов для кодирования DVD в полный анаморфный размер на очень высоких битрейтах. Точка насыщенности за счёт сжимаемости на 30% выше чем в матрице Didees 6of9
Код:
8 8 8 8 8 8 10 11
8 8 8 8 8 9 10 12
8 8 8 8 9 10 12 14
8 8 8 10 11 13 15 17
8 8 9 11 14 16 19 22
8 9 10 13 16 21 25 31
10 10 12 15 19 25 33 41
11 12 14 17 22 31 41 54
10 10 10 10 10 10 10 11
10 10 10 10 10 10 10 12
10 10 10 10 10 10 12 14
10 10 10 10 11 13 15 17
10 10 10 11 14 16 19 22
10 10 10 13 16 21 25 31
10 10 12 15 19 25 33 41
11 12 14 17 22 31 41 54
8 8 8 8 8 9 10 12
8 8 8 8 9 10 12 14
8 8 8 10 11 13 15 17
8 8 9 11 14 16 19 22
8 9 10 13 16 21 25 31
10 10 12 15 19 25 33 41
11 12 14 17 22 31 41 54
10 10 10 10 10 10 10 11
10 10 10 10 10 10 10 12
10 10 10 10 10 10 12 14
10 10 10 10 11 13 15 17
10 10 10 11 14 16 19 22
10 10 10 13 16 21 25 31
10 10 12 15 19 25 33 41
11 12 14 17 22 31 41 54
EQM V3EHR
Матрица для кодирования на повышенных битрейтах разработана для кодирования только в режиме постоянное качество. Сжимаемость вообще никакая по сравнению с другими матрицами, но на то есть причины.
Сфера применения: создание резервных копий исходника или HD, не прибегая к кодекам, работающим по принципу "без потерь"
Код:
8 8 9 11 13 13 14 17
8 8 11 12 13 14 17 18
9 11 13 13 14 17 17 16
11 11 13 13 13 17 18 20
11 13 13 13 16 17 20 24
13 13 13 16 17 20 24 29
13 12 13 17 19 23 28 34
12 13 17 19 23 28 34 41
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 11 12 13 14 17 18
9 11 13 13 14 17 17 16
11 11 13 13 13 17 18 20
11 13 13 13 16 17 20 24
13 13 13 16 17 20 24 29
13 12 13 17 19 23 28 34
12 13 17 19 23 28 34 41
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
P.S.: Не претендую на абсолютную точность изложенной инфоромации, если найдёте в чём меня поправить, буду рад.
Комментариев нет:
Отправить комментарий