Disons que dans le MPEG : pour être vulgarisateur
- les images "i" Intraframes sont le références et ne subissent que très peu la compression
- les images "p" Predicted sont d'après l'analyse à l'encodage, sont les images intermédiaires qui continennent les infos des pixels qui ont changé ou pas.
- les "b" bidirectional sont très légères et contiennes les infos des changements entre les I et les P.
Les compressions s'appliquent selon des blocs de complets de pixels et des analyse de mouvement dans ces blocs.
On obtien ainsi des séries d'images qui sont à peu près comme celui-ci : IBBPBBPBBPBBPIBBPBBP...etc Ces séquences de IBP s'intitulent des Groupes Of Pictures (GOP). Techniquement, chaque image (hors I) n'existe plus effectivement en tant que tel. A la lecture, c'est l'ensemble des I et B, P qui permettent l'affichage du tout (car en fait, les images sont toujours là, mais très compressées.
On peux monter ce genre d'image, en H264 entre autre, si le programme sait comment reconstruire cette séquence pour refaire image/image le film. Effectivement, c'est possible, mais lent - et en référence sur tout un temps de prod, l'intervention/modification sur un des filtres ou valeur d'un clip H264 dans la timeline impose un nouveau calcul de rendu.
Le H264 est entre-autre fait pour ça. le x264 est un cousin du "h".
le 4:2:0, signifie que dans la compression, la colorimétrie de l'image est codée sur 8 bits par couleurs (8 bits Rouge (256 valeurs), 8 Vert, 8 Bleu), 720p ou 1080p - cela ne change rien.
Certains codecs - les INTRA - sont plus lourds pour plusieurs raisons, entre autres parce qu'il sont en 4:2:2 (ils compressent moins les couleurs et parfois sont en 10 bits) ce qui signifie plus de nuances de valeurs de RVB, donc moins d'effets de "banding" ces dégradés par paliers qui vous niquent un fondu ou un masque de vignettage.
Trop travailler en H264 nuit gravement à la santé des images finales. Tout dépend de ce que l'on veux faire de son film fini.
Pour les logiciels, je ne travaille pas avec du "libre".