MPEG-2
Le MPEG-2 est une norme pour le " ; le codage générique des images mobiles et de l'information" audio associé ;. Lui décrit une combinaison de la compression visuelle de lossy et les méthodes de la compression audio (la compression de données audio ) de de lossy qui permettent le stockage et la transmission des films using des supports de stockage et la largeur de bande actuellement disponibles de transmission.
Caractéristiques principales
MPEG-2 est employé couramment comme format des signaux numériques de télévision qui sont émission par le terrestre (au-dessus - de l'air), câble , et systèmes satellites du TV de l'émission directe . Lui spécifie également le format des films et d'autres programmes qui sont distribués sur le DVD et les disques semblables. En soi, des stations de télévision, les récepteurs de TV, les joueurs de DVD, et tout autre équipement sont souvent conçus à cette norme. MPEG-2 était la seconde de plusieurs normes développées par le groupe d'experts d'images mobiles (MPEG ) et est une norme internationale (OIN /CEI 13818 de ). Les parties et 2 de MPEG-2 ont été développées dans une équipe de collaboration commune avec le ITU-T , et elles ont un numéro de catalogue respectif dans la série de recommandation d'ITU-T.Tandis que MPEG-2 est le noyau de la plupart de télévision numérique et de formats de DVD, il ne les spécifie pas complètement. Les établissements régionaux peuvent l'adapter à leurs besoins en limitant et en augmentant des aspects de la norme. Voir les profils et les niveaux .
MPEG-2 inclut des systèmes section, la partie, qui définit deux distincts, mais connexe, des formats de récipient. On est le jet de transport de , conçu pour porter la vidéo et l'acoustique numériques au-dessus probablement des médias de lossy, tels que la radiodiffusion, des exemples dont inclure le ATSC et le DVB . Les systèmes MPEG-2 définit également le jet de programme de , un format de récipient conçu pour des médias raisonnablement fiables tels que le optique DVDs des disques et le SVCDs MPEG-2/System est formellement connu comme ISO/IEC 13818-1 et comme ITU-T REC.
La section visuelle, la partie de MPEG-2, est semblable à la norme précédente du MPEG-1 , mais fournit également l'appui pour la vidéo entrelacée par , le format employé par les systèmes analogues de l'émission TV. La vidéo MPEG-2 n'est pas optimisée pour les bas débits binaires particulièrement moins que 1  ; Mbit/s aux résolutions standard de la définition . Cependant, il surpasse MPEG-1 à 3  ; Mbit/s et en haut. Tous les décodeurs MPEG-2 visuels standards-compliant sont entièrement capables de jouer en arrière les jets MPEG-1 visuels. MPEG-2/Video est formellement connu comme ISO/IEC 13818-2 et comme ITU-T REC.
Avec quelques perfectionnements, la vidéo MPEG-2 et les systèmes sont également employés dans quelques systèmes de transmission du TVHD .
La section MPEG-2 audio, définie dans la partie de la norme, augmente l'acoustique de MPEG-1 en permettant le codage des programmes audio avec plus méthode des canaux du de deux cette est vers l'arrière-compatible, permettant MPEG-1 aux décodeurs audio de décoder les deux composants stéréo principaux de la présentation.
La partie 7 de la norme MPEG-2 spécifie un format audio plutôt différent et non-vers l'arrière-compatible. La partie 7 désigné sous le nom MPEG-2 du AAC . Tandis qu'AAC est plus efficace que les normes audio précédentes de MPEG, il est beaucoup plus complexe pour mettre en application et un matériel légèrement plus puissant est nécessaire pour le codage et le décodage. L'acoustique avancée est également définie dans la partie de la norme du MPEG-4 .
Histoire
ect-moignon
Codage visuel (simplifié)
voient également :
la compression visuelle Un appareil-photo du TVHD produit d'un jet de vidéo brute radar de plus d'un milliard de bits par seconde. Ce jet doit être comprimé si la TV numérique est de s'adapter dans la largeur de bande des chaînes de télévision disponibles et si les films sont de s'adapter sur DVDs. Heureusement, la compression visuelle est pratique parce que les données dans les images sont souvent superflues dans l'espace et le temps. Par exemple, le ciel peut être bleu à travers le dessus d'une image et ce le ciel bleu peut persister de l'armature après armature. En outre, en raison de la manière que l'oeil fonctionne, il est possible pour supprimer quelques données des images visuelles avec presque aucune dégradation apparente de qualité d'image.
Les caméras de télévision utilisées dans la radiodiffusion produisent habituellement des images du 50 par seconde (en Europe et ailleurs) ou des images du 59.94 une seconde (en Amérique du Nord et ailleurs). La télévision de Digitals exige que ces images soient digitalisées de sorte qu'elles puissent être traitées par le matériel d'ordinateur. Chaque élément d'image (un Pixel ) est alors représenté par un nombre du luma et deux nombres du Chrominance . Ceux-ci décrivent l'éclat et la couleur du Pixel (voir le YCbCr ). Ainsi, chaque image digitalisée est au commencement représentée par trois choix rectangulaires de nombres.
Un tour commun (et vieux) pour réduire la quantité de données est de séparer l'image dans deux champs : le " ; champ supérieur, " ; ce qui est les rangées impaires, et le " ; champ inférieur, " ; ce qui est les rangées paires. Les deux champs sont montrés alternativement. Ceci s'appelle la vidéo entrelacée par . Deux champs successifs s'appellent une armature. Le taux d'armature typique est alors 25 ou 29.97 images par seconde. Si la vidéo n'est pas entrelacée, alors ce s'appelle la vidéo progressive et chaque image est une armature. MPEG-2 soutient les deux options.
Un autre tour pour réduire le débit est au diluent les deux matrices de chrominance. En effet, les valeurs restantes de chrominance représentent les valeurs voisines qui sont supprimées. L'éclaircissement fonctionne parce que l'oeil est plus sensible à l'éclat qu'à la couleur. Le 4:2 : le format du chrominance 2 indique que la moitié des valeurs de chrominance ont été supprimées. Le 4:2 : 0 formats de chrominance indiquent que trois quarts des valeurs de chrominance ont été supprimés. Si aucune valeur de chrominance n'a été supprimée, le format de chrominance est 4:4 : 4. MPEG-2 permet chacune des trois options.
MPEG-2 spécifie que les armatures crues soient comprimées dans trois genres d'armatures : armatures intra-codées (trames I), armatures prédictif-codées (P-armatures), et armatures bi-directionnel-prédictif-codées (B-armatures).
Une trame I est une version comprimée d'une armature (crue) non comprimée simple. Elle tire profit de la redondance spatiale et de l'incapacité de l'oeil de détecter certains changements de l'image. À la différence des P-armatures et des B-armatures, les trames I ne dépendent pas des données dans les armatures précédentes ou suivantes. Brièvement, l'armature crue est divisée en Pixel 8 par 8 blocs de Pixel. Les données dans chaque bloc sont transformées par un le cosinus que discret transforment . Le résultat est des 8 par la matrice 8 des coefficients. La transformation convertit des variations spatiales en variations de fréquence, mais elle ne change pas l'information dans le bloc ; le bloc original peut être recréé exactement en appliquant le cosinus inverse transforment. L'avantage de faire ceci est que l'image peut maintenant être simplifiée par le quantifiant les coefficients. Plusieurs des coefficients, habituellement les composants plus élevés de fréquence, seront alors zéro. La pénalité de cette étape est la perte de quelques distinctions subtiles dans l'éclat et la couleur. Si on applique l'inverse transformer à la matrice après qu'elle soit à quantification, une obtient une image qui regarde très semblable à l'image originale mais qui n'est pas comme diversifié. Après, la matrice à quantification de coefficient elle-même est comprimée. Typiquement, un coin de la matrice à quantification est rempli de zéros. En commençant dans le coin opposé de la matrice, zigzaguer alors par la matrice pour combiner les coefficients dans une corde, substituant alors la courir-longueur de code pour des zéros consécutifs dedans cette corde, et alors s'appliquant le codage de Huffman de à ce résultat, on ramène la matrice à un plus petit choix de nombres. C'est cette rangée qui est émission ou qui est mise sur DVDs. Dans le récepteur ou le joueur, le processus entier est renversé, permettant au récepteur de reconstruire, à une approximation étroite, l'armature originale.
Typiquement, chaque 15ème armature ou ainsi est transformée en trame I. les P-armatures et les B-armatures pourraient suivre une trame I comme ceci, IBBPBBPBBPBB (I), pour former un groupe de d'images (GOP) ; cependant, la norme est flexible à ce sujet.
Macroblocks
les P-armatures fournissent plus de compression que des trames I parce qu'elles tirent profit des données dans la trame I ou la P-armature précédente. Des trames I et les P-armatures s'appellent les armatures de référence pour produire d'une P-armature, l'armature de référence précédente est reconstruites, juste comme elle serait dans un récepteur ou le lecteur DVD de TV. L'armature étant comprimée est divisée en Pixel 16 par le de 16 Pixel Macroblocks alors, pour chacun de ces macroblocks, l'armature de référence reconstruite est recherchée pour constater que 16 par le macroblock 16 ce les meilleures allumettes le macroblock étant comprimé. L'excentrage est codé comme " ; mouvement vector." ; Fréquemment, l'excentrage est zéro. Mais, si quelque chose dans l'image se déplace, l'excentrage pourrait être quelque chose comme 23 Pixel vers la droite et 4 Pixel en hausse. La correspondance entre les deux macroblocks ne sera souvent pas parfaite. Pour corriger pour ceci, les calculs d'encodeur que les cordes du coefficient évalue comme décrit ci-dessus pour les deux macroblocks et, puis, soustrait un de l'autre. Ce " ; residual" ; est apposé au vecteur de mouvement et au résultat envoyés au récepteur ou stockés sur le DVD pour chaque macroblock étant comprimé. Parfois aucune allumette appropriée n'est trouvée. Puis, le macroblock est traité comme un macroblock de trame I.Le traitement des B-armatures est semblable à celui des P-armatures sauf que les B-armatures emploient l'image dans l'armature de référence suivante aussi bien que l'image dans l'armature de référence précédente. En conséquence, les B-armatures fournissent habituellement plus de compression que des P-armatures. les B-armatures ne sont jamais des armatures de référence.
Tandis que ce qui précède décrit généralement la compression MPEG-2 visuelle, il y a beaucoup de détails qui ne sont pas discutés comprenant des détails impliquant les champs, les formats de chrominance, les réponses aux changements de scène, les codes spéciaux qui marquent les parties du bitstream, et d'autres informations.
Codage audio
MPEG-2 présente également de nouvelles méthodes de codage audio. Ce sont
bas codage de débit binaire avec le taux de prélèvement divisé en deux ( de couche MPEG-1 1 / 2 / 3 LSF)
codage multicanal avec jusqu'à 5.1 canaux
MPEG-2 AAC
Profils et niveaux
MPEG-2 soutient l'étendue des applications large de mobile à l'édition de la qualité HD. Que beaucoup d'applications, il est peu réaliste et trop cher soutiennent la norme entière. Pour permettre à de telles applications de soutenir seulement des sous-ensembles de elle, la norme définit le profil et le niveau.Le profil définit le sous-ensemble de dispositifs tels que l'algorithme de compression, le format de chroma, etc. Le niveau définit le sous-ensemble de possibilités quantitatives telles que le débit binaire maximum, la taille d'armature maximum, etc.
Une application de MPEG spécifie alors les possibilités en termes de profil et niveau. Par exemple, un lecteur DVD peut indiquer qu'il soutient jusqu'au profil principal et au niveau principal (on lui écrit souvent comme MP@ML). Il signifie que le joueur peut jouer en arrière n'importe quel jet de MPEG codé comme MP@ML ou moins.
La table ci-dessous récapitule les limitations de chaque profil et niveau.
Applications
DVD
La norme du DVD utilise la vidéo MPEG-2, mais impose quelques restrictions :Résolutions permises
720 × 480, 704 × 480, 352 × 480, 352 Pixel du × 240 (NTSC)
720 × 576, 704 × 576, 352 × 576, 352 Pixel du × 288 (pal)
Allongements permis (affichage AR)
4:3
16:9
(1.35:1, notamment, sont souvent énumérés en tant qu'allongements valides de DVD, mais sont réellement juste une image de 16:9 avec le dessus et le fond de l'armature masquée dans le noir)
Taux permis de vue
29.97  ; frame/s (NTSC)
25  ; de frame/s (pal) note de de : En employant un modèle des drapeaux de REPEAT_FIRST_FIELD sur les en-têtes des images codées, des images peuvent être montrées pour ou deux ou trois champs et presque n'importe quel taux d'affichage d'image (⅔ minimum du taux d'armature) peuvent être réalisés. C'est le plus employé souvent pour montrer (approximativement la vidéo 23.976 de taux de film) sur NTSC.
- Débit binaire d'Audio+video
Crête visuelle 9.8  ; Mbit/s
Crête totale 10.08  ; Mbit/s
Minimum 300  ; Kbit/s
Sous-titres additionnels possibles
fermé attribuant un libelle (NTSC seulement)
Audio
Modulation par impulsion et codage linéaire (LPCM) : 48  ; kilohertz ou 96  ; kilohertz ; 16 - ou 24 bits ; jusqu'à six canaux (non tout l'en raison possible de combinaisons des contraintes de débit binaire)
Couche 2 (MP2) de MPEG : 48  ; kilohertz, jusqu'à 5.1 canaux (requis dans des joueurs de pal seulement)
Digital dolby (densité double, également connue sous le nom d'AC-3) : 48  ; kilohertz, 32&ndash ; 448  ; Kbit/s, jusqu'à 5.1 canaux
Systèmes (DTS) de théâtre de Digitals de : 754  ; Kbit/s ou 1510  ; Kbit/s (non requis pour la conformité de lecteur DVD)
NTSC DVDs doit contenir au moins un LPCM ou voie audio dolby de Digitals.
Pal DVDs doit contenir au moins une couche 2, LPCM de MPEG, ou voie audio dolby de Digitals.
Des joueurs ne sont pas requis de jouer l'acoustique arrière avec plus de deux canaux, mais doivent pouvoir en mesure à l'acoustique multicanale du downmix à deux canaux.
Structure de GOP
L'en-tête d'ordre doit être présent au début de chaque GOP
Armatures maximum par GOP : 18) (de NTSC/15 (pal), c.6 seconde toutes les deux
GOP fermé requis pour le multiple-angle DVDs
DVB
Restrictions spécifiques à l'application à la vidéo MPEG-2 dans la norme du DVB : Résolutions permises pour le SDTV :
720, 640, 544, 480 ou 352 frame/s de Pixel du × 480 24/1.001 ou 30,
352 frame/s de Pixel du × 240 24/1.001 ou 30,
720, 704, 544, 480 ou 352 Pixel du × 576, 25 frame/s
352 Pixel du × 288, 25 frame/s Pour la TVHD :
progressif de 720 x 576 x 50 frames/s (576p50)
1280 x 720 X.25 ou progressif de 50 frames/s (720p50)
progressif 1440 ou 1920 x 1080 de X.25 frames/s (1080p25 - mode de film)
X.25 1440 ou 1920 x 1080 frames/s entrelacent (1080i25)
1920 x 1080 x 50 format possible progressif du futur H.264/AVC de frames/s (1080p50) < ! --TVHD : -->
ATSC
Résolutions visuelles permises :1920 Pixel de × 1080, 30 frame/s ( 1080i )
1280 Pixel du × 720, 60 frame/s ( 720p )
720 Pixel du × 576, 25 frame/s ( 576i , 576p )
720 ou 640 Pixel du × 480, 30 frame/s ( 480i , 480p ) Note : 1080i est codé avec les armatures 1920 de Pixel de × 1088, mais les 8 dernières lignes sont jetées avant l'affichage.
L'acoustique MPEG-2 était un compétiteur pour la norme d'ATSC pendant le " du DTV ; " grand de l'alliance ; échange de tirs, mais perdu dehors au AC-3 dolby .
ISO/IEC 13818
; Partie : Des systèmes - décrit la synchronisation et le multiplexage de la vidéo et de l'acoustique. Également connu comme ITU-T REC.0 Alcatel-LucentCanon Inc.
Université de Columbia
France Télécom ( CNET )
Fujitsu
General Electric Capital Corporation
Corp. générale de l'instrument (maintenant la division à bande large de Motorola )
GE Technology Development, Inc.
Société du KDDI (KDDI)
LG Electronics inc.
Matsushita
Mitsubishi
Nippon Telegraph et Telephone Corporation (NTT )
NXP
Philips
Robert Bosch Gmbh
Samsung
Sanyo Electric Co.
Atlanta scientifique
pointu
Sony
Thomson autorisant SA
Toshiba
Victor Company de Japan, Limited ( JVC ).
Selon le MPEG-LA , d'accord de licence de MPEG-LA n'importe quelle utilisation de de la technologie MPEG-2 est sujette à des redevances .
Les encodeurs de
ont une charge $0.50 pour chaque produit.
Les décodeurs ont une charge $0.50 pour chaque produit.
les ventes Redevance-basées des encodeurs et des décodeurs sont sujettes à différentes règles et à des $2.
En outre, n'importe quel milieu emballé (DVDs/trains de données de données) est sujet à des droits de licence selon la longueur de l'enregistrement/d'émission.
Dans le cas du logiciel gratuit tel que le reproducteur multimédia (qui du VLC emploie la bibliothèque de Ffmpeg ) et dans ce qui le logiciel n'est pas vendu, l'utilisateur soutient la redevance.
Voir également
Jet de transport de MPEG de Couche audio II du MPEG-1
MPEG-4
MP2 , MP3
AAC
DVD
Theora
.
| Random links: | Constantine P. Cavafy | Mur porteur | Hitman : Nom de code 47 | Fernmeldeturm Mannheim | Empfingen | MPEG-2 |