ΡΟΗ ΕΙΔΗΣΕΩΝ
6 Μαΐου 2025 11:44
6 Μαΐου 2025 10:00
6 Μαΐου 2025 09:55
6 Μαΐου 2025 09:50
6 Μαΐου 2025 09:46
6 Μαΐου 2025 09:36
6 Μαΐου 2025 09:24
3 Μαρτίου 2011 03:00
Το MPEG-4 στις υπηρεσίες του High Definition
Θα μπορούσε να υπάρξει HD χωρίς το MPEG-4;
Γράφει: Αργύρης Νομικός

Featured | Με τη Nova να εκπέμπει πλέον κανάλια HD και τα αρχεία mkv να υποστηρίζουν αναλύσεις 1080p, οι τηλεοράσεις υψηλής ευκρίνειας που είχαμε αγοράσει πριν χρόνια, αρχίζουν να βγάζουν τα λεφτά τους. Με αυτόν τον τρόπο πάνω κάτω, γίνεται οικεία η ανάλυση HD στα μάτια μας. Πάντα όμως πίσω από μια HD προβολή κρύβεται το πρότυπο MPEG-4. Άραγε θα μπορούσε να υπάρξει HD χωρίς το MPEG-4;
Από την αυγή της εμφάνισής του, οποιοδήποτε ψηφιακό βίντεο είχε να αντιμετωπίσει μια πρόκληση. Η πρόκληση, ήταν φυσικά η διατήρηση της ποιότητας της εικόνας, χαμηλώνοντας όσο το δυνατόν περισσότερο τον όγκο της πληροφορίας. Αμέτρητες προτάσεις συμπίεσης έχουν γίνει όλα αυτά τα χρόνια, αλλά μία μόνο αποδείχτηκε κατάλληλη για το broadcast ψηφιακό βίντεο και αυτή ήταν η συμπίεση MPEG. Το MPEG-2 απετέλεσε και αποτελεί το βασικό τρόπο συμπίεσης της συντριπτικής πλειοψηφίας των καναλιών που εκπέμπονται σήμερα. Φαίνεται όμως, ότι η… αυτοκρατορία του κινδυνεύει από έναν… ξάδελφό του, που ακούει ΚΑΙ στο όνομα MPEG-4.
MPEG-4… classic
MPEG-4… classic
To πρώτο MPEG-4 για βίντεο συμπίεση, αναπτύχθηκε στις αρχές του 1999 από την ομάδα MPEG (Moving Picture Experts Group), την ίδια δηλαδή ομάδα που κατασκεύασε τα πρότυπα MPEG-1 και MPEG-2 και η πλήρης ονομασία του είναι MPEG-4 Version 2. Η βασική λογική σχεδίασης του πρώτου βίντεο πρότυπου MPEG-4, ήταν η καλή ποιότητα εικόνας σε πολύ χαμηλά bitrates (πολύ μεγάλη δηλαδή συμπίεση). Αν πρόκειται να μιλήσουμε με αριθμούς, το MPEG-4 Version 2, μπορούσε να πετύχει ικανοποιητική ποιότητα εικόνας, με ανάλυση 720×576 (SD) σε bitrates μικρότερα του 1Μbps. Η συμπίεση δηλαδή, ήταν 4 ή και περισσότερες φορές μεγαλύτερη από ένα αντίστοιχο MPEG-2, σε καμία όμως περίπτωση η ποιότητά του δεν πλησίαζε την αντίστοιχη του MPEG-2. Αν και βασικοί στόχοι του MPEG-4 ήταν η ψηφιακή τηλεόραση, οι εφαρμογές Interactive γραφικών και Interactive πολυμέσων (όπως εφαρμογές World Wide Web, διανομής βίντεο σε δίκτυο κ.λπ.), τελικά δεν φάνηκε να ενδιαφέρει τους broadcasters και εφαρμόστηκε κυρίως στο διαδίκτυο, σε εφαρμογές αναπαραγωγής και επεξεργασίας video με υπολογιστή (Media Player, Real Player, Quicktime κ.λπ.) και σε κάποιες βιντεοκάμερες ή φωτογραφικές μηχανές, με λήψη βίντεο σε μνήμη. Περισσότερο γνωστό στο ευρύ κοινό, έγινε μέσω της εφαρμογής DivX (πριν περίπου μια δεκαετία), επειδή μια ολόκληρη ταινία συμπιεσμένη σε DivX, μπορεί να χωρέσει σε ένα CD, με ποιότητα σαφώς καλύτερη από το αναλογικό VHS ή τα ψηφιακά VCD, SVCD, αλλά σαφώς υποδεέστερη του κραταιού DVD.
H.264 / MPEG-4
Το Μάιο του 2003, παρουσιάστηκε ένα νέο σύστημα συμπίεσης βίντεο (codec) υψηλής ποιότητας, που ήταν το προϊόν συνεργασίας της ομάδας Moving Picture Experts Group (MPEG) μαζί με τη γνωστή ομάδα Video Coding Experts Group (VCEG). Ο καινούριος αυτός codec ονομάστηκε H.264 ή MPEG-4 Part 10, αλλά αρκετές φορές αναφέρεται και με το όνομα Advanced Video Coding (AVC). Τα πλήρη ονόματα που έχουν αναφερθεί για το νέο πρότυπο είναι H.264/AVC ή AVC/H.264 ή H.264/MPEG-4 AVC ή MPEG-4/H.264 AVC. Ο νέος αυτός Codec, λοιπόν, μόνο ιστορική σχέση έχει με το…κλασικό MPEG-4, αν και πολύς κόσμος λανθασμένα θεωρεί ότι είναι το ίδιο. Αυτό είναι, λοιπόν, το νέο MPEG-4 που θα εξυπηρετήσει τις ανάγκες της σύγχρονης ψηφιακής τηλεόρασης και όχι φυσικά το αρχικό MPEG-4 Version 2.
Αν θέλουμε να είμαστε απόλυτα ακριβείς, θα πρέπει να αναφέρουμε ότι η ονομασία MPEG-4 (ISO 14496) περιλαμβάνει πλέον ένα ευρύτατο πρότυπο με πλειάδα εφαρμογών, το οποίο αποτελείται από πολλά περισσότερα υπο-πρότυπα, που τα πιο ενδιαφέροντα για εμάς που ασχολούμαστε με την ψηφιακή εικόνα και τον ψηφιακό ήχο είναι τα ακόλουθα:
ISO 14496-1 (Systems): για Animation και Interactivity (π.χ. DVD Menus).
ISO 14496-2 (Video): ASP, XviD, DivX5, 3ivx (το αρχικό MPEG-4 level 2, που αναφέραμε παραπάνω).
ISO 14496-3 (Audio): Advanced Audio Coding (AAC)
ISO 14496-10 (Video): Advanced Video Coding (AVC), δηλαδή το H.264 που αναφέραμε παραπάνω (προσέξτε ότι είναι part 10 στο ευρύτερο πρότυπο MPEG-4 και είναι φυσικά, εντελώς διαφορετικό από το αρχικό MPEG-4 level 2).
ISO 14496-14 (Container): το MP4 φορμά.
ISO 14496-17 (Subtitles): MPEG-4 Text και subtitle φορμά.
O στόχος του H.264/MPEG-4 δεν άλλαξε και πολύ από το βασικό στόχο του αρχικού MPEG-4, αφού και εδώ το ζητούμενο είναι η υψηλή ποιότητα εικόνας σε χαμηλά bitrates. Για να μιλήσουμε και πάλι με νούμερα, ο βασικός στόχος ήταν ποιότητα εικόνας, καλύτερη από το DVD (MPEG-2) στο μισό ή ακόμα μικρότερο bitrate. Ένας πρόσθετος στόχος του H.264/MPEG-4, ήταν η ευελιξία, η δυνατότητα δηλαδή χρήσης του, σε εφαρμογές με ανάγκες υψηλής αλλά ΚΑΙ χαμηλής ανάλυσης και η συμβατότητά του με μια μεγάλη ποικιλία δικτύων και συστημάτων.
Συγκεχυμένο… τοπίο
Εκτός της πρώτης μεγάλης παρεξήγησης, που οφείλεται καθαρά στο όνομα του νέου Codec, υπάρχει και μία δεύτερη, που έχει να κάνει με τη σχέση του Broadcast συστήματος DVB-S2 με το High Definition και τον MPEG-4 (AVC) codec και ότι σχεδιάστηκε ακριβώς για να υποστηρίξει το νέο Codec. Αυτό φυσικά, δεν ισχύει. Στην πραγματικότητα, δεν υπάρχει καμιά σχέση μεταξύ τους, αφού το DVB-S (1 ή 2) είναι σύστημα μετάδοσης ψηφιακής τηλεόρασης και το MPEG (1,2 ή 4) είναι μέθοδος (αλγόριθμοι) συμπίεσης ψηφιακού βίντεο.
Για του λόγου το αληθές, παραθέτω κατωτέρω έναν πίνακα από την Technical Review της EBU, σχετικά με τα συστήματα εκπομπής και τους codec συμπίεσης.
Satellite EIRP (dBW) | 51 | 53,7 | ||
Πρότυπο | Transponder DVB-S | Transponder DVB-S2 | Transponder DVB-S | Transponder DVB-S2 |
Ανάλυση SD (720x576) | 7 κανάλια MPEG-2 15 κανάλια AVC | 10 κανάλια MPEG2 και 21 κανάλια AVC | 10 κανάλια MPEG-2 και 20 κανάλια AVC | 13 κανάλια MPEG-2 και 26 κανάλια AVC |
Ανάλυση HD (1920x1080i) | 1-2 κανάλια MPEG2 και 3-4 κανάλια AVC | 2 κανάλια MPEG-2 και 5 κανάλια AVC | 2 κανάλια MPEG-2 και 5 κανάλια AVC | 3 κανάλια MPEG-2 και 6 κανάλια AVC |
Όπως άνετα μπορεί κάποιος να παρατηρήσει από τον πίνακα της EBU, κάθε transponder μπορεί να μεταδώσει οποιοδήποτε σήμα (SDTV, HDTV), με οποιοδήποτε πρότυπο επιθυμεί (MPEG-2 ή AVC). Η μόνη διαφορά που υπάρχει, εντοπίζεται στην καλύτερη διαχείριση του bitrate, η οποία εμφανίζεται με αύξηση του αριθμού καναλιών, που…χωράνε σε έναν transponder. Αυτή λοιπόν είναι μόνο μία από τις καινοτομίες του DVB-S2, που φυσικά, θα αποτελέσει και μελλοντικό θέμα μας και εκεί θα εξηγήσουμε το λόγο που σχεδιάστηκε, τις βελτιώσεις, καθώς και ποιες ανάγκες εξυπηρετεί. Το θέμα μας, όμως σήμερα, είναι το MPEG-4, γι’ αυτό ας συνεχίσουμε με αυτό.
Η τεχνολογία
Όπως είναι λογικό, η βασική αρχή του MPEG, που αφορά πρόβλεψη και αναφορά σε προηγούμενα καρέ, διατηρείται και στο νέο Codec. Όμως, οι καινοτομίες είναι τόσο πολλές στον H.264/MPEG-4, που του επιτρέπουν να συμπιέζει το βίντεο με μεγαλύτερη επάρκεια, από οποιοδήποτε άλλο σύστημα συμπίεσης του παρελθόντος. Οι βασικές του καινοτομίες είναι:
- Multi-picture motion compensation, με 32 καρέ «προηγούμενης αναφοράς», σε αντίθεση με το MPEG-2, που επιτρέπει ένα ή το πολύ δύο. Αυτό το χαρακτηριστικό επιτρέπει μικρές βελτιώσεις ποιότητας ή bitrate στην πλειοψηφία των σκηνών, όμως σε συγκεκριμένο τύπο σκηνών (π.χ. back-and-forth cuts ή επαναλαμβανόμενο γρήγορο αναβοσβήσιμο φωτός σαν flashing), προσφέρει σημαντική μείωση bitrate.
- Variable block-size motion compensation (VBSMC), που επιτρέπει ακρίβεια κατάτμησης (precise segmentation) των κινούμενων περιοχών, με μεγέθη από 16×16 (μεγάλα), μέχρι 4×4 (πολύ μικρά). Η μέθοδος μειώνει το aliasing και παράγει μια πιο ευκρινή εικόνα.
- Macroblock pair structure, που επιτρέπει 16×16 macroblocksm, σε αντίθεση με τα 16×8 του MPEG-2.
- Quarter-pixel precision, που παρέχει μεγάλη ακρίβεια περιγραφής, για παραμορφώσεις (displacements) των κινούμενων περιοχών.
- Spatial block transform. Ένας ειδικός μαθηματικός μετασχηματισμός (παρεμφερής με τον DCT), με δυνατότητα στον encoder να προσαρμόσει την εφαρμογή του σε 4×4 ή 8×8 blocks. Επιπρόσθετα, ένας δευτερεύων Hadamard μαθηματικός μετασχηματισμός, εφαρμόζεται στις συνεχείς συνιστώσες του αρχικού Spatial μετασχηματισμού (χωρικός μετασχηματισμός). Αναφέρουμε ότι οι συνεχείς συνιστώσες αφορούν κυρίως Chroma και σε ορισμένες περιπτώσεις Luma.
- Ιn-loop deblocking filter, για τη βελτίωση των artifacts (συγκεκριμένων παραμορφώσεων), που είναι γνωστές σε όλα τα συστήματα συμπίεσης, που βασίζονται στον αλγόριθμο DCT (Descrite Cosine Transform, Διακριτός Μετασχηματισμός Συνημίτονου).
- Data partitioning, που παρέχει τη δυνατότητα ταξινόμησης πληροφοριών, σε σημαντικές ή λιγότερο σημαντικές.
- CABAC (Context-adaptive binary arithmetic coding), που είναι μια έξυπνη τεχνική, η οποία επιτρέπει μη απωλεστική συμπίεση, στα βασικά στοιχεία σύνταξης ενός βίντεο stream.
- CAVLC (Context-adaptive variable-length coding), που αποτελεί μια εναλλακτική λύση του CABAC.
- Supplemental enhancement information (SEI) και video usability information (VUI), που είναι πρόσθετες πληροφορίες, οι οποίες εισάγονται στο bitstream, με σκοπό να βελτιώσουν τη χρήση του βίντεο σε πολλαπλές εφαρμογές.
Θα μπορούσα να συνεχίσω και με περισσότερα, όμως δεν γνωρίζω αν μπορώ πραγματικά να συνοψίσω μέσα σε 10 ή 20 σημεία, περισσότερες από 300 σελίδες δύσκολα μαθηματικά και αλγόριθμους, που αποτελούν τη θεωρία του νέου Codec. Τα μαθηματικά υπάρχουν φυσικά στο διαδίκτυο, διαθέσιμα σε όποιον επιθυμεί να έχει μια πλήρη εικόνα.
H ουσία πάντως είναι μία. Όλες αυτές οι τεχνικές, επιτρέπουν στο H.264/MPEG-4 να παρουσιάζει δραματική βελτίωση, έναντι οποιουδήποτε άλλου προτύπου συμπίεσης έχει χρησιμοποιηθεί στο παρελθόν. Φυσικά, θα μπορούσε να χρησιμοποιηθεί σε οποιαδήποτε ανάλυση εικόνας και σε πολλαπλές εφαρμογές, αφού υποστηρίζει πολλά διαφορετικά profiles. Έτσι λοιπόν, ο νέος codec υποστηρίζει τα ακόλουθα:
Baseline Profile (BP): Σχεδιασμένο για εφαρμογές χαμηλού κόστους και χαμηλών πόρων συστήματος, χρησιμοποιείται σε videoconferencing και mobile εφαρμογές.
Main Profile (MP): Αρχικά, σχεδιάστηκε σαν βασικό consumer profile σε broadcast και storage (οπτικούς δίσκους κ.λπ.), όμως το συγκεκριμένο profile φαίνεται ότι θα δώσει μάχη με το High profile, για την επικράτηση σε αυτές τις εφαρμογές και ιδιαίτερα στον τομέα του HDTV.
Extended Profile (XP): Σχεδιασμένο μόνο για streaming video, υποστηρίζει πολύ μεγάλη συμπίεση εικόνας.
High Profile (HiP): Το κύριο profile για broadcast και storage, ειδικά σχεδιασμένο για εφαρμογές High Definition Television, καθώς και για HD DVD και Blu-ray Disc.
High 10 Profile (Hi10P): Προχωρώντας ένα (ή μάλλον… 10) βήματα παραπάνω, το High 10 προσθέτει 10-bits κβαντοποίησης εικόνας, για πιο επαγγελματικές εφαρμογές.
High 4:2:2 Profile (Hi422P): Για υποστήριξη της δειγματοληψίας 4:2:2 και, φυσικά, με 10-bits κβαντοποίηση εικόνας. Ιδιαίτερα αγαπητό από τους Feed Hunters…
High 4:4:4 Profile (Hi444P) [εγκαταλείφθηκε]: Υποστηρίζει δειγματοληψία 4:4:4 και 12 bits κβαντοποίηση, αλλά εγκαταλείφθηκε, αφού οι κατασκευαστές του standard υποσχέθηκαν ένα νέο, πιο βελτιωμένο 4:4:4 profile.
Συμπερασματικά
Τα κάνει όλα καλύτερα!!!. Χαμηλότερο bitrate, με καλύτερη ή τουλάχιστον ισοδύναμη ποιότητα εικόνας με το MPEG-2, είναι ένα ατού που δεν περνάει απαρατήρητο. Και μόνο το γεγονός ότι ο νέος codec μπορεί να μειώσει στο ήμισυ τους Transponders που χρησιμοποιεί ένας παροχέας, θα επιφέρει δραματικές αλλαγές στα επόμενα χρόνια. Σταδιακά, οι δέκτες MPEG-2 θα αχρηστευτούν, αφού δεν θα υπάρχει λόγος εκπομπής MPEG-2. Η καταλυτική ημερομηνία βρισκόταν κάπου στο 2012. Ωστόσο, στην αγορά σήμερα δύσκολα θα βρει κάποιος καινούργιο δορυφορικό δέκτη χωρίς υποστήριξη MPEG-4, οπότε ίσως οι ανάγκες και ο ανταγωνισμός να έφεραν το τέλος των καθαρόαιμων δεκτών MPEG-2 μια ώρα αρχύτερα.