FMUSER Wirless överför video och ljud enklare!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> afrikanska
sq.fmuser.org -> albanska
ar.fmuser.org -> arabiska
hy.fmuser.org -> Armenian
az.fmuser.org -> Azerbajdzjanska
eu.fmuser.org -> Baskiska
be.fmuser.org -> vitryska
bg.fmuser.org -> Bulgariska
ca.fmuser.org -> katalanska
zh-CN.fmuser.org -> Kinesiska (förenklad)
zh-TW.fmuser.org -> Kinesiska (traditionella)
hr.fmuser.org -> kroatiska
cs.fmuser.org -> Tjeckiska
da.fmuser.org -> danska
nl.fmuser.org -> Dutch
et.fmuser.org -> estniska
tl.fmuser.org -> filippinska
fi.fmuser.org -> finska
fr.fmuser.org -> French
gl.fmuser.org -> galiciska
ka.fmuser.org -> Georgiska
de.fmuser.org -> tyska
el.fmuser.org -> Greek
ht.fmuser.org -> Haitisk kreol
iw.fmuser.org -> hebreiska
hi.fmuser.org -> Hindi
hu.fmuser.org -> ungerska
is.fmuser.org -> isländska
id.fmuser.org -> Indonesiska
ga.fmuser.org -> Irländska
it.fmuser.org -> Italian
ja.fmuser.org -> japanska
ko.fmuser.org -> koreanska
lv.fmuser.org -> lettiska
lt.fmuser.org -> Litauiska
mk.fmuser.org -> makedonska
ms.fmuser.org -> Malajiska
mt.fmuser.org -> maltesiska
no.fmuser.org -> Norwegian
fa.fmuser.org -> persiska
pl.fmuser.org -> polska
pt.fmuser.org -> portugisiska
ro.fmuser.org -> rumänska
ru.fmuser.org -> ryska
sr.fmuser.org -> serbiska
sk.fmuser.org -> Slovakiska
sl.fmuser.org -> Slovenska
es.fmuser.org -> spanska
sw.fmuser.org -> Swahili
sv.fmuser.org -> svenska
th.fmuser.org -> Thai
tr.fmuser.org -> Turkiska
uk.fmuser.org -> ukrainska
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamesiskt
cy.fmuser.org -> Walesiska
yi.fmuser.org -> Jiddisch
(1) Redundant information om videosignalen
Med YUV-komponentformatet för inspelning av digital video som exempel representerar YUV ljusstyrka respektive två färgskillnadssignaler. Till exempel, för befintligt pal-TV-system är samplingsfrekvensen för luminanssignalen 13.5 mHz; frekvensbandet för kromsignalen är vanligtvis hälften eller mindre av ljushetssignalen, vilket är 6.75 mhz eller 3.375 mhz. Om vi tar samplingsfrekvensen 4: 2: 2 som exempel, antar Y-signalen 13.5 mhz, kromsignalen U och V samplas med 6.75 mhz och samplingssignalen kvantiseras med 8 bitar, då kan kodhastigheten för digital video beräknas som följer:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216Mbit / s
Om en så stor mängd data lagras eller överförs direkt kommer det att vara svårt att använda komprimeringsteknik för att minska bithastigheten. Den digitala videosignalen kan komprimeras enligt två grundläggande villkor:
L. dataredundans. Till exempel rumslig redundans, tidsredundans, strukturredundans, informationsentropi-redundans, etc., det vill säga det finns en stark korrelation mellan bildens pixlar. Att eliminera dessa redundanser leder inte till förlust av information, och det är förlustfri komprimering.
L. visuell redundans. Vissa egenskaper hos mänskliga ögon, såsom tröskel för ljusdiskriminering, visuell tröskel, skiljer sig åt i känslighet för ljusstyrka och krom, vilket gör det omöjligt att införa lämpliga fel i kodningen och kommer inte att detekteras. De visuella egenskaperna hos mänskliga ögon kan användas för att utbyta för datakomprimering med viss objektiv distorsion. Denna komprimering är förlorad.
Komprimeringen av digital videosignal baseras på ovanstående två förhållanden, vilket gör videodata kraftigt komprimerade, vilket bidrar till överföring och lagring. De vanliga metoderna för digital videokomprimering är blandad kodning, vilket är att kombinera transformeringskodning, rörelseuppskattning och rörelsekompensation och entropikodning för att komprimera kodning. Vanligtvis används transformeringskodning för att eliminera bildens redundans inom bilden, och rörelseuppskattning och rörelsekompensation används för att ta bort bildramens redundans och entropikodning används för att ytterligare förbättra komprimeringseffektiviteten. Följande tre komprimeringskodningsmetoder introduceras kort.
(a) Komprimeringskodningsmetod
(b) Transformera kodning
Funktionen för transformeringskodning är att transformera bildsignalen som beskrivs i rymddomänen till frekvensdomänen och sedan koda de transformerade koefficienterna. Generellt sett har bilden en stark korrelation i rymden, och omvandlingen till frekvensdomän kan realisera avkorrelation och energikoncentration. Den vanliga ortogonala transformationen innefattar diskret Fourier-transform, diskret cosinustransform och så vidare. Diskret cosinustransformation används ofta i digital videokomprimering.
Diskret cosinustransform kallas DCT-transform. Det kan förvandla bildblocket för L * l från rymddomän till frekvensdomän. Därför, i processen för bildkomprimering och kodning baserad på DCT, måste bilden delas upp i icke överlappande bildblock. Antag att storleken på en bild är 1280 * 720, den är uppdelad i 160 * 90 bildblock med 8 * 8-storlek utan överlappning i form av rutnät. Då kan DCT-omvandling utföras för varje bildblock.
Efter att blocket har delats skickas varje 8 * 8-punkts bildblock till DCT-kodaren och 8 * 8-bildblocket transformeras från den rumsliga domänen till frekvensdomänen. Bilden nedan visar ett exempel på ett bildblock på 8 * 8 där talet representerar ljusstyrkan för varje pixel. Det framgår av figuren att ljusvärdena för varje pixel i detta bildblock är relativt likformiga, särskilt ljusstyrkan för intilliggande pixlar är inte särskilt stor, vilket indikerar att bildsignalen har en stark korrelation.
Ett faktiskt 8 * 8-bildblock
Följande bild visar resultaten av DCT-transformation av bildblocket i figuren ovan. Det framgår av figuren att efter DCT-transformation koncentrerar lågfrekvenskoefficienten i det övre vänstra hörnet mycket energi, medan energin på högfrekvenskoefficienten i det nedre högra hörnet är mycket liten.
Koefficienterna för bildblock efter DCT-transformation
Signalen måste kvantifieras efter DCT-transformation. Eftersom mänskliga ögon är känsliga för bilder med låg frekvens, såsom objektens totala ljusstyrka, och inte för de högfrekventa detaljerna i bilden, så kan högfrekvensinformation i överföringsprocessen sändas mindre eller inte, bara lågfrekventa delen. Kvantiseringsprocessen minskar informationsöverföringen genom att kvantifiera koefficienterna för lågfrekvensregionen och grov kvantisering av koefficienterna i högfrekvensregionen, vilket tar bort högfrekvensinformationen som inte är känslig för mänskliga ögon. Därför är kvantisering en förlorad komprimeringsprocess och den främsta orsaken till kvalitetsskador i videokomprimeringskodning.
Kvantifieringsprocessen kan uttryckas med följande formel:
Bland dem representerar FQ (U, V) DCT-koefficienten efter kvantisering; f (U, V) representerar DCT-koefficient före kvantisering; Q (U, V) representerar kvantiseringsviktningsmatris; q är kvantiseringssteg; runda avser konsolidering och värdet som ska matas tas som närmaste heltal.
Välj kvantiseringskoefficienten rimligt, och resultatet efter kvantisering av det transformerade bildblocket visas i figuren.
DCT-koefficient efter kvantifiering
De flesta av DCT-koefficienterna ändras till 0 efter kvantisering, medan endast ett fåtal koefficienter inte är nollvärden. För närvarande behöver endast dessa värden som inte är noll komprimeras och kodas.
(b) Entropikodning
Entropikodning heter eftersom den genomsnittliga kodlängden efter kodning ligger nära källans entropivärde. Entropikodning implementeras med VLC (kodning med variabel längd). Grundprincipen är att ge kort kod till symbolen med hög sannolikhet i källan, och att ge lång kod till symbolen med liten sannolikhet för förekomst, för att statistiskt få den kortare genomsnittliga kodlängden. Kodning med variabel längd innehåller vanligtvis Hoffman-kod, aritmetisk kod, körkod etc. Körlängdskodning är en mycket enkel komprimeringsmetod, dess komprimeringseffektivitet är inte hög, men kodnings- och avkodningshastigheten är snabb och används fortfarande i stor utsträckning, särskilt efter omvandlingen av kodningen, med användning av körningslängdskodning, har en bra effekt.
Först ska AC-koefficienten omedelbart efter kvantiserarens utgående DC-koefficient skannas i Z-typ (som visas i pilen). Z-scanningen omvandlar den tvådimensionella kvantiseringskoefficienten till en dimensionell sekvens och fortsätter sedan körningslängdskodningen. Slutligen används en annan kod med variabel längd för att koda data efter körkodningen, såsom Hoffman-kodning. Genom denna typ av kodning med variabel längd förbättras kodningens effektivitet ytterligare.
(c) Uppskattning av rörelse och rörelsekompensation
Rörelseuppskattning och rörelsekompensation är effektiva metoder för att eliminera korrelationen av tidsriktningen för bildsekvenser. DCT-transformerings-, kvantiserings- och entropikodningsmetoderna som beskrivs ovan är baserade på en rambild. Genom dessa metoder kan den rumsliga korrelationen mellan pixlar i bilden elimineras. Förutom rumslig korrelation har bildsignalen faktiskt tidsmässig korrelation. Till exempel, för digital video med statisk bakgrund som nyhetssändning och liten rörelse av huvudbilden, är skillnaden mellan varje bild mycket liten och korrelationen mellan bilder är mycket stor. I det här fallet behöver vi inte koda varje bildbild separat utan kan bara koda de ändrade delarna av intilliggande videoramar för att ytterligare minska datamängden. Detta arbete realiseras genom rörelseuppskattning och rörelsekompensation.
Rörelsestimeringsteknologi delar i allmänhet den aktuella inmatningsbilden i flera små bildunderblock som inte överlappar varandra, till exempel är storleken på en bild på bilden 1280 * 720. För det första är den uppdelad i 40 * 45 bildblock med 16 * 16 storlek som inte överlappar varandra i form av rutnät, och sedan inom ramen för ett sökfönster för föregående bild eller den senare bilden, hitta ett block för varje bildblock för att hitta ett bildblock inom ramen för en sökfönster Det mest liknande bildblocket. Sökprocessen kallas rörelseuppskattning. Genom att beräkna positionsinformationen mellan det mest liknande bildblocket och bildblocket kan en rörelsevektor erhållas. På detta sätt kan det aktuella bildblocket subtraheras från det mest liknande bildblocket som pekas av referensbildens rörelsevektor, och ett kvarvarande bildblock kan erhållas. Eftersom varje pixelvärde i kvarvarande bildblock är mycket litet kan ett högre kompressionsförhållande erhållas vid komprimeringskodning. Denna subtraktionsprocess kallas rörelsekompensation.
Eftersom referensbild behövs för att användas för rörelseuppskattning och rörelsekompensation i kodningsprocessen är det mycket viktigt att välja referensbild. Generellt delar kodaren varje bildbildsinmatning i tre olika typer enligt de olika referensbilderna: I (intra) ram, B (guidning förutsägelse) ram och P (förutsägelse) ram. Som visas i figuren.
Typisk I, B, P ramstruktursekvens
Som visas i figuren använder jag endast data i ramen för kodning, och den behöver inte rörelseuppskattning och rörelsekompensation under kodningsprocessen. Eftersom jag ramar inte eliminerar korrelationen av tidsriktningen är uppenbarligen kompressionsförhållandet relativt lågt. Under kodningsprocessen använder P-ram en front I-ram eller P-ram som referensbild för rörelsekompensation, faktiskt kodar den skillnaden mellan den aktuella bilden och referensbilden. Kodningsläget för B-ram liknar P-ram, den enda skillnaden är att den behöver använda en front I-ram eller P-ram och en senare I-ram eller P-ram för att förutsäga under kodningsprocessen. Således måste varje P-ramkodning använda en rambild som referensbild, medan ram B behöver två ramar som referens. Däremot har B-ramen ett högre kompressionsförhållande än P-ramen.
(d) Blandad kodning
Papperet introducerar flera viktiga metoder inom videokomprimering och kodning. I praktisk tillämpning är dessa metoder inte separerade, och de kombineras vanligtvis för att uppnå bästa kompressionseffekt. Följande bild visar modellen för hybridkodning (dvs. transformeringskodning + rörelseuppskattning och rörelsekompensation + entropikodning). Modellen används i stor utsträckning i MPEG1, MPEG2, H.264 och andra standarder. Från figuren kan vi se att den aktuella inmatningsbilden måste delas in i block först, blocket för bilden som erhålls av blocket ska subtraheras från förutsagd bild efter rörelsekompensation för att erhålla skillnadsbilden x, och därefter utförs DCT-transformation och kvantisering för skillnadsbildsblocket. Den kvantiserade utdata har två olika platser: en är att skicka den till entropikodaren för kodning, och den kodade kodströmmen matas ut till en cache Spara i enheten och vänta på överföring. En annan applikation är att motverka kvantifiering och omvänd förändring till signal x ', som adderar bildblockutsignalen med rörelsekompensation för att erhålla en ny förutsägelsebildsignal, och skickar ett nytt prediktionsbildblock till ramminnet.
|
Ange e-post för att få en överraskning
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> afrikanska
sq.fmuser.org -> albanska
ar.fmuser.org -> arabiska
hy.fmuser.org -> Armenian
az.fmuser.org -> Azerbajdzjanska
eu.fmuser.org -> Baskiska
be.fmuser.org -> vitryska
bg.fmuser.org -> Bulgariska
ca.fmuser.org -> katalanska
zh-CN.fmuser.org -> Kinesiska (förenklad)
zh-TW.fmuser.org -> Kinesiska (traditionella)
hr.fmuser.org -> kroatiska
cs.fmuser.org -> Tjeckiska
da.fmuser.org -> danska
nl.fmuser.org -> Dutch
et.fmuser.org -> estniska
tl.fmuser.org -> filippinska
fi.fmuser.org -> finska
fr.fmuser.org -> French
gl.fmuser.org -> galiciska
ka.fmuser.org -> Georgiska
de.fmuser.org -> tyska
el.fmuser.org -> Greek
ht.fmuser.org -> Haitisk kreol
iw.fmuser.org -> hebreiska
hi.fmuser.org -> Hindi
hu.fmuser.org -> ungerska
is.fmuser.org -> isländska
id.fmuser.org -> Indonesiska
ga.fmuser.org -> Irländska
it.fmuser.org -> Italian
ja.fmuser.org -> japanska
ko.fmuser.org -> koreanska
lv.fmuser.org -> lettiska
lt.fmuser.org -> Litauiska
mk.fmuser.org -> makedonska
ms.fmuser.org -> Malajiska
mt.fmuser.org -> maltesiska
no.fmuser.org -> Norwegian
fa.fmuser.org -> persiska
pl.fmuser.org -> polska
pt.fmuser.org -> portugisiska
ro.fmuser.org -> rumänska
ru.fmuser.org -> ryska
sr.fmuser.org -> serbiska
sk.fmuser.org -> Slovakiska
sl.fmuser.org -> Slovenska
es.fmuser.org -> spanska
sw.fmuser.org -> Swahili
sv.fmuser.org -> svenska
th.fmuser.org -> Thai
tr.fmuser.org -> Turkiska
uk.fmuser.org -> ukrainska
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamesiskt
cy.fmuser.org -> Walesiska
yi.fmuser.org -> Jiddisch
FMUSER Wirless överför video och ljud enklare!
Kontakta Oss
Adress:
No.305 Room HuiLan Building No.273 Huanpu Road Guangzhou Kina 510620
Kategorier
Nyhetsbrev