專利名稱:移動圖像編碼裝置的制作方法
技術領域:
本發(fā)明涉及一種移動圖像編碼裝置,更具體地涉及一種當使用H.264編碼標準時用于選擇最優(yōu)幀內預測模式的技術。
背景技術:
已經建立各種編碼標準,例如Motion-JPEG、MPEG-1和MPEG-2,作為用于對移動圖像進行高效編碼的技術。制造商已經開發(fā)并銷售圖像捕捉裝置,例如數碼像機、數碼攝像機、DVD(數字多用盤)播放器等,其能夠存儲使用了這些編碼標準的移動圖像。因此,允許用戶使用這些圖像捕捉裝置、DVD播放器、個人電腦等容易地對移動圖像進行播放。
數字化移動圖像攜帶大量的數據。所以,各種能夠進行比上述諸如MPEG-1或MPEG-2的編碼標準更有效的高壓縮的移動圖像編碼方法,已經連續(xù)地被研究和開發(fā)。最近,一種稱為H.264/MPEG-4 Part 10AVC的新的編碼算法(后面稱為H.264標準)已經被ITU-T(國際電信聯(lián)盟-電信標準化組)和ISO(國際標準化組織)標準化。
H.264標準與諸如MPEG-1和MPEG-2的傳統(tǒng)的編碼標準相比,要求編碼和解碼的很大的計算復雜度,但是提供了更高的編碼效率。已經披露一種使用H.264標準的計算處理的系統(tǒng)和方法,例如,在日本公開專利申請No.2004-56827中。
H.264標準包括一種稱為幀內預測的預測方法,該預測方法通過使用同一幀內的像素值在一個給定的幀內對像素值進行預測。在這種幀內預測中,有許多可選擇使用的幀內預測模式。在這種情況下,選擇一種適合輸入圖像的幀內預測模式以形成印使進行高效壓縮后仍具有極小劣化的編碼數據。
對于幀內預測,H.264標準提供九種幀內預測模式用以改善預測的精度。通常通過試驗性地對輸入圖像執(zhí)行所有的幀內預測模式并且根據試驗性的執(zhí)行結果找到一種能夠獲得最優(yōu)結果的幀內預測模式,從九種幀內預測模式中選擇出一種最優(yōu)幀內預測模式。
下面參照圖17說明采用這種選擇方法的理由。圖17為表示幀的圖,其中外部的四邊形表示整個畫面,而五個內部的四邊形表示將進行幀內預測的方塊。雖然實際上在整個畫面上都設置有方塊,但是為了方便描述僅圖示了五個代表性的方塊。圖17中的箭頭表示由作為每個方塊中的計算結果的被確定為最優(yōu)幀內預測模式所表示的預測方向。這樣,因為甚至在同一幅畫面中的各個位置上存在著各種目標,所以針對各個方塊可能有不同的幀內預測模式被確定為最優(yōu),并且可能會選擇出超過一個的具體幀內預測模式?;谶@個原因,在執(zhí)行幀內預測時,對每個方塊中所有的幀內預測模式獲得預測的精度,并且選擇出能執(zhí)行最優(yōu)預測的幀內預測模式并指定在每一個方塊內。
然而,計算每個方塊中的所有的幀內預測模式以便從中選擇出一種最優(yōu)幀內預測模式,這增加了H.264編碼處理中計算的復雜度,因此導致了編碼處理時間的額外增加或電力的浪費。
發(fā)明內容
本發(fā)明考慮了上述的情況,且本發(fā)明的一個方面是幫助選擇對于輸入圖像的最優(yōu)幀內預測模式。
本發(fā)明的另一方面是通過使用有關輸入圖像的攝像信息來幫助選擇對于輸入圖像的最優(yōu)幀內預測模式。
本發(fā)明的另一方面是通過減輕使用H.264標準的圖像編碼裝置中的計算復雜度從而實現(xiàn)有效的編碼。
在本發(fā)明的一個方面中,圖像編碼裝置包括配置成輸入圖像數據的輸入單元、配置成通過將由輸入單元輸入的圖像數據分割為分別包括多個像素的方塊從而生成塊的分割單元、配置成確定由分割單元生成的每個塊中的圖像數據的圖像圖案的確定單元、配制成根據由確定單元確定的圖像圖案來選擇多個預測模式中的一個的選擇單元,以及配置成通過根據由選擇單元選擇的預測模式使用同一幅畫面中的像素值進行畫面像素值預測處理以輸出預測的像素值的處理單元。
在本發(fā)明的另一方面中,圖像編碼裝置包括配置成輸入將要編碼的圖像數據的輸入單元、配置成獲得關于圖像數據的攝影信息的獲取單元、配置成使用所述的攝影信息從n個預測模式中選擇出m個預測模式(1≤m≤n)的選擇單元,和配置成通過根據所述選擇單元選擇出的m個預測模式使用同一幅畫面中的像素值對該畫面中的像素值進行預測處理從而輸出預測的像素值的處理單元。
通過閱讀下面結合附圖對有關實施例的詳細描述,本發(fā)明的其它特性和優(yōu)點將對于本領域的技術人員變得明顯,其中在整個附圖中同樣的標號表示同樣或類似的部分。
與說明書一體的并組成說明書一部分的
本發(fā)明的實施例,并且與該描述一起解釋本發(fā)明的原理。
圖1為說明根據本發(fā)明的第一實施例的幀內預測處理的方框圖。
圖2為說明Hadamard變換的示意圖。
圖3A、3B和3C為說明Hadamard變換中變換示例的示意圖。
圖4A、4B和4C為說明幀內預測模式的示意圖。
圖5為說明根據第一實施例的用以選擇一個幀內預測模式的處理的流程圖。
圖6為根據第一實施例的使用H.264標準的圖像編碼裝置的方框圖。
圖7為說明根據本發(fā)明的第三實施例的圖像捕捉裝置的配置的方框圖。
圖8為說明鏡頭搖移過程中獲得的圖像的幀內預測方向的例子的示意圖。
圖9為說明根據第三實施例的圖像編碼裝置中鏡頭搖移或俯仰轉動的方向對幀內預測模式進行選擇的處理流程圖。
圖10為表示在變焦過程中獲得圖像的幀內預測方向的例子的示意圖。
圖11為說明根據本發(fā)明的第四實施例的圖像編碼裝置中的變焦對幀內預測模式進行選擇的處理流程圖。
圖12為說明模糊圖像的幀內預測的例子的示意圖。
圖13為說明根據本發(fā)明的第五實施例的圖像編碼裝置中的調焦的幀內預測模式的處理流程圖。
圖14為根據第三實施例的圖像編碼裝置的方框圖。
圖15為說明在幀內預測中使用的像素的示意圖。
圖16為說明九種幀內預測模式的示意圖。
圖17為表示通常圖像的幀內預測的方向的例子的示意圖。
圖18為說明選擇幀內預測模式的通常處理的流程圖。
具體實施例方式
下面參照附圖對本發(fā)明的實施例進行詳細描述。
第一實施例圖6為表示根據本發(fā)明的第一實施例的圖像編碼裝置600的配置的方框圖。該圖像編碼裝置600包括減法器601、整數變換單元602、量子化單元603、熵編碼單元604、逆量子化單元605、逆整數變換單元606、加法器607、幀存儲器608和611、幀內預測單元609、環(huán)形濾波器610、幀間預測單元612、移動檢測單元613和開關614。圖像編碼裝置600配置為對輸入圖像數據進行編碼處理以輸出編碼后的數據。
下面說明圖6中所述的圖像編碼裝置600中的編碼處理。圖像編碼裝置600根據H.264標準進行編碼處理。另外,圖像編碼裝置600將輸入的移動圖像數據分割成方塊并對每個方塊進行處理。
首先,減法器601從輸入到圖像編碼裝置600的圖像數據(輸入的圖像數據)中減去預測的圖像數據以輸出差別圖像數據。后面將描述預測圖像的生成。
整數變換單元602對從減法器601輸出的差別圖像數據進行正交變換以輸出變換系數。然后,量子化單元603使用預定的量子化參數對變換系數進行量子化。
熵編碼單元604接收由量子化單元603量化的變換系數并對之進行熵編碼,從而輸出編碼后的數據。
由量子化單元603量子化的變換系數也用作生成用于對后面的方塊進行編碼的預測圖像數據。逆量子化單元605在由量子化單元603量子化的變換系數上進行逆量子化操作。逆整數變換單元606在由逆量子化單元605逆量子化后的變換系數上執(zhí)行逆整數變換,以輸出解碼后的差別數據。加法器607將解碼后的差別數據和預測的圖像數據相加,以輸出重建后的圖像數據。
重建后的圖像數據存儲到幀存儲器608中并通過環(huán)形濾波器610存儲到幀存儲器611中。重建圖像數據中可能涉及后來的預測的數據暫時被存儲在幀存儲器608或611中。環(huán)形濾波器610用于去除阻塞噪聲。
幀內預測單元609使用存儲在幀存儲器608中的重建圖像數據進行幀內預測,從而生成預測圖像數據。幀間預測單元612根據由移動檢測單元613檢測到的移動矢量信息進行幀間預測并且使用存儲在幀存儲器611中的重建圖像數據生成預測圖像數據。移動檢測單元613在輸入的圖像數據中檢測移動矢量信息并將檢測到的移動矢量信息輸出到幀間預測單元612和熵編碼單元604。
開關614作為選擇單元而工作為每個宏塊選擇幀內預測和幀間預測中的任一個。也就是說,開關614從幀內預測單元609的輸出和幀間預測單元612的輸出中選擇出一個并將選擇出的預測圖像數據輸出到減法器601和加法器607。
圖1為說明根據第一實施例的幀內預測處理的方框圖。圖1中所示的配置對應于包括在圖像編碼裝置600中的幀內預測單元609。
參考圖1,幀內預測單元609包括圖像圖案確定單元101、幀內預測模式指定單元102、選擇器103、垂直幀內預測單元104、水平幀內預測單元105、直流幀內預測單元106和選擇器107。圖像圖案確定單元101通過在輸入圖像上進行Hadamard變換從而確定圖像圖案。幀內預測模式指定單元102根據由圖像圖案確定單元101確定的圖像圖案從多個幀內預測模式中指定一個最優(yōu)的幀內預測模式。選擇器103和107從垂直幀內預測單元104、水平幀內預測單元105和直流幀內預測單元106中選擇出一個單元,對應于幀內預測模式指定單元102指定的幀內預測模式。垂直幀內預測單元104使用垂直幀內預測模式進行幀內預測。水平幀內預測單元105使用水平幀內預測模式進行幀內預測。直流幀內預測單元106使用直流幀內預測模式進行幀內預測。這樣,垂直、水平和直流幀內預測模式中的一個預測模式就被選出并根據選擇器103和107的選擇得以執(zhí)行。作為結果,幀內預測單元609輸出預測圖像。
下面對圖1中所示的幀內預測單元609的主要部分進行詳細說明。在本實施例中,例如,圖像圖案確定單元101在被分割成4×4像素塊的輸入圖像上執(zhí)行Hadamard變換。然而,用于確定圖像圖案的塊的大小和配置并不限于其中的這些描述。
圖像圖案確定單元101將輸入圖像的像素數據分割為4×4像素塊,在每個塊的像素數據上執(zhí)行Hadamard變換,并且根據由Hadamard變換計算獲得的Hadamard變換系數確定每個塊的圖像圖案。
下面參照圖2描述Hadamard變換。Hadamard變換是一種正交變換。圖2說明在圖像圖案確定單元101中的4×4 Hadamard變換的方式。在圖2中,(a)部分說明由4×4像素組成的輸入圖像,(b)部分說明由Hadamard變換獲得的Hadamard變換系數。假設H4為Hadamard變換矩陣,X為輸入的圖像信號,Y為Hadamard變換系數的信號。那么,Hadamard變換用下面的等式表示[Y]=[H4][X][H4] (1)這里,使
H4=12111111-1-11-1-111-11-1---(2)]]>X=X11X12X13X14X21X22X23X24X31X32X33X34X41X42X43X44---(3)]]>Y=Y11Y12Y13Y14Y21Y22Y23Y24Y31Y32Y33Y34Y41Y42Y43Y44---(4)]]>那么,Hadamard變換定義為Y11Y12Y13Y14Y21Y22Y23Y24Y31Y32Y33Y34Y41Y42Y43Y44=14111111-1-11-1-111-11-1X11X12X13X14X21X22X23X24X31X32X33X34X41X42X43X44111111-1-11-1-111-11-1---(5)]]>這樣,Hadamard變換可以僅用一次除法、加法和減法完成。要注意的是,等式(5)的左側Y11表示輸入圖像的直流分量的Hadamard變換系數,Y12到Y44表示代表輸入圖像的交流分量的Hadamard變換系數。
圖3A、3B和3C說明輸入圖像的Hadamard變換的例子,其中每個像素8bit(256灰度級)的圖像數據被分割為4×4像素塊。在每個圖3A、3B和3C中,(a)部分表示輸入圖像,(b)部分表示Hadamard變換系數。如圖3A的(a)部分所示在輸入的圖像塊中存在垂直邊的情況下,對應于圖2的(b)部分所示的Hadamard變換系數Y14的位置的Hadamard變換系數取一個大值,如圖3A的(b)部分所示。如圖3B的(a)部分所示在輸入的圖像塊中存在水平邊的情況下,對應于圖2的(b)部分中所示的Hadamard變換系數Y41的位置的Hadamard變換系數取一個大值,如圖3B的(b)部分所示。如圖3C的(a)部分中所示在輸入的圖像塊包括平面圖像時,對應于圖2的(b)部分中所示的Hadamard變換系數Y11的位置的Hadamard變換系數取一個大值,如圖3C的(b)部分所示,其它系數取0值。通常,在輸入的圖像塊中存在垂直邊的情況下,僅有指示垂直方向上的空間頻率為低的Hadamard變換系數取一個大值,如圖3A的(b)部分中用橢圓圈起來的Hadamard變換系數所示。在水平邊存在于輸入的圖像塊中的情況下,僅有指示水平方向上的空間頻率為低的Hadamard變換系數取一個大值,如圖3B的(b)部分中用橢圓圈起來的Hadamard變換系數所示。在輸入的圖像塊中包含平面圖像的情況下,指示輸入圖像的交流分量的Hadamard變換系數取一個小值。
使用上述方法使得諸如垂直邊、水平邊或平面圖像的輸入圖像的圖像圖案,能夠基于通過在輸入的圖像上執(zhí)行Hadamard變換獲得的Hadamard變換系數而確定。
下面參照圖4A、4B和4C對幀內預測進行描述。圖4A、4B和4C說明各種幀內預測模式的例子。
在圖4A、4B和4C中,a到p表示要預測的輸入圖像塊的像素值。A到M表示屬于鄰近塊的像素值。像素值a到p和A到M位于同一幀中。幀內預測使用像素值A到M生成預測的像素值a’到p’。預測的像素值a’到p’集中在一起構成預測圖像。
下面對各種幀內預測模式進行詳細描述。
在圖4A中所示的垂直幀內預測模式中,在垂直方向上進行預測。通過預測像素值a、e、i和m分別等于像素值A,像素值b、f、j和n分別等于像素值B,像素值c、g、k和o分別等于像素值C,像素值d、h、l和p分別等于像素值D,可以生成預測像素值a’到p’。這樣,生成下面的像素值a′=e′=i′=m′=Ab′=f=j′=n′=Bc′=g′=k′=o′=Cd′=h′=l′=p′=D在圖4B中所示的水平幀內預測模式中,在水平方向上進行預測。通過預測像素值a、b、c和d分別等于像素值I,像素值e、f、g和h分別等于像素值J,像素值i、j、k和l分別等于像素值K,以及像素值m、n、o和p分別等于像素值L,從而生成預測像素值a’到p’。這樣,生成下面的像素值a′=b′=c′=d′=Ie′=f′=g′=h′=Ji′=j′=k′=l′=Km′=n′=o′=p′=L在圖4C中所示的直流幀內預測模式中,進行預測以使得所有的像素具有同樣的值。通過預測所有的像素值a到p相等從而生成預測像素值a’到p’。這樣,生成下面的像素值a′=b′=c′=d′=e′=f=g′=h′=i′=j′=k′=l′=m′=n′=o′=p′輸入圖像的預測像素值和實際像素值之間的差別越小,預測的精度就會變得越高,這樣就能夠進行有效的圖像壓縮。
下面描述根據圖像圖案指定幀內預測模式的方法。
幀內預測模式指定單元102根據由上面所述的圖像圖案確定單元101確定的圖像圖案,從上述的幀內預測模式中指定一種最優(yōu)的幀內預測模式。例如,如果確定輸入圖像塊中包括垂直邊,則幀內預測模式指定單元102指定垂直幀內預測模式。如果確定輸入圖像塊中包括水平邊,則幀內預測模式指定單元102指定水平幀內預測模式。如果確定輸入圖像塊中包括平面圖像,幀內預測模式指定單元102指定直流幀內預測模式。
更具體地,如果垂直邊存在于如圖3A中所示的輸入圖像塊中,則可以獲得具有下述關系的像素值a=e=i=mb=f=j=nc=g=k=od=h=l=p對這個輸入圖像塊執(zhí)行Hadamard變換以獲得Hadamard變換系數。如果圖像圖案確定單元101確定輸入圖像塊具有包括垂直邊的圖像圖案,則幀內預測模式指定單元102指定垂直幀內預測模式,其中預測的精度對于輸入圖像塊為最高。
如果如圖3B中所示在輸入圖像塊中存在水平邊,則獲得具有下述關系的像素值a=b=c=de=f=g=hi=j=k=lm=n=o=p對這個輸入圖像塊執(zhí)行Hadamard變換以獲得Hadamard變換系數。如果圖像圖案確定單元101確定輸入圖像塊具有包括水平邊的圖像圖案,則幀內預測模式指定單元102指定水平幀內預測模式,其中預測的精度對于輸入圖像塊為最高。
如果如圖3C中所示輸入圖像塊包括平面圖像時,則獲得具有下述關系的像素值a=b=c=d=e=f=g=h=i=j=k=l=m=n=o=p對這個輸入圖像塊執(zhí)行Hadamard變換以獲得Hadamard變換系數。如果圖像圖案確定單元101確定輸入圖像塊具有包括平面圖像的圖像圖案,則幀內預測模式指定單元102指定直流幀內預測模式,其中預測的精度對于輸入圖像塊為最高。
然后,選擇器103和107從對應于由幀內預測模式指定單元102指定的幀內預測模式的幀內預測單元104到106中選擇出一個,這樣使得選擇出的預測單元在輸入圖像上進行幀內預測處理。作為結果,可以根據最優(yōu)幀內預測模式生成預測的像素值。另外,如果圖像圖案確定單元101不能確實地確定輸入圖像的圖像圖案并且?guī)瑑阮A測模式指定單元102不能指定最優(yōu)幀內預測模式,或者如果因為其它理由幀內預測單元104到107中沒有一個被選擇器103和107選出,則幀內預測單元609按照原樣輸出該輸入圖像。
如果考慮到在確定圖像圖案的過程中進行Hadamard變換所需的時間,則用于提供預定的延時的諸如存儲器的定時調整單元,可以被加入到選擇器103之前的級中,或者幀內預測單元自身可以進行定時調整,從而對于圖像圖案而確定的圖像能夠在定時上與將進行幀內預測處理的圖像相匹配。
下面參照圖1的方框圖和圖5的流程圖描述根據第一實施例用于選擇一個幀內預測模式的處理順序。圖5的流程圖說明對應于控制程序的處理流程,控制器(未示出)執(zhí)行該控制程序以控制圖1中所示的每個單元。
首先,圖像圖案確定單元101將輸入圖像分割為4×4像素塊,并輸入每個像素塊(步驟S501)。圖像圖案確定單元101然后執(zhí)行Hadamard變換(步驟S502)以確定圖像圖案,如下所述。
圖像圖案確定單元101確定輸入的4×4像素塊是否包括垂直邊(步驟S503)、水平邊(步驟S504)或平面圖像(步驟S505)。
如果圖像圖案確定單元101確定像素塊包括垂直邊(步驟S503的“yes”),則幀內預測模式指定單元102從多個幀內預測模式中指定垂直幀內預測模式,并且選擇器103和107選擇垂直幀內預測單元104(步驟S506)。
如果圖像圖案確定單元101確定像素塊包括水平邊(步驟S503的“no”,以及步驟S504的“yes”),則幀內預測模式指定單元102從多個幀內預測模式中指定水平幀內預測模式,并且選擇器103和107選擇水平幀內預測單元105(步驟S507)。
如果圖像圖案確定單元101確定像素塊包括平面圖像(步驟S503的“no”,步驟S504的“no”,以及步驟S505的“yes”),則幀內預測模式指定單元102從多個幀內預測模式中指定直流幀內預測模式,并且選擇器103和107選擇直流幀內預測單元106(步驟S508)。
如果像素塊不具有上述任一圖像圖案,也就是說,如果圖像圖案確定單元101不能確定任何圖像圖案(步驟S503、S504和S505中均為“no”),則選擇器103和107不從幀內預測單元104到107中選擇出任何一個,而照原樣輸出原來的輸入圖像(步驟S509)。然后,處理流程結束。
另外,如果圖像圖案確定單元101不能確定任何圖像圖案,則選擇器103和107可以配置為可獨立地選擇幀內預測單元104、105或106。
在上述的第一實施例中,垂直幀內預測模式、水平幀內預測模式和直流幀內預測模式用作幀內預測模式以被選擇。然而,也可以以同樣的方式采用上述幀內預測模式以外的幀內預測模式。
另外,在上述的第一實施例中,對垂直邊、水平邊或平面圖像進行確定。然而,也可以確定這些圖案的結合從而選擇出與之相對應的幀內預測模式。
另外,在上述的第一實施例中,對垂直邊、水平邊和平面圖像中的一個進行確定。然而,也可以這樣做確定,即減少將要選擇的幀內預測模式。例如,確定輸入圖像塊不包括任何水平邊(也就是說,輸入圖像塊有可能包括垂直邊或平面圖像)。即使在這種配置中,可以有效地選擇出最優(yōu)的幀內預測模式,并且在圖像編碼裝置600中的計算成本也可以降低。
另外,在上述的第一實施例中,圖像圖案確定單元(Hadamard變換單元)101和幀內預測模式指定單元102包括在圖像編碼裝置600的幀內預測單元609中。然而,圖像圖案確定單元(Hadamard變換單元)101或幀內預測模式指定單元102可以例如位于圖像編碼裝置600以外或幀內預測單元609之外。例如,圖像圖案確定單元101或幀內預測模式指定單元102可以直接接收將提供給圖6中所示的圖像編碼裝置600的輸入圖像數據,以便以與上述方式同樣的方式確定圖像圖案或指定幀內預測模式。
第二實施例本發(fā)明的第二實施例涉及在圖1所示的第一實施例中所述的圖像圖案確定單元101的修改的例子。在第二實施例中,圖像圖案確定單元101被配置為使用對輸入圖像施行濾波的方法確定圖像圖案,而不是使用Hadamard變換方法。除了圖像圖案確定單元101以外的部分的結構和操作與第一實施例中描述的相同,所以這里略去了對它們的描述。
在第二實施例中圖像圖案確定單元(濾波單元)101確定諸如對于一個邊的圖像圖案,該確定處理是通過對每個塊的輸入圖像應用差分濾波器并且估算獲得的邊的強度值的大小完成的。對于使用在圖像圖案確定單元101中的差分濾波器,例如,使用一個算子。該算子是其中存儲有加權值的矩陣。然而,濾波并不限于這種配置。
下面對使用算子的邊檢測方法進行描述。
在使用算子的邊檢測方法中,各個加權值被加入到輸入圖像的目標像素和鄰近像素的像素值上。然后,將目標像素和鄰近像素加權后的像素值加在一起以構成目標像素的邊強度值。設置適當的加權值并估算邊強度值的大小使得可以確定諸如垂直邊、水平邊或平面圖像的圖像圖案。
當如上所述使用圖像圖案確定單元101的配置和操作確定圖像圖案時,圖像圖案的最優(yōu)幀內預測模式可以以與第一實施例中相同的方式的低計算成本被選擇。
第三實施例圖14為表示根據本發(fā)明的第三實施例的圖像編碼裝置1400的配置的方框圖。圖像編碼裝置1400包括減法器601、整數變換單元602、量子化單元603、熵編碼單元604、逆量子化單元605、逆整數變換單元606、加法器607、幀存儲器608和611、環(huán)路濾波器610、幀間預測單元612、移動檢測單元613、開關614和幀內預測單元615。圖像編碼裝置1400被配置為對輸入圖像數據進行編碼處理并輸出編碼后的數據。
下面描述圖14中所示的圖像編碼裝置1400的編碼處理。圖像編碼裝置1400根據H.264標準執(zhí)行編碼處理。另外,圖像編碼裝置1400將輸入圖像數據分割成塊并對每個塊進行處理。
在圖14的方框圖中,與圖6的方框圖中具有相同參考標號(601到608,610到614)的單元具有與圖6中所描述的單元相同的功能和操作。在下面的討論中,為了避免對于圖6中所描述的單元進行重復說明,僅對與圖6中描述不同的點進行描述。
響應于從圖像編碼裝置1400的外部提供的控制信號,在第三實施例中為唯一的幀內預測單元615使用存儲在幀存儲器608中的重建圖像數據進行幀內預測,以生成預測圖像數據。開關614用作選擇單元,為每個宏塊選擇幀內預測和幀間預測中的任一個。也就是說,開關614從幀內預測單元615的輸出和幀間預測單元612的輸出中選擇出一個并將選擇出的預測圖像數據輸出到減法器601和加法器607。
下面參照圖15和16對幀內預測單元615執(zhí)行的幀內預測進行補充描述。
在幀內預測中,之前已經被編碼的鄰近像素的值被用作預測值。如果如圖15中所示用于編碼的目標塊為4×4像素大小(像素a到p),則使用目標塊周圍的像素A到M的像素值進行預測。在這種情況下,預測的方向被指定并且僅有需要的像素值被用作預測。因為提供了九種分別具有不同預測方向和不同內容的幀內預測模式,所以選擇一個最優(yōu)的幀內預測模式用作預測。
圖16表示用在各個幀內預測模式中的各種預測方向。例如,在垂直幀內預測模式(模式0)的情況下,在垂直方向上鄰近目標塊的像素(對應于圖15中所示的像素A、B、C和D)的值被用作預測值,并預測這些像素值在垂直方向上繼續(xù)。因此,預測圖15中所示的每個像素a、e、i和m的值等于像素A的值。同樣,預測每個像素b、f、i和n的值等于像素B的值。同樣的預測也用于后面的像素。在上述預測之后,獲得諸如a-A、e-A、i-A和m-A的各個像素的不同值,并且然后,對獲得的值進行整數變換和量子化等。
除了垂直幀內預測模式(模式0)之外,如圖16中所示提供八種幀內預測模式(模式1到8)。直流幀內預測模式(模式2)是使用較高的和左側像素值的平均值的預測模式。每個幀內預測模式的細節(jié)均在H.264相關的標準等中被披露,所以,這里就略去了進一步的描述。在H.264標準中,如上所述總共有九種幀內預測模式,所以能夠為將進行編碼的目標像素塊選擇出一種最優(yōu)的幀內預測模式。因此,可以改善預測的精度,并且可以使差別圖像數據的值很小。
另外,在幀內預測單元615中選擇最優(yōu)幀內預測模式的通常處理以如圖18的流程圖中所示的順序進行。參照圖18,當開始目標塊的幀內預測時,提供表示幀內預測模式的計數器i并且計數器i被設置為“0”(步驟S1801)。然后,使用由計數器i的值表示的幀內預測模式進行幀內預測(步驟S1802)。估算幀內預測精度,并且與其它之前已經估算的幀內預測模式相比較選擇出指示預測精度最優(yōu)值的幀內預測模式(步驟S1803)。然后,計數器i增加(步驟S1804)。重復從步驟S1802到步驟S1804的順序直至計數器i到達“9”,該數字為幀內預測模式的數量(步驟S1805)。作為結果,對每個將進行編碼的目標塊執(zhí)行所有的九種幀內預測模式。因此,可以選擇出一種最優(yōu)幀內預測模式。
另外,響應提供的控制信號,幀內預測單元615也可以以與上述的通常選擇處理不同的順序進行選擇最優(yōu)幀內預測模式的處理。這個不同的選擇處理將在后面進行描述。
接下來結合與圖像捕捉裝置700的操作相關的幀內預測單元615的進一步操作,描述包括上述圖像編碼裝置1400的圖像捕捉裝置700的配置。
圖7是表示根據第三實施例的圖像捕捉裝置700的配置的方框圖。圖像捕捉裝置700包括攝影鏡頭單元701、圖像傳感器702、照相攝像機信號處理單元703、編碼單元704、照相攝像機控制單元705、焦距檢測單元706、調焦電動機707、變焦電動機708、移動傳感器709和操作單元710。攝影鏡頭單元701由多個包括變焦鏡頭701a和701b以及調焦鏡頭701c的鏡頭組組成。圖像傳感器702為CCD(電荷耦合設備)傳感器、CMOS(互補金屬氧化物半導體)傳感器等。操作單元710對于各種功能是可操作的。圖像捕捉裝置700將由攝影鏡頭單元701形成的光學圖像轉換為圖像信號,并且根據H.264標準在圖像信號上進行壓縮編碼,從而輸出編碼數據。在圖像捕捉裝置700中,編碼單元704對應于上述的圖像編碼裝置1400。這樣,圖像捕捉裝置700包括作為視頻壓縮的H.264編碼器的圖像編碼裝置1400。
下面描述由圖7中所示的圖像捕捉裝置700進行的攝影過程。當開始攝影操作時,由攝影鏡頭單元701形成的光學圖像被圖像傳感器702轉換為電信號。在這種情況下,調焦鏡頭701c可以被調焦電動機707移動以進行調焦,并且變焦鏡頭701a和701b可以被變焦電動機708移動以進行光學變焦的調整。另外,光學圖像穩(wěn)定機構(未示出)或者電子圖像穩(wěn)定功能(未示出)可以根據移動傳感器709提供的移動信息進行操作以便對圖像的移動進行校正(例如,對照相攝像機的顫動進行校正)。
由圖像傳感器702生成的電信號被作為移動圖像信號提供給照相攝像機信號處理單元703。照相攝像機信號處理單元703在移動圖像信號上進行亮度信號處理、彩色信號處理等以生成移動圖像數據。從照相攝像機信號處理單元703輸出的移動圖像數據被提供到編碼單元704。編碼單元704對移動圖像數據進行編碼以輸出編碼數據。在編碼單元704中,進行上述參照圖14所描述的編碼過程。編碼后的數據為一種可以被記錄單元(未示出)記錄在諸如磁盤的記錄介質上的格式。
照相攝像機控制單元705對圖像捕捉裝置700的每個單元的操作進行控制。如果用戶通過操作單元710給出指令,則照相攝像機控制單元705根據指令控制每個單元。
另外,在自動調焦的過程中,焦距檢測單元706根據由圖像傳感器702生成的電信號檢測調焦狀態(tài),并將檢測到的調焦狀態(tài)的信息(調焦信息)發(fā)送到照相攝像機控制單元705。照相攝像機控制單元705根據調焦信息發(fā)送控制信號到調焦電動機707,以便進行焦距調整以獲得最優(yōu)調焦狀態(tài)。在手工調焦的過程中,照相攝像機控制單元705根據從操作單元710提供的指令發(fā)送控制信號到調焦電動機707,以便進行焦距調整以獲得所需的調焦狀態(tài)。
另外,照相攝像機控制單元705根據從操作單元710提供的指令發(fā)送控制信號到變焦電動機708,以便進行用以獲得所需的變焦位置的變焦控制。
移動傳感器709包括加速傳感器等,并且除對照相攝像機的顫抖校正進行檢測之外還可以對圖像捕捉裝置700的移動進行檢測。更具體地,移動傳感器709檢測攝影動作,例如搖攝或俯仰,并且將攝影動作的信息發(fā)送到照相攝像機控制單元705。
當移動傳感器709檢測到搖攝或俯仰時,照相攝像機控制單元705進行控制操作,如下面所述。
圖8說明在攝影操作的過程中進行搖攝動作時獲得的捕捉圖像的情況。如果在圖8中所示的白箭頭(未填充)的方向上對畫面進行搖攝,則所捕捉的圖像在白箭頭方向(水平方向)上表現(xiàn)為整體流動。所以,如果幀內預測在捕捉的圖像上由編碼單元704進行,則可以估計水平方向為最優(yōu)預測方向。在這種情況下,還可以估計,如圖8中所示,各個塊的幀內預測的方向在對應于搖攝方向的規(guī)則方向上對準,而在如圖17中所示的圖像的情況下,畫面上各個塊的幀內預測的方向是不規(guī)則的。所以,選擇水平方向的幀內預測(水平幀內預測模式(模式1))導致有效選擇出的最優(yōu)或近似最優(yōu)的幀內預測模式。如果在垂直方向上俯仰,則應該以類似的方式選擇垂直幀內預測模式(模式0)。另外,如果搖攝或俯仰在斜方向上進行,則應當考慮這種斜分量選擇出一個對角幀內預測模式。
這樣,照相攝像機控制單元705發(fā)送控制信號到包括在編碼單元704(即,圖像編碼裝置1400)中的幀內預測單元615,用以根據諸如搖攝或俯仰的攝影動作選擇出幀內預測模式。另外,響應提供的控制信號,幀內預測單元615進行下面的處理取代前面所述的用以選擇最優(yōu)幀內預測模式的通常處理。也就是說,幀內預測單元615根據搖攝或俯仰的方向唯一地選擇出一個幀內預測模式,或者根據搖攝或俯仰的方向在將九種幀內預測模式減少到兩種或三種幀內預測模式后選擇出一種最優(yōu)幀內預測模式。這樣,可以比試驗性地執(zhí)行所有的幀內預測模式以選擇出一種幀內預測模式的情況更為有效地選擇最優(yōu)幀內預測模式。
圖9是說明根據上述的搖攝或俯仰的方向選擇幀內預測模式的幀內預測單元615的操作順序的流程圖。
如果移動傳感器709沒有檢測到搖攝或俯仰動作(步驟S901的no),則如圖18中所示幀內預測單元615進行用于選擇最優(yōu)幀內預測模式的通常處理,并且使用選擇出的幀內預測模式進行幀內預測(步驟S907)。另一方面,如果移動傳感器709檢測到關于將要進行幀內預測的圖像的搖攝或俯仰(步驟S901中的yes),則幀內預測單元615從照相攝像機控制單元705獲得所檢測到的搖攝或俯仰動作的方向或速度的信息(步驟S902)。
根據在步驟S902獲得的搖攝或俯仰的方向或速度的信息,幀內預測單元615近似相應于搖攝或俯仰的方向自動選擇出預測方向(步驟S903)。如果在步驟S903選擇出垂直方向,則幀內預測單元615使用垂直幀內預測模式(模式0)進行幀內預測(步驟S904)。如果在步驟S903選擇出水平方向,則幀內預測單元615使用水平幀內預測模式(模式1)進行幀內預測(步驟S905)。如果在步驟S903選擇出對角下-右方向,則幀內預測單元615使用下-右?guī)瑑阮A測模式(模式4)進行幀內預測(步驟S906)。
至于在對角方向上的預測,可以提高移動傳感器709的方向精度以便也可以選擇其它的對角幀內預測模式(模式3、5、6、7、8)。這樣,預測的精度就可以進一步提高。
另外,在圖9中所示的順序的情況下,當進行搖攝和俯仰時,幀內預測單元615根據搖攝或俯仰的方向選擇幀內預測模式。然而,幀內預測單元615可以配置為通過根據搖攝或俯仰的方向或速度將九種幀內預測模式減少到二種或三種幀內預測模式或通過排除確定為在預測方向上明顯不合適的幀內預測模式,從而減少幀內預測模式的選項,并且然后,通過從余下的選項中進行計算獲得最優(yōu)幀內預測模式。
根據上述的第三實施例,諸如搖攝或俯仰的攝影動作的信息用來選擇幀內預測模式。因此,可以容易地選擇出最優(yōu)的幀內預測模式,并且可以減少編碼上的處理負擔。
第四實施例下面參照圖10和圖11對本發(fā)明的第四實施例進行說明。
在第四實施例中,當在第三實施例中所描述的圖像捕捉裝置700進行變焦動作時,照相攝像機控制單元705和幀內預測單元615進行下面的操作。
當在攝影操作期間進行推鏡頭或拉鏡頭的變焦動作時,在變焦期間獲得的捕捉圖像在從畫面中心的射線方向上以流動的方式顯示。所以,當編碼單元704在捕捉的圖像上進行幀內預測時,應當考慮到將要進行編碼的目標塊位于相對于畫面的中心的哪個方向上。如果進行對應于該方向的幀內預測,則可以提高預測的效果。
在這種情況下,可以估算,變焦導致圖10的各個塊中所示的幀內預測的方向,而在圖17中所示的圖像的情況下,畫面上各個塊的幀內預測的方向是不規(guī)則的。更具體的,在圖10中的畫面上的較高的左側塊中,因為圖像在對角方向上流向畫面的中心,所以認為下-右?guī)瑑阮A測模式(模式4)是最優(yōu)的。同樣的,在畫面上的較高的右側方塊中,認為下-左幀內預測模式(模式3)是最優(yōu)的。在H.264標準的幀內預測的情況下,用于幀內預測的預測采樣限于位于目標方塊的上面或左側的鄰近方塊的值。因此,在畫面上的較低左側方塊中,認為下-左幀內預測模式(模式3)是最優(yōu)的。類似的,在畫面上的較低右側方塊中,認為下-右?guī)瑑阮A測模式(模式4)是最優(yōu)的。
這樣,照相攝像機控制單元705發(fā)送控制信號到包括在編碼單元704(即,圖像編碼裝置1400)中的幀內預測單元615,以便根據變焦動作選擇出一個幀內預測模式。另外,響應于提供的控制信號,幀內預測單元615在變焦期間獲得的圖像上進行下面的處理,取代上述的用于選擇最優(yōu)幀內預測模式的通常處理。也就是說,幀內預測單元615根據將要進行編碼的目標方塊的位置唯一地選擇出一種幀內預測模式,或者根據所述目標方塊的位置在將九種幀內預測模式減少到兩種或三種幀內預測模式后選擇出最優(yōu)幀內預測模式。這樣,能夠比試驗性地執(zhí)行所有的幀內預測模式以選擇最優(yōu)預測模式的情況更為有效地選擇最優(yōu)幀內預測模式。
圖11為說明用于選擇出關于如上面所述在變焦期間獲得的圖像的幀內預測模式的幀內預測單元615的操作順序的流程圖。
至于將要進行幀內預測的圖像,如果沒有進行變焦動作(或如果進行了特別低速的變焦動作)(步驟S1101中的no),則幀內預測單元615進行如圖18中所示的用于選擇最優(yōu)幀內預測模式的通常處理,并且使用選擇出的幀內預測模式進行幀內預測(步驟S1106)。另一方面,如果響應來自操作單元710的變焦指令進行變焦動作以移動變焦鏡頭701a和701b(步驟S1101中的yes),則幀內預測單元615從照相攝像機控制單元705獲得指示變焦正在進行的信息和變焦速度的信息(步驟S1102)。
在步驟S1102獲得指示變焦正在進行的信息和變焦速度的信息后,幀內預測單元615在畫面上確定將要進行編碼的目標塊所在的區(qū)域,并且相應于確定的區(qū)域自動選擇出一個預測方向(步驟S1103)。更具體地,如果目標塊位于畫面上的較高左側區(qū)域或較低右側區(qū)域,則幀內預測單元615選擇下-右?guī)瑑阮A測模式(模式4)。如果目標塊位于較高右側區(qū)域或較低左側區(qū)域,則幀內預測單元615選擇下-左幀內預測模式(模式3)。如果目標塊位于中心區(qū)域或其周圍,則幀內預測單元615不能指定幀內預測模式。所以,幀內預測單元615進行用以選擇最優(yōu)幀內預測模式的通常處理并使用選擇出的幀內預測模式進行幀內預測(步驟S1106)。如果在步驟S1103中選擇下-左幀內預測模式(模式3),則幀內預測單元615使用下-左幀內預測模式(模式3)進行幀內預測(步驟S1104)。如果在步驟S1103選擇下-右?guī)瑑阮A測模式(模式4),則幀內預測單元615使用下-右?guī)瑑阮A測模式(模式4)進行幀內預測(步驟S1105)。
另外,如果將畫面細致地分為多個區(qū)域并對獲得的區(qū)域進行分類,則可以更為有效地進行最優(yōu)幀內預測模式的選擇。例如,如果目標塊位于畫面中心的正上方或正下方,則幀內預測單元615選擇垂直幀內預測模式(模式0)。如果目標塊位于畫面中心的左側或右側,則幀內預測單元615選擇水平幀內預測模式(模式1)。另外,如果將畫面更細地分割成多個區(qū)域使得其它的對角幀內預測模式(模式5、6、7、8)也被選擇,則可以進一步提高預測的精度。
另外,在圖11中所示的順序的情況下,當進行變焦時,幀內預測單元615根據將進行編碼的目標塊的位置選擇幀內預測模式,除非當目標塊位于中心區(qū)域或其周圍。然而,幀內預測單元615也可以配置成通過將九種幀內預測模式減少到二種或三種幀內預測模式或通過排除確定為在預測方向上明顯不合適的幀內預測模式從而減少幀內預測模式的選擇,并且之后,從余下的選擇中通過計算獲得最優(yōu)幀內預測模式。
根據上述的第四實施例,諸如變焦的攝影動作信息用來選擇幀內預測模式。因此,可以容易地選擇出最優(yōu)幀內預測模式并且也可以減少編碼上的處理負擔。
第五實施例下面參照圖12和13對本發(fā)明的第五實施例進行描述。
在第五實施例中,當第三實施例中描述的圖像捕捉裝置700進行調焦動作時,照相攝像機控制單元705和幀內預測單元615如下面所述進行工作。
當在攝影操作期間進行調焦動作時,并且當沒有獲得焦點對準狀態(tài)時,捕捉的圖像的整個畫面是模糊的。因此,當編碼單元704在模糊的捕捉圖像上進行幀內預測時,不能估算預測的具體方向,并且使用像素值均值的直流幀內預測模式被認為是提高預測效率的最優(yōu)幀內預測模式。
在這種情況下,可以估算,捕捉圖像的模糊狀態(tài)導致如圖12中所示的整個畫面的直流預測情況,而在圖17中所示在焦點對準狀態(tài)的情況下,畫面上的各個方塊的幀內預測的方向是不規(guī)則的。
這樣,照相攝像機控制單元705發(fā)送控制信號到包括在編碼單元704(即,圖像編碼裝置1400)中的幀內預測單元615用以根據調焦狀態(tài)選擇幀內預測模式。另外,響應提供的控制信號,幀內預測單元615為模糊的捕捉圖像唯一地選擇直流幀內預測模式,取代為選擇最優(yōu)幀內預測模式而進行上述的通常處理。這樣,可以比試驗性地執(zhí)行所有的幀內預測模式從而選擇幀內預測模式的情況更為有效地選擇最優(yōu)幀內預測模式。
圖13是說明用于選擇關于上述模糊的圖像的幀內預測模式的幀內預測單元615的操作順序的流程圖,特別地關于在焦點未對準的狀態(tài)下捕捉的圖像。
幀內預測單元615從照相攝像機控制單元705獲得指示著將要進行幀內預測的圖像是在焦點對準狀態(tài)還是在焦點未對準狀態(tài)下被捕獲的調焦信息(步驟S1301)。在步驟S1302,如果從所述調焦信息確定圖像在焦點對準狀態(tài)下被捕捉,則幀內預測單元615為選擇最優(yōu)幀內預測模式執(zhí)行圖18中所示的通常處理,并且使用選擇的幀內預測模式進行幀內預測(步驟S1304)。
在步驟S1302,如果從所述的調焦信息確定出圖像已經在焦點未對準狀態(tài)下被捕捉,即圖像是模糊的,則幀內預測單元615自動地選擇直流幀內預測模式并且使用直流幀內預測模式(模式2)進行幀內預測(步驟S1303)。
根據上述的第五實施例,諸如調焦的攝影動作信息用來選擇幀內預測模式。因此,可以容易地選擇最優(yōu)幀內預測模式并且還可以減少編碼上的處理負擔。
第三實施例至第五實施例中所述的操作順序可以獨立地進行或可以結合起來進行。如果這些操作結合起來進行,則可以響應各種攝影條件有效地選擇最優(yōu)幀內預測模式并且也可以減少編碼上的處理負擔。
每個實施例也可以通過提供帶有存儲介質的系統(tǒng)或裝置實現(xiàn),該存儲介質中存儲有用來實現(xiàn)上述實施例的功能的程序代碼(軟件),該程序代碼促使該系統(tǒng)或裝置的計算機(或CPU(中央處理單元)、MPU(微處理單元)等)從存儲介質讀取程序代碼并且然后執(zhí)行該程序代碼。在這種情況下,從存儲介質讀出的程序代碼本身實現(xiàn)所述實施例的功能。另外,除了執(zhí)行由計算機讀取的程序代碼以實現(xiàn)上述實施例的功能,本發(fā)明包括在根據程序代碼的指令完整地或部分地進行實際處理以便實現(xiàn)上述實施例的功能的計算機上運行的操作系統(tǒng)(OS)等。存儲程序代碼的存儲介質的例子包括軟盤、硬盤、ROM(只讀存儲器)、RAM(隨機存取存儲器)、磁帶、非易失性存儲卡、CD-ROM(壓縮盤-只讀存儲器)、CD-R(壓縮可記錄盤)、DVD(數字多用盤)、藍光光盤、光盤、MO(磁光盤)等。
另外,本發(fā)明也包括包含在插入到計算機中的功能擴展卡或連接到計算機上的功能擴展單元中的CPU等,所述的功能擴展卡或功能擴展單元具有在其上寫有從存儲介質讀取的程序代碼的內存,所述的CPU等根據程序代碼的指令完整地或部分地進行實際處理以便實現(xiàn)上述實施例的功能。
如果本發(fā)明應用到上述的存儲介質中,則對應于上述流程圖的程序代碼存儲在該存儲介質中。
雖然本發(fā)明參照示例的實施例進行描述,但是應當理解本發(fā)明并不限于所披露的實施例。相反,本發(fā)明意在覆蓋包括在所附的權利要求的精神和范圍中的各種修改和等效配置。下面的權利要求的范圍與最寬的解釋相一致以便包括所有的這種修改和等同的結構和功能。
權利要求
1.一種圖像編碼裝置,包括輸入單元,配置成輸入圖像數據;分割單元,配置成通過將由所述輸入單元輸入的圖像數據分割為分別具有多個像素的塊來生成塊;確定單元,配置成確定由所述分割單元生成的各個塊中的圖像數據的圖像圖案;選擇單元,配置成根據由所述確定單元確定的圖像圖案從多個預測模式中選擇出一個預測模式;以及處理單元,配置成根據由所述選擇單元選擇的預測模式通過使用同一幅畫面中的像素值執(zhí)行畫面中像素值的預測處理,輸出預測的像素值。
2.根據權利要求1的圖像編碼裝置,其中所述確定單元配置為從垂直邊、水平邊和平面圖像中確定至少一個作為將要確定的圖像圖案的類型。
3.根據權利要求2的圖像編碼裝置,其中所述選擇單元配置為根據由所述確定單元確定的圖像圖案的類型選擇不同的預測模式。
4.根據權利要求1的圖像編碼裝置,其中所述確定單元配置為通過在由所述分割單元生成的各個塊中的圖像數據上進行正交變換從而確定圖像圖案。
5.根據權利要求1的圖像編碼裝置,其中所述確定單元配置為通過在由所述分割單元生成的各個塊中的圖像數據上執(zhí)行濾波操作從而確定圖像圖案。
6.根據權利要求1的圖像編碼裝置,其中所述確定單元配置為通過在由所述分割單元生成的各個塊中的圖像數據上執(zhí)行Hadamard變換從而確定圖像圖案。
7.根據權利要求6的圖像編碼裝置,其中所述選擇單元配置為從下述處理中選擇一個,即,當指示低垂直空間頻率的Hadamard變換系數為大數值時選擇垂直預測模式的處理,當指示低水平空間頻率的Hadamard變換系數為大數值時選擇水平預測模式的處理,以及當指示交流分量的Hadamard變換系數為小數值時選擇使得所有像素具有相同值的預測模式的處理。
8.一種圖像編碼方法,包括以下步驟輸入圖像數據;將所述輸入的圖像數據分割為分別具有多個像素的塊;確定各個塊中的圖像數據的圖像圖案;根據所確定的圖像圖案從多個預測模式中選擇出一個預測模式;以及根據所選擇的預測模式通過使用同一幅畫面中的像素值執(zhí)行預測畫面中像素值的處理,輸出預測的像素值。
9.一種圖像編碼裝置,包括輸入單元,配置為輸入將進行編碼的圖像數據;獲取單元,配置為獲得關于所述圖像數據的攝影信息;選擇單元,配置為使用所述的攝影信息從n個預測模式中選擇出m個預測模式,其中1≤m≤n;以及處理單元,配置為根據由所述選擇單元選擇的m個預測模式通過使用同一幅畫面中的像素值執(zhí)行對畫面中的像素值的預測的處理,輸出預測的像素值。
10.根據權利要求9的圖像編碼裝置,其中所述獲取單元配置為獲取所述圖像數據被捕捉的攝影條件的信息。
11.根據權利要求10的圖像編碼裝置,其中所述攝影條件的信息至少包括由加速傳感器獲得的信息、變焦動作的信息和調焦動作的信息中的一種信息。
12.根據權利要求10的圖像編碼裝置,其中所述攝影條件的信息包括指示所述圖像數據至少在搖攝、俯仰、變焦和影像模糊條件中的一個條件下被捕捉的信息。
13.根據權利要求9的圖像編碼裝置,其中所述獲取單元配置為獲取當所述圖像數據被捕捉時所選擇的拍攝方向的移動信息,并且所述選擇單元配置為使用拍攝方向的移動信息選擇指示與移動方向相關的預測方向的預測模式。
14.根據權利要求9的圖像編碼裝置,其中所述獲取單元配置為獲得當已經捕捉所述圖像數據時所執(zhí)行的變焦的信息,并且所述選擇單元配置為當所述圖像數據表示在變焦時所捕捉的圖像時使用變焦的信息選擇預先確定的預測模式。
15.根據權利要求14的圖像編碼裝置,其中,當所述圖像數據表示變焦期間所捕捉的圖像時,所述選擇單元配置為將畫面分割為多個區(qū)域,并選擇出在每個區(qū)域中采用了同一預測方向的預測模式。
16.根據權利要求9的圖像編碼裝置,其中所述的獲取單元配置為獲得當已經捕捉所述圖像數據時所執(zhí)行的調焦的信息,并且所述選擇單元配置為當所述圖像數據表示在焦點未對準狀態(tài)下捕捉的圖像時使用調焦信息選擇預先確定的預測模式。
17.根據權利要求9的圖像編碼裝置,還包括攝影單元,配置成將通過執(zhí)行攝影操作獲得的圖像數據提供給所述輸入單元;以及攝影信息生成單元,配置成在所述攝影單元執(zhí)行攝影操作的同時生成攝影信息,并將攝影信息提供給所述的獲取單元。
18.根據權利要求17的圖像編碼裝置,其中所述攝影信息生成單元配置為使用從檢測所述攝影單元移動的傳感器輸出的信息生成攝影信息,并且,根據該攝影信息,所述選擇單元配置為當所述圖像數據表示用正在移動的攝影單元捕捉的圖像時選擇表示與所述攝影單元的移動方向相關的預測方向的預測模式。
19.根據權利要求17的圖像編碼裝置,其中,所述攝影信息生成單元配置為根據在所述攝影單元中控制變焦動作的信息生成攝影信息,并且,根據該攝影信息,所述選擇單元配置為當所述圖像數據表示在變焦動作期間所捕捉的圖像時選擇預先確定的預測模式。
20.根據權利要求17的圖像編碼裝置,其中,所述攝影信息生成單元配置為根據在所述攝影單元中控制調焦動作的信息生成攝影信息,并且,根據該攝影信息,所述選擇單元配置為當所述圖像數據表示在焦點未對準狀態(tài)下捕捉的圖像時選擇預先確定的預測模式。
21.一種圖像編碼步驟,包括輸入將要編碼的圖像數據;獲取關于所述圖像數據的攝影信息;使用所述攝影信息從n個預測模式中選擇m個預測模式,其中1≤m≤n;以及根據所選擇的m個預測模式通過使用同一幅畫面中的像素值進行預測畫面中的像素值的處理,輸出預測的像素值。
全文摘要
一種圖像編碼裝置,確定圖像數據的圖像圖案,并且根據確定的圖像圖案,通過使用同一幀中的像素值對幀中的像素值進行預測從而選擇出一個用于產生預測的像素值的預測模式。可替代地,根據關于輸入的圖像數據的攝影信息,圖像編碼裝置通過使用同一幀中的像素值對幀中的像素值進行預測從而選擇出一個用于生成預測的像素值的預測模式。
文檔編號H04N7/32GK1710962SQ200510077208
公開日2005年12月21日 申請日期2005年6月16日 優(yōu)先權日2004年6月17日
發(fā)明者小林悟, 牧野純 申請人:佳能株式會社