亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

以語(yǔ)音特征為基礎(chǔ)的精采片段檢測(cè)電路及其相關(guān)方法

文檔序號(hào):7621698閱讀:240來源:國(guó)知局
專利名稱:以語(yǔ)音特征為基礎(chǔ)的精采片段檢測(cè)電路及其相關(guān)方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種視訊內(nèi)容檢測(cè)技術(shù),特別是涉及一種利用一語(yǔ)音信號(hào)進(jìn)行視訊精采片段檢測(cè)的精采片段檢測(cè)電路及其相關(guān)方法。
背景技術(shù)
當(dāng)一個(gè)收視者在觀賞一視訊節(jié)目,而該視訊節(jié)目的內(nèi)容除了小部分分散的片段(video clips)的外,該收視者對(duì)大部分片段的內(nèi)容并不感興趣,此時(shí)如果能夠擷取該收視者感興趣的片段(highlight)而濾掉其感覺無趣的內(nèi)容將可使該收視者不用為了小部分的內(nèi)容而必須完整地看完整個(gè)視訊節(jié)目,如此一來,該收視者也可花更多的時(shí)間在只觀看其感覺有趣的節(jié)目?jī)?nèi)容上。舉例來說,一個(gè)棒球比賽進(jìn)行的期間,觀眾大部分的時(shí)間都在等待,當(dāng)一打擊者出局時(shí),觀眾需等待該打擊者走下場(chǎng)、等待下一位打擊者走上場(chǎng)準(zhǔn)備打擊以及等待捕手打暗號(hào)告訴投手下一球要投什么球,此外,當(dāng)兩隊(duì)攻、守互換時(shí),觀眾亦必須等待一段時(shí)間,然而,全壘打、得分、雙殺守備等精采片段只是少量地分散在一場(chǎng)冗長(zhǎng)的棒球比賽之中。對(duì)于一個(gè)棒球迷或是一個(gè)固定的收視者而言,其很難總是有足夠的時(shí)間坐在電視前面觀看完整場(chǎng)比賽,此時(shí),球賽精采片段檢測(cè)即能幫該棒球迷或該固定收視者擷取比賽中的精采時(shí)刻并略過無聊的片段。
有一些現(xiàn)有的方法可以處理這種精采片段的檢測(cè)問題,這些方法利用一個(gè)機(jī)率模型架構(gòu)來處理這種檢測(cè)問題,而且還需要一訓(xùn)練數(shù)據(jù)(trainingdata)來估計(jì)此一機(jī)率模型架構(gòu)的一些參數(shù),此種現(xiàn)有方法的運(yùn)算復(fù)雜度較高以及執(zhí)行速度緩慢,因此導(dǎo)致此種現(xiàn)有方法難以實(shí)現(xiàn)在一嵌入式系統(tǒng)(embedded system)之中。

發(fā)明內(nèi)容
因此,本發(fā)明的目的之一在于提供一種利用一語(yǔ)音信號(hào)進(jìn)行視訊精采片段檢測(cè)以決定一精采片段的精采片段檢測(cè)電路及其相關(guān)方法,以解決上述問題。
依據(jù)本發(fā)明的實(shí)施例,其披露了一精采片段檢測(cè)電路,用來檢測(cè)一視訊信號(hào)中的一精采片段(highlight)。該精采片段檢測(cè)電路包含有一音調(diào)追蹤(pitch tracking)模塊、一音調(diào)差異(pitch difference)檢測(cè)模塊以及一精采片段檢測(cè)模塊。該音調(diào)追蹤模塊用來估計(jì)一語(yǔ)音信號(hào)的多個(gè)音調(diào)值,該音調(diào)差異檢測(cè)模塊耦接至該音調(diào)追蹤模塊,用來依據(jù)該多個(gè)音調(diào)值以計(jì)算出多個(gè)音調(diào)差異值,而該精采片段檢測(cè)模塊耦接至該音調(diào)差異檢測(cè)模塊,用來依據(jù)該多個(gè)音調(diào)差異值以決定該精采片段的一起始點(diǎn)和一截止點(diǎn)。該視訊信號(hào)對(duì)應(yīng)于一信號(hào)源的一影像部分,而該語(yǔ)音信號(hào)對(duì)應(yīng)于該信號(hào)源的一語(yǔ)音部分。
依據(jù)本發(fā)明的實(shí)施例,其還披露了一種用來檢測(cè)一視訊信號(hào)中的一精采片段的方法。該方法包含有估計(jì)一語(yǔ)音信號(hào)的多個(gè)音調(diào)值;依據(jù)該多個(gè)音調(diào)值,計(jì)算出多個(gè)音調(diào)差異值;以及依據(jù)該多個(gè)音調(diào)差異值,決定該精采片段的一起始點(diǎn)和一截止點(diǎn)。該視訊信號(hào)對(duì)應(yīng)于一信號(hào)源的一影像部分,而該語(yǔ)音信號(hào)對(duì)應(yīng)于該信號(hào)源的一語(yǔ)音部分。


圖1為本發(fā)明精采片段檢測(cè)電路的一實(shí)施例的功能方塊示意圖。
圖2為圖1所示的音調(diào)平滑器的操作示意圖。
附圖符號(hào)說明100 精采片段檢測(cè)電路110 取樣電路120 音調(diào)追蹤模塊130 音調(diào)平滑器140 音調(diào)差異檢測(cè)模塊150 調(diào)制器160 精采片段檢測(cè)模塊170 精采片段微調(diào)模塊
具體實(shí)施例方式
請(qǐng)參考圖1,圖1為本發(fā)明精采片段檢測(cè)電路100的一實(shí)施例的功能方塊示意圖。如圖1所示,精采片段檢測(cè)電路100包含有一取樣電路110、一音調(diào)追蹤(pitch tracking)模塊120、一音調(diào)平滑器(pitch smoother)130、一音調(diào)差異(pitch difference)檢測(cè)模塊140、一調(diào)制器150、一精采片段(higlight)檢測(cè)模塊160以及一精采片段微調(diào)模塊170。取樣電路110縮減取樣(down-sampling)一語(yǔ)音信號(hào)至一適當(dāng)?shù)娜勇?例如,8000Hz),然后輸出一縮減取樣語(yǔ)音信號(hào)到音調(diào)追蹤模塊120以產(chǎn)生多個(gè)音調(diào)值。此一實(shí)施例中,該語(yǔ)音信號(hào)為一數(shù)字電視信號(hào)所傳輸?shù)囊话羟虮荣惖恼Z(yǔ)音部分,而此一實(shí)施例中的視訊信號(hào)為該數(shù)字電視信號(hào)所傳輸?shù)脑摪羟虮荣惖囊曈嵅糠郑送?,由音調(diào)追蹤模塊120所輸出的所述音調(diào)值代表該棒球比賽期間中一播報(bào)員的聲音,而該播報(bào)員的聲音是后續(xù)檢測(cè)該視訊信號(hào)中一精采片段的信號(hào)處理的基礎(chǔ)。
所述音調(diào)值接著饋入音調(diào)平滑器130,而音調(diào)平滑器130為減低由人群所產(chǎn)生的噪音噪聲(背景噪音,background noise)并輸出多個(gè)處理后音調(diào)值到音調(diào)差異檢測(cè)模塊140和調(diào)制器150,音調(diào)差異檢測(cè)模塊140依據(jù)該處理后音調(diào)值計(jì)算出多個(gè)音調(diào)差異值,然后把所述音調(diào)差異值輸出到調(diào)制器150,調(diào)制器150于收到所述音調(diào)差異值和所述處理后音調(diào)值后,運(yùn)用乘法運(yùn)算的方式來調(diào)制所述音調(diào)差異值和所述處理后音調(diào)值,以產(chǎn)生多個(gè)調(diào)制后音調(diào)差異值。接著,精采片段檢測(cè)模塊160便依據(jù)該調(diào)制后音調(diào)差異值粗估該視訊信號(hào)中一精采片段的起始點(diǎn)和截止點(diǎn),最后,精采片段微調(diào)模塊170對(duì)該視訊信號(hào)進(jìn)行一分鏡檢測(cè)(shot detection)運(yùn)算以提前該起始點(diǎn)來產(chǎn)生一更新后起始點(diǎn),以及延遲該截止點(diǎn)來產(chǎn)生一更新后截止點(diǎn)。
音調(diào)追蹤模塊120的操作詳細(xì)敘述如下。假設(shè)取樣率為8000Hz,則對(duì)于包含有1024個(gè)取樣點(diǎn)(即128ms)的每一個(gè)滑動(dòng)窗口(sliding window)而言,取其滑動(dòng)窗口跳躍長(zhǎng)度(step size)為400個(gè)取樣點(diǎn)(即50ms),音調(diào)追蹤模塊120利用現(xiàn)有的傅里葉轉(zhuǎn)換(Fourier transform)處理對(duì)應(yīng)每一個(gè)滑動(dòng)窗口的數(shù)據(jù),然后以現(xiàn)有的調(diào)和乘積譜(harmonic product spectrum)算法來估計(jì)上述的所述音調(diào)值,也就是說音調(diào)追蹤模塊120每秒產(chǎn)生20個(gè)音調(diào)值。有關(guān)傅里葉轉(zhuǎn)換以及調(diào)和乘積譜算法的運(yùn)作與實(shí)施方式是本領(lǐng)域的技術(shù)人員所熟知的,故不予贅述。于此輸出的所述音調(diào)值是該播報(bào)員的聲音(此后的說明中,該播報(bào)員的聲音亦被稱為真實(shí)音調(diào)(real pitch))的估計(jì)值,然而,有時(shí)候由調(diào)和乘積譜算法所估計(jì)出的真實(shí)音調(diào)實(shí)際上并非是一真正的真實(shí)音調(diào),而是頻率為該真正真實(shí)音調(diào)的2倍的諧波,所以音調(diào)追蹤模塊120會(huì)檢查是否存在一音調(diào)值,其頻率為所估計(jì)出的真實(shí)音調(diào)的頻率的一半,且該音調(diào)值的一強(qiáng)度值為該估計(jì)出的真實(shí)音調(diào)的強(qiáng)度值的某一程度以上(例如,50%以上),若上述判斷結(jié)果為真,則音調(diào)追蹤模塊120會(huì)把該估計(jì)出的真實(shí)音調(diào)以該音調(diào)值來加以取代,亦即以該音調(diào)值來做為音調(diào)追蹤模塊120的輸出,此外,若音調(diào)追蹤模塊120的輸出值太小時(shí),音調(diào)追蹤模塊120會(huì)將其輸出值以0取代。請(qǐng)注意,調(diào)和乘積譜算法僅為音調(diào)追蹤方法的一個(gè)例子,任何能夠追蹤一音調(diào)的運(yùn)算,例如一自相關(guān)(autocorrelation)運(yùn)算,都可以被應(yīng)用在本發(fā)明中。
請(qǐng)參考圖2,圖2為圖1所示的音調(diào)平滑器130的操作示意圖。實(shí)際上,在這一級(jí)所接收到的所述音調(diào)值充斥著群眾的大量噪音噪聲,此外,該播報(bào)員的聲音在字與字之間也充滿著許多不存在音調(diào)值的安靜期間(silenceperiod),因此,音調(diào)平滑器130首先會(huì)檢查在一特定窗口(例如,一個(gè)1秒鐘窗口(1-sec window))內(nèi)多個(gè)音調(diào)值來宏觀地檢測(cè)所述音調(diào)值是否大于一第一臨界值(例如,10Hz),在本實(shí)施例中,若在該特定窗口內(nèi)的所述音調(diào)值中高于該第一臨界值的音調(diào)值數(shù)量的百分比大于一第二臨界值(例如,50%),則音調(diào)平滑器130便平均該特定窗口內(nèi)大于該第一臨界值的多個(gè)音調(diào)值以產(chǎn)生對(duì)應(yīng)該特定窗口的一平均后音調(diào)值;反之,若在該特定窗口內(nèi)的所述音調(diào)值中大于該第一臨界值的音調(diào)值數(shù)量的百分比未到達(dá)上述第二臨界值,則音調(diào)平滑器130便將對(duì)應(yīng)該特定窗口的該平均后音調(diào)值設(shè)定為一默認(rèn)值(例如,0)。然后,該1秒鐘窗口向前滑動(dòng)一個(gè)取樣點(diǎn),而該音調(diào)平滑器130重復(fù)上述的程序以產(chǎn)生下一個(gè)平均后音調(diào)值。
為了加強(qiáng)所述音調(diào)值的急劇音調(diào)改變,音調(diào)差異檢測(cè)模塊140首先決定對(duì)應(yīng)一特定平均后音調(diào)值的特定音調(diào)差異值,其步驟如下首先加總該特定平均后音調(diào)值之前的多個(gè)平均后音調(diào)值以產(chǎn)生一第一加總值(例如,100個(gè)平均后音調(diào)值,其對(duì)應(yīng)于一5秒鐘窗口(5-sec window)),然后再加總該特定平均后音調(diào)值之后的多個(gè)平均后音調(diào)值以產(chǎn)生一第二加總值(例如,100個(gè)平均后音調(diào)值,其對(duì)應(yīng)于一5秒鐘窗口),最后將該特定音調(diào)差異值設(shè)定為該第二加總值減去該第一加總值的差。該音調(diào)差異值接著饋入調(diào)制器150,而調(diào)制器150把對(duì)應(yīng)一特定平均后音調(diào)值的特定音調(diào)差異值乘上該特定平均后音調(diào)值以產(chǎn)生一調(diào)制后音調(diào)差異值。至此,該播報(bào)員聲音中多個(gè)急劇音調(diào)改變的輪廓(contour)已完成追蹤,并且以該調(diào)制后音調(diào)差異值中多個(gè)波峰和波谷來加以表示。
精采片段檢測(cè)模塊160用來決定該調(diào)制后音調(diào)差異值中的多個(gè)波峰,每一波峰代表含有急劇音調(diào)改變的一精采片段的起始點(diǎn),在本實(shí)施例中,當(dāng)一精采事件發(fā)生時(shí),由于播報(bào)員會(huì)改變其聲音語(yǔ)調(diào)以表達(dá)其情緒,因此便會(huì)發(fā)出一較高的音調(diào),此外該播報(bào)員的說話速度也會(huì)變快,因此造成較密集的音調(diào)分布,而該較高的音調(diào)和較密集的音調(diào)分布皆會(huì)影響該調(diào)制后音調(diào)差異值。精采片段檢測(cè)模塊160首先由該調(diào)制后音調(diào)差異值中選出一波峰來做為一精采片段的起始點(diǎn)SP’,然后在該峰值之后的一段期間內(nèi)(例如,5~20秒),精采片段檢測(cè)模塊160再由該調(diào)制后音調(diào)差異值中選出一波谷做為該精采片段的截止點(diǎn)EP’,請(qǐng)注意選擇一波峰或一波谷來做為一精采片段的起始點(diǎn)是由該音調(diào)差異值如何定義所決定,如上所述,一音調(diào)差異值定義為一第二加總值減去一第一加總值的差,因此,在本實(shí)施例中,應(yīng)該選擇一波峰來做為一起始點(diǎn),而選擇一波谷來做為一截止點(diǎn);相反地,若一音調(diào)差異值定義為一第一加總值減去一第二加總值的差,則應(yīng)選擇一波谷來做為一起始點(diǎn),而選擇一波峰來做為一截止點(diǎn)。
由起始點(diǎn)SP’和截止點(diǎn)EP’所決定出來的該精采片段是由精采片段檢測(cè)模塊160所粗略地估計(jì)出來的,但是該精采片段并不是對(duì)應(yīng)至一個(gè)完整的事件,亦即,由精采片段檢測(cè)模塊160所粗略地檢測(cè)出來的起始點(diǎn)SP’可能是在該精采片段真正的發(fā)生時(shí)間后的一時(shí)間點(diǎn)(因?yàn)椴?bào)員的聲音變化發(fā)生在一精采片段發(fā)生之后),此外,粗略決定的截止點(diǎn)EP’可能使得該精采片段的結(jié)尾無法平順地結(jié)束。因此,精采片段微調(diào)模塊170依據(jù)精采片段檢測(cè)模塊160所決定的起始點(diǎn)SP’和截止點(diǎn)EP’進(jìn)行現(xiàn)有的分鏡檢測(cè)運(yùn)算,以進(jìn)一步微調(diào)起始點(diǎn)SP’和截止點(diǎn)EP’,該分鏡檢測(cè)操作于該精采片段的起始點(diǎn)SP’之前一時(shí)段內(nèi)(例如,3~20秒),在該時(shí)段內(nèi)具有一最大分鏡改變(shotchange)的時(shí)間點(diǎn)將被選擇為該精采片段的一新起始點(diǎn)SP;同樣地,該分鏡檢測(cè)亦會(huì)操作于該精采片段的截止點(diǎn)SP’之后的一時(shí)段內(nèi)(例如,1~10秒),在該時(shí)段內(nèi)具有一最大分鏡改變的時(shí)間點(diǎn)將被選擇為該精采片段的一新截止點(diǎn)EP,因此,一微調(diào)后精采片段便可以由新起始點(diǎn)SP和新截止點(diǎn)EP而決定出來。請(qǐng)注意,精采片段微調(diào)模塊170利用分鏡檢測(cè)運(yùn)算來微調(diào)起始點(diǎn)SP’和截止點(diǎn)EP’僅是實(shí)施上的一個(gè)選擇,任何其它可用于微調(diào)起始點(diǎn)SP’和截止點(diǎn)EP’的運(yùn)算或算法皆可被精采片段微調(diào)模塊170采用以替代上述分鏡檢測(cè)運(yùn)算的功能,此外,因?yàn)楸景l(fā)明應(yīng)用于擷取一視訊節(jié)目的精采片段,所以特別適合于至少有一播報(bào)員在對(duì)節(jié)目?jī)?nèi)容進(jìn)行評(píng)論的視訊節(jié)目,但是本發(fā)明并不以此類的節(jié)目為限。
之后,依據(jù)精采片段檢測(cè)電路100所產(chǎn)生的起始點(diǎn)SP和截止點(diǎn)EP,下一級(jí)電路便可以由該視訊信號(hào)擷取該精采片段而只獲取該數(shù)字電視信號(hào)中該影像部分,另一方面,下一級(jí)電路也可以依據(jù)精采片段檢測(cè)電路100所產(chǎn)生的起始點(diǎn)SP和截止點(diǎn)EP,同時(shí)由該視訊信號(hào)和該語(yǔ)音信號(hào)擷取該精采片段,以同時(shí)獲取該數(shù)字電視信號(hào)的影像部分和語(yǔ)音部分。
以上所述僅為本發(fā)明的較佳實(shí)施例,凡依本發(fā)明的權(quán)利要求所做的均等變化與修飾,皆應(yīng)屬本發(fā)明的涵蓋范圍。
權(quán)利要求
1.一種精采片段檢測(cè)電路,用來檢測(cè)一視訊信號(hào)中的一精采片段,其包含有一音調(diào)追蹤模塊,用來估計(jì)一語(yǔ)音信號(hào)的多個(gè)音調(diào)值;一音調(diào)差異檢測(cè)模塊,耦接至該音調(diào)追蹤模塊,用來依據(jù)該多個(gè)音調(diào)值以計(jì)算出多個(gè)音調(diào)差異值;以及一精采片段檢測(cè)模塊,耦接至該音調(diào)差異檢測(cè)模塊,用來依據(jù)該多個(gè)音調(diào)差異值以決定該精采片段的一起始點(diǎn)和一截止點(diǎn);其中該視訊信號(hào)對(duì)應(yīng)于一信號(hào)源的一影像部分,以及該語(yǔ)音信號(hào)對(duì)應(yīng)于該信號(hào)源的一語(yǔ)音部分。
2.如權(quán)利要求1所述的精采片段檢測(cè)電路,其還包含有一音調(diào)平滑器,耦接于該音調(diào)追蹤模塊和該音調(diào)差異檢測(cè)模塊之間,用來分別對(duì)每一窗口內(nèi)的多個(gè)音調(diào)值進(jìn)行平均以產(chǎn)生多個(gè)平均后音調(diào)值;其中該音調(diào)差異檢測(cè)模塊依據(jù)該多個(gè)平均后音調(diào)值以產(chǎn)生該多個(gè)音調(diào)差異值。
3.如權(quán)利要求2所述的精采片段檢測(cè)電路,其中若在一特定窗口內(nèi)的多個(gè)音調(diào)值中低于一第一臨界值的音調(diào)值數(shù)量的百分比到達(dá)一第二臨界值,則該音調(diào)平滑器設(shè)定一默認(rèn)值給對(duì)應(yīng)該特定窗口的一平均后音調(diào)值;以及若該特定窗口內(nèi)的該多個(gè)音調(diào)值中低于該第一臨界值的音調(diào)值數(shù)量的百分比未達(dá)到該第二臨界值,則該音調(diào)平滑器平均該特定窗口內(nèi)不小于該第一臨界值的多個(gè)音調(diào)值以產(chǎn)生對(duì)應(yīng)該特定窗口的一平均后音調(diào)值。
4.如權(quán)利要求1所述的精采片段檢測(cè)電路,其中該音調(diào)差異檢測(cè)模塊決定一特定音調(diào)值的一特定音調(diào)差異值包括加總該特定音調(diào)值之前多個(gè)音調(diào)值以產(chǎn)生一第一加總值;加總該特定音調(diào)值之后多個(gè)音調(diào)值以產(chǎn)生一第二加總值;以及將該特定音調(diào)差異值設(shè)定為該第一加總值和該第二加總值的差。
5.如權(quán)利要求1所述的精采片段檢測(cè)電路,其還包含有一調(diào)制器,耦接于該音調(diào)差異檢測(cè)模塊和該精采片段檢測(cè)模塊,用來產(chǎn)生多個(gè)調(diào)制后音調(diào)差異值,該調(diào)制器將對(duì)應(yīng)一特定音調(diào)值的一特定音調(diào)差異值乘上該特定音調(diào)值以產(chǎn)生對(duì)應(yīng)該特定音調(diào)值的一特定調(diào)制后音調(diào)差異值;其中該精采片段檢測(cè)模塊依據(jù)該多個(gè)調(diào)制后音調(diào)差異值以決定該起始點(diǎn)和該截止點(diǎn)。
6.如權(quán)利要求1所述的精采片段檢測(cè)電路,其還包含有一精采片段微調(diào)模塊,耦接至該精采片段檢測(cè)模塊,用來依據(jù)該視訊信號(hào)以提前該起始點(diǎn)或延遲該截起點(diǎn)的位置。
7.如權(quán)利要求6所述的精采片段檢測(cè)電路,其中該精采片段微調(diào)模塊對(duì)該視訊信號(hào)進(jìn)行一分鏡檢測(cè)運(yùn)算以提前該起始點(diǎn)或延遲該截止點(diǎn)的位置以取得較完整的片段。
8.如權(quán)利要求1所述的精采片段檢測(cè)電路,其中該音調(diào)追蹤模塊對(duì)該語(yǔ)音信號(hào)進(jìn)行一傅里葉轉(zhuǎn)換以產(chǎn)生一頻域信號(hào),而后對(duì)該頻域信號(hào)進(jìn)行一調(diào)和乘積譜算法以估計(jì)該多個(gè)音調(diào)值。
9.如權(quán)利要求8所述的精采片段檢測(cè)電路,其中若一第二音調(diào)值的一強(qiáng)度達(dá)到由該音調(diào)追蹤模塊進(jìn)行該調(diào)和乘積譜算法所估計(jì)出的一第一音調(diào)值的一強(qiáng)度的一特定百分比,且該第二音調(diào)值的一音調(diào)為該第一音調(diào)值的一音調(diào)的一半,則該音調(diào)追蹤模塊以該第二音調(diào)值來取代該第一音調(diào)值。
10.如權(quán)利要求1所述的精采片段檢測(cè)電路,其中該音調(diào)追蹤模塊對(duì)該語(yǔ)音信號(hào)進(jìn)行一傅里葉轉(zhuǎn)換以產(chǎn)生一頻域信號(hào),而后對(duì)該頻域信號(hào)進(jìn)行一自相關(guān)運(yùn)算以估計(jì)該多個(gè)音調(diào)值。
11.如權(quán)利要求1所述的精采片段檢測(cè)電路,其中該信號(hào)源為一數(shù)字電視信號(hào)。
12.如權(quán)利要求1所述的精采片段檢測(cè)電路,其還包含有一取樣電路,耦接至該音調(diào)追蹤模塊,用來縮減取樣該語(yǔ)音信號(hào)并輸出一縮減取樣語(yǔ)音信號(hào)至該音調(diào)追蹤模塊。
13.一種檢測(cè)一視訊信號(hào)中的一精采片段的方法,其包含有步驟估計(jì)一語(yǔ)音信號(hào)的多個(gè)音調(diào)值;依據(jù)該多個(gè)音調(diào)值,計(jì)算出多個(gè)音調(diào)差異值;以及依據(jù)該多個(gè)音調(diào)差異值,決定該精采片段的一起始點(diǎn)和一截止點(diǎn);其中該視訊信號(hào)對(duì)應(yīng)于一信號(hào)源的一影像部分,以及該語(yǔ)音信號(hào)對(duì)應(yīng)于該信號(hào)源的一語(yǔ)音部分。
14.如權(quán)利要求13所述的方法,還包含有步驟分別對(duì)每一窗口內(nèi)的多個(gè)音調(diào)值進(jìn)行平均以產(chǎn)生多個(gè)平均后音調(diào)值;其中該多個(gè)音調(diào)差異值依據(jù)該多個(gè)平均后音調(diào)值所產(chǎn)生。
15.如權(quán)利要求14所述的方法,其中平均該多個(gè)音調(diào)值的步驟還包含有步驟若在一特定窗口內(nèi)的多個(gè)音調(diào)值中低于一第一臨界值的音調(diào)值數(shù)量的百分比到達(dá)一第二臨界值,則設(shè)定一默認(rèn)值給對(duì)應(yīng)該特定窗口的一平均后音調(diào)值;以及若該特定窗口內(nèi)的該多個(gè)音調(diào)值中低于該第一臨界值的音調(diào)值數(shù)量的百分比未達(dá)到該第二臨界值,則平均該特定窗口內(nèi)不小于該第一臨界值的多個(gè)音調(diào)值以產(chǎn)生對(duì)應(yīng)該特定窗口的一平均后音調(diào)值。
16.如權(quán)利要求13所述的方法,其中計(jì)算該多個(gè)音調(diào)差異值的步驟是決定一特定音調(diào)值的一特定音調(diào)差異值,該步驟包含有加總該特定音調(diào)值之前多個(gè)音調(diào)值以產(chǎn)生一第一加總值;加總該特定音調(diào)值之后多個(gè)音調(diào)值以產(chǎn)生一第二加總值;以及將該特定音調(diào)差異值設(shè)定為該第一加總值和該第二加總值的差。
17.如權(quán)利要求13所述的方法,其還包含有產(chǎn)生多個(gè)調(diào)制后音調(diào)差異值,將對(duì)應(yīng)一特定音調(diào)值的一特定音調(diào)差異值乘上該特定音調(diào)值以產(chǎn)生對(duì)應(yīng)該特定音調(diào)值的一特定調(diào)制后音調(diào)差異值;其中該多個(gè)調(diào)制后音調(diào)差異值用來決定該起始點(diǎn)和該截止點(diǎn)。
18.如權(quán)利要求13所述的方法,其還包含有依據(jù)該視訊信號(hào)以提前該起始點(diǎn)或延遲該截起點(diǎn)的位置。
19.如權(quán)利要求18所述的方法,其中一分鏡檢測(cè)運(yùn)算操作于該視訊信號(hào),以提前該起始點(diǎn)或延遲該截止點(diǎn)的位置。
20.如權(quán)利要求13所述的方法,其中估計(jì)該多個(gè)音調(diào)值的步驟還包含對(duì)該語(yǔ)音信號(hào)進(jìn)行一傅里葉轉(zhuǎn)換以產(chǎn)生一頻域信號(hào),而后對(duì)該頻域信號(hào)進(jìn)行一調(diào)和乘積譜算法以估計(jì)該多個(gè)音調(diào)值。
21.如權(quán)利要求20所述的方法,其中估計(jì)該多個(gè)音調(diào)值的步驟還包含有步驟若一第二音調(diào)值的一強(qiáng)度達(dá)到由該調(diào)和乘積譜算法所估計(jì)出的一第一音調(diào)值的一強(qiáng)度的一特定百分比,且該第二音調(diào)值的一音調(diào)為該第一音調(diào)值的一音調(diào)的一半,則以該第二音調(diào)值取代該第一音調(diào)值。
22.如權(quán)利要求13所述的方法,其中估計(jì)該多個(gè)音調(diào)值的步驟還包含對(duì)該語(yǔ)音信號(hào)進(jìn)行一傅里葉轉(zhuǎn)換以產(chǎn)生一頻域信號(hào),而后對(duì)該頻域信號(hào)進(jìn)行一自相關(guān)運(yùn)算以估計(jì)該多個(gè)音調(diào)值。
23.如權(quán)利要求13所述的方法,其中該信號(hào)源為一數(shù)字電視信號(hào)。
24.如權(quán)利要求13所述的方法,其還包含有步驟縮減取樣該語(yǔ)音信號(hào)以產(chǎn)生一縮減取樣語(yǔ)音信號(hào);其中該多個(gè)音調(diào)值依據(jù)該縮減取樣語(yǔ)音信號(hào)所估計(jì)出。
全文摘要
一種精采片段檢測(cè)電路,用來檢測(cè)一視訊信號(hào)中的一精采片段。該精采片段檢測(cè)電路包含有一音調(diào)追蹤模塊、一音調(diào)差異檢測(cè)模塊以及一精采片段檢測(cè)模塊。該音調(diào)追蹤模塊用來估計(jì)一語(yǔ)音信號(hào)的多個(gè)音調(diào)值,該音調(diào)差異檢測(cè)模塊耦接至該音調(diào)追蹤模塊,用來依據(jù)該多個(gè)音調(diào)值以計(jì)算出多個(gè)音調(diào)差異值,而該精采片段檢測(cè)模塊耦接至該音調(diào)差異檢測(cè)模塊,用來依據(jù)該多個(gè)音調(diào)差異值以決定該精采片段的一起始點(diǎn)和一截止點(diǎn)。該視訊信號(hào)對(duì)應(yīng)于一信號(hào)源的一影像部分,而該語(yǔ)音信號(hào)對(duì)應(yīng)于該信號(hào)源的一語(yǔ)音部分。
文檔編號(hào)H04N5/262GK1909605SQ20051008932
公開日2007年2月7日 申請(qǐng)日期2005年8月2日 優(yōu)先權(quán)日2005年8月2日
發(fā)明者許昱, 葉家宏, 施宣輝, 郭宗杰 申請(qǐng)人:智輝研發(fā)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1