自適應(yīng)流中表達關(guān)聯(lián)的系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信系統(tǒng)和方法,尤其涉及在自適應(yīng)流中將表達與其他表達關(guān)聯(lián)的系統(tǒng)和方法。
【背景技術(shù)】
[0002]目前,很多電視及電影觀眾期望可以按需訪問視頻和其他媒體內(nèi)容。在第一個例子中,電視觀眾可能期望觀看電視上節(jié)目定期播放期間他或她錯過的電視節(jié)目。觀眾可以在互聯(lián)網(wǎng)上通過網(wǎng)頁瀏覽器或筆記本電腦、平板電腦、臺式電腦、移動手機、或其他設(shè)備上的其他應(yīng)用按需搜索節(jié)目,然后在瀏覽器或其他應(yīng)用上觀看該節(jié)目。其他例子中,觀眾可以按需搜索電影或可以與其他觀眾參與視頻會議。
[0003]基于超文本傳輸協(xié)議的動態(tài)自適應(yīng)流媒體(Dynamic Adaptive Streaming overHypertext Transfer Protocol,DASH)為用于提供這樣的媒體內(nèi)容而開發(fā)的標(biāo)準(zhǔn),其中,部分由國際標(biāo)準(zhǔn)化組織(ISO)/國際電工技術(shù)委員會(IEC)23009-1,第一版,2012( “23009-1”)描述,并以引用的方式并入本文。另外,IS0/IEC 23009-1,技術(shù)勘誤表I,2013以引用的方式并入本文。DASH中有兩種主要設(shè)備:提供內(nèi)容的超文本傳輸協(xié)議(Hypertext TransferProtocol,HTTP)服務(wù)器以及請求該內(nèi)容的并與觀眾(或用戶)相關(guān)聯(lián)的DASH客戶端。DASH將下載控制留給客戶端,該客戶端能夠根據(jù)其自身流策略通過HTTP協(xié)議請求該內(nèi)容。
[0004]DASH用于將每個內(nèi)容組件(例如,視頻、音頻、字幕、質(zhì)量信息和轉(zhuǎn)動鍵)劃分為一系列更小的片段一每個片段為播放時間的短時間隔??赡苡卸鄠€替代選擇為DASH客戶端提供每個片段一每個替代選擇具有不同特征,例如,視頻片段具有不同的比特率或不同質(zhì)量級。當(dāng)播放或消費該內(nèi)容時,DASH客戶端會從該內(nèi)容的替代選擇(如果有)中自動選擇下一個片段(將被請求的/播放的/消費的)。該選擇基于各種因素,包括當(dāng)前網(wǎng)絡(luò)狀況。產(chǎn)生的益處是DASH客戶端能夠適應(yīng)變化的網(wǎng)絡(luò)狀況并以最高質(zhì)量級重新播放該內(nèi)容,而沒有拖延或停頓事件。
[0005]DASH客戶端可以為具有DASH和具有無線和/或有線連通性的媒體內(nèi)容播放功能的任意設(shè)備。例如,DASH客戶端可以為連接到互聯(lián)網(wǎng)的臺式電腦或筆記本電腦、智能手機、平板電腦、機頂盒和電視等。
[0006]現(xiàn)在參見圖1,示出了基于DASH標(biāo)準(zhǔn)的適配的媒體流模型,其中,媒體流部分和媒體片段由DASH客戶端1a-1On通過HTTP請求,且由一個或多個DASH(HTTP)服務(wù)器12通過網(wǎng)絡(luò)11(包括互聯(lián)網(wǎng))傳輸。可以理解的是,電信網(wǎng)絡(luò)11可以為允許通過HTTP傳輸媒體內(nèi)容的任何合適的網(wǎng)絡(luò)(或網(wǎng)絡(luò)組合)。僅舉一個例子,顯示該電信網(wǎng)絡(luò)11包括各種電信資源和基礎(chǔ)設(shè)施,如網(wǎng)絡(luò)地址轉(zhuǎn)換器和/或防火墻18、高速緩存14和內(nèi)容分發(fā)網(wǎng)絡(luò)(⑶N) 16。這些資源為網(wǎng)絡(luò)連接的設(shè)備,如DASH客戶端10a-1On提供按需的實時流和時移應(yīng)用和服務(wù)。
[0007]每個DASH客戶端10能夠通過在不同的比特率、質(zhì)量級或其他特征編碼的相同媒體片段的不同版本間切換,動態(tài)地使請求的媒體內(nèi)容/流的比特率、質(zhì)量級或其他特征適應(yīng)網(wǎng)絡(luò)狀況和/或其他因素的變化。
[0008]如圖2所不,DASH是基于在媒體描述文件(media presentat1n descript1n,MPD)清單(S卩,文件)中描述的分層數(shù)據(jù)模型,其中,所述清單為媒體內(nèi)容的一些編碼的和可交付版本定義格式,從而公布資源標(biāo)識。該MPD為廣播可用媒體內(nèi)容的XML文件并提供DASH客戶端所需信息,以便于DASH客戶端從表達中選擇片段,即媒體內(nèi)容的一些編碼的和可交付版本,做適配決定,并通過網(wǎng)絡(luò)從DASH客戶端的服務(wù)器取回選擇的片段。編碼成多個表達和其他需要的信息的媒體內(nèi)容可以由一個或多個連續(xù)的片段組成。
[0009]MPD為DASH客戶端提供足夠的信息,通過向HTTP(DASH)服務(wù)器請求片段和解復(fù)用(需要時)、解碼以及呈現(xiàn)接收的媒體片段,從而為用戶提供流服務(wù)。Mro完全獨立于片段,且只識別確定是否能夠成功播放/消費表達所需的屬性和表達的屬性(例如,片段是否在隨機訪問點開始)ο也應(yīng)注意的是,該Mro也可以包括表達中片段的非功能屬性(例如,質(zhì)量和其他描述性元數(shù)據(jù))。
[0010]為播放內(nèi)容,該DASH客戶端首先獲得該MPD。通過解析該MPD,該DASH客戶端得知程序定時、媒體內(nèi)容可用性、媒體類型、分辨率、最小和最大帶寬,以及多媒體組件的存在的各種編碼的替代選擇、可達性特征和需要的數(shù)字權(quán)限管理(digital rights management,DRM)、網(wǎng)絡(luò)上的媒體-組件位置以及其他內(nèi)容特征。使用該信息,DASH客戶端選擇合適的編碼的替代選擇,并通過使用HTTP GET請求提取片段開始瀏覽該內(nèi)容。
[0011]適當(dāng)?shù)木彺嬖试S網(wǎng)絡(luò)吞吐量的變化后,客戶端繼續(xù)提取隨后的片段,并監(jiān)控網(wǎng)絡(luò)帶寬波動。根據(jù)客戶端的測量,該客戶端通過提取不同替代選擇(具有較低或較高比特率)的片段決定如何適應(yīng)可用的帶寬,從而維持充足的緩存。
[0012]進一步地如圖2所示,媒體片段為內(nèi)容數(shù)據(jù)的最小的單獨可尋址單元,是可以使用通過MH)廣播的URL下載的實體。以現(xiàn)場直播的四秒部分作為媒體片段的一個例子,該現(xiàn)場直播開始于播出時間0:42:38,結(jié)束于0:42:42,并在三分鐘時間的窗口內(nèi)可觀看。另一個例子可以為完整的點播電影,該電影在整個時間段可以觀看。
[0013]表達定義了完整資產(chǎn)的單個編碼版本,或資產(chǎn)組件的子集的單個編碼版本。例如,表達可以為包含非復(fù)用的2.5Mbps 720p AVC視頻的ISO-BMFF(基礎(chǔ)媒體文件架構(gòu)),單獨的ISO-BMFF表達可以用于不同語言的96Kbps MPEG-4AAC的音頻。相反地,包括視頻和音頻和字幕的單個傳輸流可以為單個復(fù)用的表達。例如,作為具有多個媒體組件的復(fù)用表達,ISO-BMFF文件包括相同文件中的2.5Mbps 720p AVC視頻的一個軌跡和不同語言的96KbpsMPEG-4AAC音頻的多個軌跡。組合式結(jié)構(gòu)是可能的:視頻和英文音頻可以為單個復(fù)用表達,而西班牙語和中文音軌分別為非復(fù)用表達。
[0014]轉(zhuǎn)向圖3,示出了與HTTP(DASH)服務(wù)器202互相連接的傳統(tǒng)DASH客戶端200的功能方塊圖,還示出了流過程中的各種功能模塊。
[0015]監(jiān)控功能模塊204負(fù)責(zé)收集客戶端環(huán)境信息以及生成/輸出一些適配參數(shù),而適配邏輯模塊206使用這些參數(shù)進行表達選擇和決定。
[0016]終端用戶關(guān)心的不是絕對比特率,而是感知的質(zhì)量,即所謂的體驗質(zhì)量(Qualityof Experience,QoE)。關(guān)于質(zhì)量驅(qū)動流的DASH核心實驗(Core Experiment,CE)證明DASH客戶端在使用ISO-BMFF中元數(shù)據(jù)軌跡中存儲的編碼的媒體內(nèi)容的質(zhì)量信息時,能夠做更聰明的適配決定,從而減少流內(nèi)容的質(zhì)量波動,因而改進了 QoE并消耗較少的帶寬。
[0017]在DASH規(guī)范IS0/IEC 23009-1中,提議將定時元數(shù)據(jù),如質(zhì)量信息,攜帶在表達中。然而,當(dāng)前不存在表示攜帶質(zhì)量信息等的元數(shù)據(jù)表達與包含媒體數(shù)據(jù)的表達之間的關(guān)聯(lián)性的機制。DASH規(guī)范當(dāng)前規(guī)定的現(xiàn)有的屬性,如O群組和O從屬Id等,還不足以表示表達之間的關(guān)聯(lián)關(guān)系。
[0018]示例地,雖然關(guān)于表示表達之間關(guān)聯(lián)關(guān)系的需要沒有詳盡的例子,Mro需要識別元數(shù)據(jù)表達(例如,質(zhì)量信息)和媒體表達之間的關(guān)聯(lián)性,從而協(xié)助客戶端決定選擇哪一個表達。
[0019]簡單的解決方案是將元數(shù)據(jù)表達放在與包含相關(guān)聯(lián)的媒體表達的適配集不同的適配集中。然而,不存在表示不同的適配集中表達之間的關(guān)系的現(xiàn)有機制。雖然屬性@群組和元素子集表示適配集間的關(guān)系,屬性@群組和元素子集表示的包含性或排他性不是元數(shù)據(jù)表達和媒體表達之間的關(guān)系。至于屬性@從屬Id,其處在表達級,從屬表達和依賴的(補充的)表達在相同的適配集中。還需注意的是,在從屬關(guān)系中,從屬表達不能呈現(xiàn)自己。從屬表達只能通過依賴的表達呈現(xiàn)。元數(shù)據(jù)表達依賴于媒體表達,但是在檢索媒體表達之前,可以單獨使用元數(shù)據(jù)表達。
[0020]因此,需要能夠在不同適配集中表示表達與其他表達之間的關(guān)系的系統(tǒng)和方法。
【發(fā)明內(nèi)容】
[0021]本發(fā)明揭示了用于自適應(yīng)流中定時元數(shù)據(jù)的信令的系統(tǒng)、方法、和設(shè)備,其通過提供表達之間的關(guān)聯(lián)關(guān)系實現(xiàn),具體地,提供定時元數(shù)據(jù)表達和媒體表達之間的關(guān)聯(lián)關(guān)系。
[0022]一實施例中,本發(fā)明揭不了一種在自適應(yīng)流中將第一至少一個表達與第二至少一個表達關(guān)聯(lián)的方法,其中,會確定包含所述第一至少一個表達的第一集合是否與包含所述第二至少一個表達的第二集合相關(guān)聯(lián)。引入了一種屬性來列出與所述第一至少一個表達相關(guān)聯(lián)的第二至少一個表達的標(biāo)識。
[0023]一實施例中,所述屬性處于設(shè)定級。
[0024]一實施例中,所述屬性處于表達級。
[0025]—實施例中,表達中攜帶的數(shù)據(jù)通過O編解碼器屬性的值來識別。
[0026]—實施例中,自適應(yīng)流系統(tǒng)包括用于傳輸媒體描述文件(m