亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法

文檔序號(hào):39729572發(fā)布日期:2024-10-22 13:34閱讀:54來(lái)源:國(guó)知局
一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法

本發(fā)明涉及傳輸控制,尤其涉及一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法。


背景技術(shù):

1、在現(xiàn)代網(wǎng)絡(luò)環(huán)境中,隨著視頻流量的持續(xù)高速增長(zhǎng),以及虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)和360度視頻等新興應(yīng)用的廣泛普及,對(duì)網(wǎng)絡(luò)技術(shù)的承載能力和傳輸服務(wù)質(zhì)量提出了更高的要求。

2、在利用現(xiàn)有技術(shù)進(jìn)行數(shù)據(jù)傳輸時(shí),通常是發(fā)送端周期性地向接收端發(fā)送探測(cè)數(shù)據(jù)包,并設(shè)置超時(shí)閾值以監(jiān)控各個(gè)重傳路徑的狀態(tài),當(dāng)探測(cè)數(shù)據(jù)包未能及時(shí)確認(rèn)時(shí),激活探針超時(shí)機(jī)制,促使發(fā)送端采取快速恢復(fù)和快速重傳策略,以保證數(shù)據(jù)傳輸?shù)姆€(wěn)定性和可靠性。

3、然而,由于探針超時(shí)機(jī)制以數(shù)據(jù)包的確認(rèn)延遲來(lái)評(píng)估路徑的可用性。對(duì)于數(shù)據(jù)新鮮度要求較高的流媒體視頻等應(yīng)用,其重傳路徑切換感知遲緩,導(dǎo)致流媒體視頻傳輸服務(wù)質(zhì)量的劣化,進(jìn)而降低用戶體驗(yàn)。因此,亟需提供一種方案改善上述問(wèn)題。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,用以改善現(xiàn)有技術(shù)重傳路徑切換感知遲緩,導(dǎo)致流媒體視頻傳輸服務(wù)質(zhì)量效率低下的問(wèn)題。

2、本發(fā)明提供的一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法,采用如下的技術(shù)方案:

3、基于流媒體視頻的發(fā)送端和接收端建立數(shù)據(jù)傳輸圖,發(fā)送端向接收端發(fā)送多個(gè)主數(shù)據(jù)包,當(dāng)數(shù)據(jù)傳輸失敗時(shí),發(fā)送端向接收端發(fā)送多個(gè)重傳數(shù)據(jù)包,其中,發(fā)送端與接收端之間具有多條重傳路徑;

4、基于重傳數(shù)據(jù)包的生成時(shí)間和接收端的接收時(shí)間獲得所述重傳數(shù)據(jù)包的信息年齡,并對(duì)所述信息年齡進(jìn)行平滑處理后獲得平滑后重傳數(shù)據(jù)包的信息年齡;

5、計(jì)算所述平滑后重傳數(shù)據(jù)包的信息年齡的均值和方差,并基于所述均值和方差更新每條重傳路徑的收益后獲得使得所述收益最大化的最優(yōu)路徑,并在所述最優(yōu)路徑中進(jìn)行數(shù)據(jù)包的重傳。

6、本發(fā)明提供的一種基于多臂老虎機(jī)的信息年齡學(xué)習(xí)路徑感知恢復(fù)方法的有益效果在于,首先,本發(fā)明提出了重傳數(shù)據(jù)包的信息年齡概念,保證了重傳數(shù)據(jù)包的新鮮度,從而保證了流媒體數(shù)據(jù)進(jìn)行傳輸?shù)臅r(shí)效性,其次,利用貝葉斯可信邊界調(diào)節(jié)因子減少了計(jì)算資源需求,提高了數(shù)據(jù)的傳輸效率和準(zhǔn)確性,最后,基于收益最大化設(shè)計(jì)了數(shù)據(jù)包的重傳機(jī)制,確保在路徑狀態(tài)變化時(shí),能夠迅速采取措施,保證數(shù)據(jù)傳輸?shù)姆€(wěn)定性和可靠性,提升了流媒體視頻傳輸?shù)姆?wù)質(zhì)量。

7、可選的,所述重傳數(shù)據(jù)包的信息年齡表示為:

8、;

9、其中,表示重傳數(shù)據(jù)包的信息年齡,表示接收端在路徑接收到重傳數(shù)據(jù)包的本地時(shí)間戳,表示發(fā)送端發(fā)送的第個(gè)重傳數(shù)據(jù)包的生成時(shí)間。

10、可選的,發(fā)送端向接收端發(fā)送多個(gè)主數(shù)據(jù)包時(shí),若其中一個(gè)或者多個(gè)主數(shù)據(jù)包丟失,接收端向發(fā)送端發(fā)送重傳數(shù)據(jù)指令,發(fā)送端接收到所述重傳數(shù)據(jù)指令后開始向接收端上傳重傳數(shù)據(jù)包。

11、可選的,獲得使得所述收益最大化的最優(yōu)路徑的過(guò)程包括:

12、初始化老虎機(jī)臂的數(shù)量、重傳數(shù)據(jù)包的信息年齡和策略集合,其中,每條臂對(duì)應(yīng)一條重傳路徑,臂的數(shù)量為重傳路徑的數(shù)量,每條重傳路徑對(duì)應(yīng)一個(gè)收益的概率分布,所述策略集合由重傳數(shù)據(jù)包、重傳路徑集合、丟失輪次集合和調(diào)度輪次集合組成;

13、在每一個(gè)時(shí)間步長(zhǎng)內(nèi),基于探索概率從重傳路徑集合中隨機(jī)選取一條路徑進(jìn)行數(shù)據(jù)包的傳輸,并基于利用概率選擇當(dāng)前收益最大化的一條重傳路徑進(jìn)行數(shù)據(jù)包的傳輸;

14、若數(shù)據(jù)傳輸成功,基于貝葉斯可信邊界調(diào)節(jié)因子更新當(dāng)前收益;若傳輸失敗,接收端將數(shù)據(jù)包加入重傳數(shù)據(jù)包列表后返回發(fā)送端,發(fā)送端重新向接收端發(fā)送重傳數(shù)據(jù)包;

15、更新多臂老虎機(jī)當(dāng)前選擇的拉桿的頻次,并基于所述拉桿的頻次獲取使得收益最大化的最優(yōu)路徑,直到達(dá)到最大時(shí)間步長(zhǎng)。

16、可選的,所述貝葉斯可信邊界調(diào)節(jié)因子可表示為:

17、;

18、其中,表示重傳路徑總數(shù),表示平滑后重傳數(shù)據(jù)包信息年齡的方差,表示多臂老虎機(jī)當(dāng)前選擇的拉桿的頻次。

19、可選的,所述多臂老虎機(jī)當(dāng)前選擇的拉桿的頻次表示為:

20、;

21、其中,表示多臂老虎機(jī)當(dāng)前選擇的拉桿的頻次,表示重傳數(shù)據(jù)包丟失輪次的次數(shù)。

22、可選的,基于貝葉斯可信邊界調(diào)節(jié)因子更新當(dāng)前收益時(shí),每條重傳路徑的收益值為:

23、<mstyle displaystyle="true" mathcolor="#000000"><mi>q</mi><mi>=</mi><msub><mi>e</mi><mrow><mi>r</mi><mi>~</mi><mi>π</mi></mrow></msub><mi>[</mi><mfrac><mn>1</mn><mrow><mi>e</mi><mi>(</mi><msub><mi>δ</mi><msub><mi>d</mi><mi>p</mi></msub></msub><mi>)</mi><mo>+</mo><msqrt><mfrac><mrow><mi>ln(|</mi><mi>p</mi><mi>|)</mi></mrow><mrow><msub><mi>n</mi><mi>t</mi></msub><mi>(</mi><msub><mi>d</mi><mi>p</mi></msub><mi>)</mi></mrow></mfrac><mi>·</mi><mi>θ</mi></msqrt></mrow></mfrac><mi>]</mi></mstyle>;

24、其中,表示每條重傳路徑的收益值,表示平滑后重傳數(shù)據(jù)包的信息年齡的均值,表示重傳路徑總數(shù),表示多臂老虎機(jī)當(dāng)前選擇的拉桿的頻次,表示貝葉斯可信邊界調(diào)節(jié)因子。

25、可選的,平滑后重傳數(shù)據(jù)包的信息年齡服從對(duì)數(shù)正態(tài)分布,滿足關(guān)系:,其中:

26、;

27、;

28、其中,表示平滑后重傳數(shù)據(jù)包的信息年齡,表示對(duì)數(shù)信息年齡的均值,表示對(duì)數(shù)信息年齡的方差,表示平滑后重傳數(shù)據(jù)包的信息年齡的方差,表示平滑后重傳數(shù)據(jù)包的信息年齡的均值。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1