本發(fā)明涉及一種機頂盒點播包分析系統(tǒng)和分析方法,實現從前端系統(tǒng)判斷用戶點播體驗及監(jiān)控業(yè)務應用性能。
背景技術:互動電視業(yè)務種類多樣,包含點播、回看、游戲、商城、電子營業(yè)廳等。隨著互動業(yè)務飛速發(fā)展,互動用戶日益增長,系統(tǒng)穩(wěn)定安全運行的重要性日益突出。傳統(tǒng)的監(jiān)控手段往往局限于對各系統(tǒng)服務器CPU、內存、磁盤利用率等硬件層面的監(jiān)控,但對于業(yè)務級別的監(jiān)控,尚無較好的手段從前端判斷業(yè)務性能質量。傳統(tǒng)的系統(tǒng)性能監(jiān)控和故障定位方法有如下缺陷:(1)系統(tǒng)監(jiān)控大多局限于對硬件狀態(tài)的監(jiān)控(CPU、內存、磁盤利用率等),無法從用戶角度實時監(jiān)控系統(tǒng)業(yè)務性能,特別是系統(tǒng)應用層面的性能,對于用戶實際點播和訪問的體驗質量無法全面了解。(2)對于用戶點播過程中出現的故障排查,前端運維人員無法迅速判斷故障范圍及故障現象,故障定位不夠快速。原先的系統(tǒng)監(jiān)控無法較為全面的了解所有用戶訪問互動電視系統(tǒng)的用戶感知。傳統(tǒng)運維方法為由運維人員通過信號檢測等設備在用戶側(用戶家中)對用戶點播信令、信號強度等進行檢測從而分析用戶點播體驗,不能從總體的所有用戶的角度快速判斷前端系統(tǒng)性能。
技術實現要素:發(fā)明目的:針對上述現有技術存在的問題和不足,本發(fā)明的目的是提供一種機頂盒點播包分析系統(tǒng)和分析方法,從而快速判斷系統(tǒng)應用性能、用戶體驗并快速定位故障。技術方案:為實現上述發(fā)明目的,本發(fā)明采用的第一種技術方案為一種機頂盒點播包分析系統(tǒng),包括機頂盒、信令匯聚交換機、互動電視點播系統(tǒng)(即“前端系統(tǒng)”)和信令分析設備,所述機頂盒與信令匯聚交換機和互動電視點播系統(tǒng)有線連接,所述信令匯聚交換機與信令分析設備和互動電視點播系統(tǒng)有線連接。所述信令分析設備可以是深信服公司的APM(應用性能管理)。進一步的,所述互動電視點播系統(tǒng)包括域名解析和負載均衡交換機、頁面服務器和視頻點播推流服務器,所述域名解析和負載均衡交換機與信令匯聚交換機和頁面服務器有線連接,所述視頻點播推流服務器與頁面服務器和機頂盒有線連接。更進一步的,所述頁面服務器包括電視游戲頁面服務器、電視商城頁面服務器和點播頁面服務器。本發(fā)明采用的第二種技術方案為一種機頂盒點播包分析方法,包括如下步驟:機頂盒將用戶的請求信令發(fā)送至信令匯聚交換機;信令匯聚交換機將用戶的請求信令轉發(fā)給互動電視點播系統(tǒng)和信令分析設備;互動電視點播系統(tǒng)根據用戶的請求信令將相應的反饋信令發(fā)送至信令匯聚交換機,由信令匯聚交換機發(fā)送至機頂盒呈現給用戶,信令匯聚交換機還將接收到的反饋信令發(fā)送給信令分析設備;互動電視點播系統(tǒng)根據用戶的請求信令推送相應業(yè)務的節(jié)目流給機頂盒;信令分析設備分析接收到的信令。進一步的,所述信令分析設備對接收到的信令進行應用層面和網絡層面的分析。進一步的,所述信令分析設備通過分析接收到的信令,獲取用戶訪問業(yè)務系統(tǒng)時各環(huán)節(jié)所消耗的平均時間,包括如下步驟:①通過基于互動電視點播系統(tǒng)的性能信息獲取訪問頁面服務器(簡稱“服務器”)的變慢比例,若變慢比例大于或接近50%,轉步驟②,如果變慢比例遠小于50%,則判斷當前業(yè)務正常;②判斷服務器延時是否大于1s,如果大于或接近1s,則判定為服務器故障;如果服務器響應延遲遠小于1s,則轉步驟③;③判斷網絡延時,如果所有地區(qū)網絡延時大于或接近1S(延時較大),則為前端機房網絡傳輸系統(tǒng)問題,若不是則轉步驟④;④如果為某一地區(qū)網絡延時大,則為地區(qū)網絡傳輸系統(tǒng)問題,若不是則為用戶側網絡問題;⑤判斷是否是所有頁面訪問出現變慢,如果是,則轉步驟③排查網絡,否則轉步驟⑥;⑥出現訪問慢的頁面是否影響所有地區(qū)用戶,如果是,則為該頁面本身設計問題,如果不是則為個別機頂盒終端性能不足所致。有益效果:本發(fā)明能夠基于用戶角度從網絡層面及應用層面較為細致地監(jiān)控和判斷互動電視系統(tǒng)業(yè)務性能總體運行情況,并實現故障的快速定位和排查。附圖說明圖1為機頂盒點播包分析系統(tǒng)的結構框圖;圖2為互動電視點播系統(tǒng)的結構框圖;圖3為互動電視點播系統(tǒng)總體應用性能圖;圖4為訪問游戲業(yè)務的用戶統(tǒng)計圖(按區(qū)域);圖5為訪問游戲業(yè)務體驗變慢的用戶統(tǒng)計圖;圖6為游戲業(yè)務訪問詳情圖;圖7為游戲業(yè)務所有訪問變慢的頁面圖;圖8為登錄游戲開始界面出現訪問變慢情況的用戶圖;圖9為所有頁面訪問情況圖;圖10為訪問變慢次數較多的頁面圖;圖11為整個頁面的加載過程圖;圖12為各個地區(qū)網絡質量情況圖。具體實施方式下面結合附圖和具體實施例,進一步闡明本發(fā)明,應理解這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領域技術人員對本發(fā)明的各種等價形式的修改均落于本申請所附權利要求所限定的范圍。如圖1所示,所有用戶的請求信令通過城域網發(fā)送至信令匯聚交換機(簡稱“交換機”),再由信令匯聚交換機轉發(fā)給互動電視點播系統(tǒng),互動電視點播系統(tǒng)根據各用戶的請求信令將用戶所點節(jié)目的相關頁面通過信令交互的方式發(fā)給交換機,再由交換機下發(fā)給用戶?;与娨朁c播系統(tǒng)具體架構如圖2所示,域名解析和負載均衡交換機,電視游戲、商城、點播類業(yè)務頁面服務器和VOD(VideoOnDemand,視頻點播)推流服務器,用戶點播信令通過信令匯聚交換機首先到達域名解析和負載均衡交換機,該交換機對用戶點播信令進行域名解析判斷用戶當前使用的具體業(yè)務(電視游戲、商城還是點播、回看類業(yè)務),根據業(yè)務類型將請求信令派送至相應業(yè)務的頁面服務器(游戲、商城、點播類),各業(yè)務的頁面服務器根據域名解析和負載均衡交換機發(fā)送過來的用戶請求信令將相應的反饋信令(反饋頁面)發(fā)送至信令匯聚交換機,由信令匯聚交換機發(fā)送至機頂盒呈現給用戶。另一方面,各業(yè)務(游戲、商城、點播類)頁面服務器將用戶請求中的節(jié)目信息發(fā)送至VOD推流服務器,由VOD推流服務器根據用戶的請求信令推送相應業(yè)務的節(jié)目流。節(jié)目流通過視頻鏈路發(fā)送給機頂盒。用戶點播過程中與系統(tǒng)交互的所有信令流量,均由信令匯聚交換機轉發(fā),因此將用戶的點播交互信令(即請求信令和反饋信令,簡稱“交互信令”)以鏡像流量的方式發(fā)給信令分析設備進行分析,信令分析設備的主要功能是通過對機頂盒與互動電視點播系統(tǒng)的交互信令進行應用層面和網絡層面的分析,獲取相關性能指標(如連接成功率、失敗率等網絡層指標;頁面加載時間等應用層指標),具體包括如下信息:(1)應用層相關信息:①基于互動電視點播系統(tǒng)的性能信息,如圖3所示,總體呈現系統(tǒng)的服務質量:訪問統(tǒng)計:訪問次數、變慢次數、變慢比例;終端用戶:用戶數、影響用戶、影響比例;加載時間-平均:頁面加載時間、服務器時間;錯誤:HTTP錯誤、TCP錯誤、5XX錯誤。頁面詳情:可具體查看指定系統(tǒng)頁面的訪問詳情以上統(tǒng)計信息根據所有用戶在統(tǒng)計時間內的訪問進行統(tǒng)計,體現用戶的真實訪問體驗。通過這些信息,可清晰的了解到各系統(tǒng)的業(yè)務質量,為后續(xù)優(yōu)化提供可靠數據。若一個系統(tǒng)為多臺主機并行承載,可進一步查看該系統(tǒng)的所有訪問記錄詳情。圖4顯示訪問游戲業(yè)務的所有地區(qū)用戶的性能信息,包括用戶IP、所屬區(qū)域、訪問次數、變慢次數、變慢比例、頁面平均加載時間、服務器平均時間、TCP錯誤數、HTTP錯誤數、TCP可用性比例、TCP連接次數、TCP連接失敗次數、TCP流量。通過查看系統(tǒng)的所有訪問記錄,可判斷該應用的業(yè)務質量,是否整體應用服務問題,還是個別用戶、個別區(qū)域突發(fā)狀況導致。受影響用戶(如圖5所示)為該系統(tǒng)在訪問系統(tǒng)過程中發(fā)生訪問變慢情況的用戶統(tǒng)計,由此可以判斷哪些區(qū)域、哪些用戶在點播業(yè)務過程中出現的時延、變慢情況、TCP連接次數較多,通過發(fā)現用戶在點播過程中體驗不佳的問題,及時解決。通過分析頁面詳情,可具體查看指定系統(tǒng)頁面的訪問情況,如圖6所示顯示了游戲業(yè)務所有頁面訪問詳情,包括URL、網頁標題、服務器IP、訪問次數、變慢次數、頁面元素個數、頁面平均加載時間。其中頁面加載時間為用戶端發(fā)起請求至頁面加載完成所用時間。頁面服務器(簡稱“服務器”)時間為服務器接收到頁面請求至回應數據的時間間隔。通過訪問變慢頁面分析,查看指定系統(tǒng)的所有訪問變慢頁面統(tǒng)計,如圖7所示為游戲業(yè)務所有訪問變慢的頁面。通過以上分析,可以發(fā)現用戶在登陸游戲開始界面過程中反映變慢的比例比較多。通過對其中指定URL的分析(如圖8為登錄游戲開始界面出現訪問變慢情況的用戶),可詳細查看該頁面在統(tǒng)計時間內的所有訪問記錄,包括訪問時間、瀏覽器版本、主機IP、終端IP、所屬區(qū)域、系統(tǒng)名稱、請求方式、是否為慢頁面、加載時間、請求時間、下載時間、服務器時間、頁面大小、頁面元素個數等信息。通過查看指定URL記錄,可詳細查看變慢頁面是普遍現象,還是個別區(qū)域或個別用戶的問題。其中加載時間定義為用戶端發(fā)起請求至頁面加載完成所用時間;請求時間定義為終端發(fā)起get/post請求至請求到達Web應用系統(tǒng)的時間;下載時間定義為下載URL頁面的時間;服務器時間定義為服務器接收到頁面請求至回應數據的時間。通過圖8可以發(fā)現,南京用戶10.2.184.215在登陸游戲開始頁面過程中,有加載時間較長的現象。②基于頁面的性能信息基于頁面的系統(tǒng)分析,通過分析各業(yè)務系統(tǒng)頁面的詳細狀態(tài),如頁面加載時間、HTTP4XX錯誤、5XX錯誤等信息,判斷系統(tǒng)本身是否有因設計等原因導致用戶訪問不佳的情況。所有頁面訪問情況(圖9),將呈現在統(tǒng)計時間內所有監(jiān)控系統(tǒng)的所有頁面訪問記錄,包括URL、標題、系統(tǒng)名稱、訪問次數、變慢次數、變慢比例、頁面加載時間、服務器時間、頁面大小、HTTP錯誤、5XX錯誤、用戶地區(qū)等信息。對于訪問變慢次數較多的頁面(圖10),通過分析加載時間、服務器時間、請求時間、下載時間、頁面大小、頁面元素等因素,判斷導致頁面訪問慢的根本原因。通過查看變慢頁面的詳細情況,可以描繪出整個頁面的加載過程,如圖11所示為某用戶加載頁面172.20.225.100/tvroot/httv.jsp詳細情況(圖中縱坐標為該頁面各頁面元素),總體頁面加載時間較長是由于客戶端耗時較長,用戶獲取頁面中的各個元素耗費了大量時間在機頂盒處理上,而網絡耗時(從請求時間和連接時間上體現)和服務器時間基本可忽略不計。(2)網絡層相關信息◆機頂盒和前端系統(tǒng)交互過程中的連接成功數、失敗數和會話數;◆機頂盒和前端系統(tǒng)交互過程中的數據量;◆機頂盒和前端系統(tǒng)交互過程中的網絡時延和重傳率;◆機頂盒和前端系統(tǒng)交互過程中的其他網絡異常事件;通過這些信息可以較為全面地把握各個地區(qū)用戶網絡質量情況,便于運維人員定位網絡異常地區(qū)。從圖12可見揚州地區(qū)連接失敗率較高,需進一步排查揚州地區(qū)網絡。本發(fā)明采用通過分析機頂盒點播信令,實現從前端系統(tǒng)判斷用戶點播體驗及監(jiān)控業(yè)務應用性能的方法,包括如下步驟:通過信令分析設備獲取用戶訪問業(yè)務系統(tǒng)時各環(huán)節(jié)所消耗的平均時間,包含系統(tǒng)服務器耗時、網絡耗時、終端耗時等數據。①通過基于互動電視點播系統(tǒng)的性能信息獲取訪問頁面服務器訪問變慢比例,若變慢比例大于或接近50%,轉步驟②,如果變慢比例遠小于50%,則基本判斷當前業(yè)務正常②判斷服務器延時是否大于1s,如果大于或接近1s,則判定為服務器故障;如果服務器響應延遲遠小于1s,則轉步驟③③判斷網絡延時,如果所有地區(qū)網絡延時是否大于或接近1S(延時較大),則為前端機房網絡傳輸系統(tǒng)問題,若不是則轉步驟④④如果為某一地區(qū)網絡延時大,則為地區(qū)網絡傳輸系統(tǒng)問題,若不是則為用戶側網絡問題,需運維人員上門檢查用戶家庭網絡⑤判斷是否是所有頁面訪問出現變慢,如果是,則轉步驟③排查網絡,否則轉步驟⑥⑥出現訪問慢的頁面是否影響所有地區(qū)用戶,如果是,則為該頁面本身設計問題,可能的原因為頁面元素太多。如果不是則為個別機頂盒終端性能不足所致,建議更換機頂盒。