一種基于無參影像的三維重建與渲染方法

文檔序號：39805262發(fā)布日期：2024-10-29 17:21閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及計算機(jī)視覺三維重建領(lǐng)域，尤其涉及一種基于無參影像的三維重建與渲染方法。

背景技術(shù)：

1、稠密視覺三維場景重建在機(jī)器人、虛擬現(xiàn)實和增強(qiáng)現(xiàn)實等領(lǐng)域具有重要的應(yīng)用價值。這項技術(shù)的核心目標(biāo)是創(chuàng)建未知環(huán)境的高保真三維重建，并實時跟蹤相機(jī)的位姿。在計算機(jī)視覺和機(jī)器人技術(shù)中，這種能力被廣泛應(yīng)用于自主導(dǎo)航、環(huán)境感知和增強(qiáng)現(xiàn)實等應(yīng)用場景。

2、傳統(tǒng)的稠密視覺三維場景重建方法通常采用點云、網(wǎng)格或體素格來表示場景，例如采用從運動恢復(fù)結(jié)構(gòu)sfm的方法去估計影像的位姿，然后以多視圖立體匹配mvs的方法去構(gòu)建稠密場景，這個過程存在跟蹤精度差、重建質(zhì)量較差與不能實現(xiàn)端到端的場景重建等問題。近年來的神經(jīng)輻射場(nerf)重建方法的提出，展示重建高保真場景的潛力，由于其需要有參影像作為輸入和訓(xùn)練速度慢，限制了其在實時應(yīng)用中的廣泛使用。例如：現(xiàn)有發(fā)明“一種基于自適應(yīng)法向先驗的室內(nèi)場景三維重建方法”(cn202410438152.3)存在需要利用colmap工具去獲取每張影像的位姿，重建時間長的弊端；“一種基于神經(jīng)輻射場的三維場景模型構(gòu)建方法”(cn202410037336.9)存在需要使用sfm算法去獲取影像的位姿，重建場景的質(zhì)量差的弊端。

3、針對上述問題，本發(fā)明公開了一種基于無參影像的三維重建與渲染方法，可廣泛應(yīng)用于場景的實時渲染與高質(zhì)量重建。該方法無需影像的位姿輸入，端到端重建高保真3d高斯場景的性質(zhì)，能夠?qū)θ我庖暯沁M(jìn)行實時渲染。

技術(shù)實現(xiàn)思路

1、本發(fā)明公開了一種基于無參影像的三維重建與渲染方法，能夠?qū)崿F(xiàn)端到端實時渲染和對場景的高保真重建。為實現(xiàn)上述目的，本發(fā)明提供了一種基于無參影像的三維重建與渲染方法，包括以下步驟：

2、對輸入的rgbd影像數(shù)據(jù)流使用預(yù)訓(xùn)練的光流估計網(wǎng)絡(luò)模型進(jìn)行光流估計；

3、將光流大于設(shè)定閾值的影像作為關(guān)鍵幀，對rgbd影像數(shù)據(jù)流的關(guān)鍵幀集構(gòu)建關(guān)鍵幀圖；

4、根據(jù)關(guān)鍵幀圖構(gòu)建以關(guān)鍵幀對的平均光流為共視度值的共視矩陣并在長為歷史關(guān)鍵幀長度，寬為局部關(guān)鍵幀長度的共視矩陣之內(nèi)建立邊；

5、使用反向投影過濾掉共視度較低的邊，選擇合適邊的關(guān)鍵幀對使用阻尼高斯-牛頓法優(yōu)化當(dāng)前影像的位姿；

6、對每一幀關(guān)鍵幀影像利用優(yōu)化的位姿將二維像素點投影到世界空間，基于3d高斯場景表征使用高斯?jié)姙R渲染可見性輪廓對每一幀的關(guān)鍵幀影像進(jìn)行高斯的插入與剪枝；

7、通過在幀圖中動態(tài)選擇k個關(guān)鍵幀影像作為動態(tài)滑動窗口，利用高斯?jié)姙R循環(huán)迭代渲染顏色和深度信息來優(yōu)化3d高斯場景表征。

8、所述光流估計，通過使用公開數(shù)據(jù)集訓(xùn)練光流估計網(wǎng)絡(luò)獲得預(yù)訓(xùn)練模型，利用預(yù)訓(xùn)練模型估計當(dāng)前輸入的rgbd影像數(shù)據(jù)的光流。

9、所述建立邊，通過使用關(guān)鍵幀集來構(gòu)建關(guān)鍵幀圖，根據(jù)關(guān)鍵幀圖構(gòu)建以關(guān)鍵幀對的平均光流為共視度值的共視矩陣并在長為歷史關(guān)鍵幀長度，寬為局部關(guān)鍵幀長度的共視矩陣之內(nèi)建立邊。

10、所述優(yōu)化位姿，通過將合適邊的關(guān)鍵幀對使用幀間位姿將當(dāng)前幀影像的像素投影到下一幀影像所對應(yīng)的像素區(qū)域，通過預(yù)測的光流作為投影的真實像素位置，使用阻尼高斯-牛頓法迭代優(yōu)化當(dāng)前幀影像的位姿，減小兩幀影像之間的重投影誤差。

11、所述高斯插入與剪枝，通過將場景表征為各項同性3d高斯即是將場景表征為一系列的3d高斯球，對應(yīng)的參數(shù)有3d高斯球的中心位置、顏色，不透明度以及高斯半徑，首先將第一幀關(guān)鍵幀影像的所有像素點利用優(yōu)化的位姿投影到世界空間，作為初始各向同性3d高斯場景表征，通過一定次數(shù)的迭代優(yōu)化獲得相對較好的初始3d高斯場景表征，接著后面的每一幀關(guān)鍵幀影像進(jìn)行高斯的插入與剪枝，使用優(yōu)化的位姿將當(dāng)前幀的像素點投影到世界空間并根據(jù)高斯?jié)姙R渲染的輪廓可見性進(jìn)行高斯點云的插入，同時對不透明度較小的高斯進(jìn)行去除。

12、所述優(yōu)化3d高斯場景表征，通過在幀圖中選擇k個動態(tài)關(guān)鍵幀作為動態(tài)滑動窗口，在動態(tài)滑動窗口中隨機(jī)選擇一個關(guān)鍵幀影像，利用選擇的關(guān)鍵幀影像的位姿進(jìn)行高斯?jié)姙R渲染其對應(yīng)的顏色和深度與真實的顏色和深度作損失，最后循環(huán)迭代優(yōu)化3d高斯場景表征。

技術(shù)特征：

1.一種基于無參影像的三維重建與渲染方法，其特征在于，包括以下步驟：

2.如權(quán)利要求1所述的光流估計，其特征在于，通過使用公開數(shù)據(jù)集訓(xùn)練光流估計網(wǎng)絡(luò)獲得預(yù)訓(xùn)練模型，利用預(yù)訓(xùn)練模型估計當(dāng)前輸入的rgbd影像數(shù)據(jù)的光流。

3.如權(quán)利要求1所述的建立邊，其特征在于，通過使用關(guān)鍵幀集來構(gòu)建關(guān)鍵幀圖，根據(jù)關(guān)鍵幀圖構(gòu)建以關(guān)鍵幀對的平均光流為共視度值的共視矩陣并在長為歷史關(guān)鍵幀長度，寬為局部關(guān)鍵幀長度的共視矩陣之內(nèi)建立邊。

4.如權(quán)利要求1所述的優(yōu)化位姿，其特征在于，通過將合適邊的關(guān)鍵幀對使用幀間位姿將當(dāng)前幀影像的像素投影到下一幀影像所對應(yīng)的像素區(qū)域，通過預(yù)測的光流作為投影的真實像素位置，使用阻尼高斯-牛頓法迭代優(yōu)化當(dāng)前幀影像的位姿，減小兩幀影像之間的重投影誤差。

5.如權(quán)利要求1所述的高斯插入與剪枝，其特征在于，通過將場景表征為各項同性3d高斯即是將場景表征為一系列的3d高斯球，對應(yīng)的參數(shù)有3d高斯球的中心位置、顏色，不透明度以及高斯半徑，首先將第一幀關(guān)鍵幀影像的所有像素點利用優(yōu)化的位姿投影到世界空間，作為初始各向同性3d高斯場景表征，通過一定次數(shù)的迭代優(yōu)化獲得相對較好的初始3d高斯場景表征，接著后面的每一幀關(guān)鍵幀影像進(jìn)行高斯的插入與剪枝，使用優(yōu)化的位姿將當(dāng)前幀的像素點投影到世界空間并根據(jù)高斯?jié)姙R渲染的輪廓可見性進(jìn)行高斯點云的插入，同時對不透明度較小的高斯進(jìn)行去除。

6.如權(quán)利要求1所述的優(yōu)化3d高斯場景表征，其特征在于，通過在幀圖中選擇k個動態(tài)關(guān)鍵幀作為動態(tài)滑動窗口，在動態(tài)滑動窗口中隨機(jī)選擇一個關(guān)鍵幀影像，利用選擇的關(guān)鍵幀影像的位姿進(jìn)行高斯?jié)姙R渲染其對應(yīng)的顏色和深度與真實的顏色和深度作損失，最后循環(huán)迭代優(yōu)化3d高斯場景表征。

技術(shù)總結(jié)
本發(fā)明公開了一種基于無參影像的三維重建與渲染方法，輸入多視角RGBD影像數(shù)據(jù)流，通過在公開數(shù)據(jù)集上訓(xùn)練光流估計網(wǎng)絡(luò)得到的預(yù)訓(xùn)練模型對每一幀影像進(jìn)行光流估計，根據(jù)光流閾值選擇關(guān)鍵幀并使用關(guān)鍵幀集來構(gòu)建關(guān)鍵幀圖；通過共視關(guān)系在關(guān)鍵幀之間建立共視矩陣，在共視矩陣中的關(guān)鍵幀對建立邊，對關(guān)鍵幀圖中形成邊的關(guān)鍵幀使用阻尼高斯?牛頓法迭代優(yōu)化關(guān)鍵幀的位姿；在關(guān)鍵幀圖中動態(tài)選擇K個共視關(guān)鍵幀作為動態(tài)滑動窗口，通過滑動窗口的關(guān)鍵幀信息進(jìn)行高斯的動態(tài)插入與剪枝，使用高斯?jié)姙R渲染關(guān)鍵幀的顏色、深度、可見性輪廓信息，將其與關(guān)鍵幀的真實顏色和深度信息求損失以優(yōu)化3D高斯的場景表征。本發(fā)明解決了傳統(tǒng)三維重建技術(shù)重建場景的質(zhì)量差，訓(xùn)練和渲染時間長的問題，可以廣泛應(yīng)用于三維重建的相關(guān)應(yīng)用之中。

技術(shù)研發(fā)人員：彭智勇,許茂林,莫迪,蔡毅沖
受保護(hù)的技術(shù)使用者：桂林電子科技大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2024/10/28

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：彭智勇,許茂林,莫迪,蔡毅沖
技術(shù)所有人：桂林電子科技大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于無參影像的三維重建與渲染方法