
本發(fā)明總體地涉及車輛自動駕駛技術,更具體地涉及基于車內(nèi)感知的車輛自動駕駛方法和車輛自動駕駛系統(tǒng)。
背景技術:
:在自動駕駛系統(tǒng)中,規(guī)劃主要依據(jù)環(huán)境感知的結(jié)果前瞻模擬下一個時間段內(nèi)各種可能的自動駕駛方案,包括速度調(diào)整和轉(zhuǎn)向調(diào)整等;然后把最佳的方案傳遞到?jīng)Q策層去實現(xiàn)車輛的物理控制。環(huán)境感知主要是外部的物理道路感知和認知,以及和車輛周圍運動目標的感知和認知等。在現(xiàn)有的自動駕駛系統(tǒng)中,主要依賴于外部環(huán)境的感知結(jié)果、以及來自車輛本身的速度傳感器等來做運動規(guī)劃和控制,對車內(nèi)環(huán)境的感知較少,現(xiàn)有的對車內(nèi)的感知一般限于對司機的狀態(tài)的感知,如是否疲勞駕駛。技術實現(xiàn)要素:根據(jù)本發(fā)明的一個方面,提供了一種車輛自動駕駛方法,包括:感測車內(nèi)人員,獲得車內(nèi)人員的輪廓信息;對車內(nèi)人員進行歸類;以及根據(jù)所述歸類,確定相應的自動駕駛行駛模式,并對車輛進行自適應控制。進一步地,車輛自動駕駛方法還可以包括:在行駛過程中,持續(xù)接收車內(nèi)人員的反饋;以及根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)。進一步地,在車輛自動駕駛方法中,車內(nèi)人員的輪廓信息可以包括車內(nèi)每個人偏好的行駛模式。進一步地,在車輛自動駕駛方法中,每個人偏好的行駛模式可以由對應的行駛參數(shù)來表示。進一步地,在車輛自動駕駛方法中,對車內(nèi)人員進行歸類可以包括:確定每個車內(nèi)人員是否為病人;確定每個車內(nèi)人員是否是老人、小孩或殘疾人;以及確定是否每個人都設置了所偏好的駕駛模式。進一步地,在車輛自動駕駛方法中,自動駕駛模式可以包括:舒適模式、普通模式和運動模式,以及所述根據(jù)所述歸類,確定相應的自動駕駛行駛模式可以包括:確定車內(nèi)人員是否有病人,如果有病人,則確定自動駕駛模式為舒適模式;如果車內(nèi)人員沒有病人,則確定車內(nèi)每個人是否都有偏好的駕駛模式,如果車內(nèi)每個人都有偏好的駕駛模式,則使用這些偏好的駕駛模式之中舒適度最高的駕駛模式;以及如果并非車內(nèi)每個人都有偏好的駕駛模式,則確定不具有偏好的駕駛模式的人中是否存在老人、小孩或者殘疾人;以及如果存在,則使用舒適模式。進一步地,在車輛自動駕駛方法中,感測車內(nèi)人員可以包括使用下述手段中的至少一個:攝像頭、壓力傳感器和麥克風、指紋識別器、紅外傳感器。進一步地,在車輛自動駕駛方法中,獲得車內(nèi)人員的輪廓信息可以包括:識別車內(nèi)人員的身份,識別車內(nèi)人員的身份包括基于身份信息數(shù)據(jù)庫,通過下述身份識別技術中的一項或者其組合來識別車內(nèi)人員的身份:人臉識別、聲紋識別、指紋識別、虹膜識別、紅外識別;以及基于識別得到的車內(nèi)人員的身份,從輪廓信息數(shù)據(jù)庫檢索該車內(nèi)人員的輪廓信息,在輪廓信息數(shù)據(jù)庫中與車內(nèi)人員的身份標識相關聯(lián)地存儲了輪廓信息。進一步地,在車輛自動駕駛方法中,在輪廓數(shù)據(jù)庫中未存儲該車內(nèi)人員的輪廓信息的情況下,可以接收車內(nèi)人員的輪廓信息輸入,并將其存儲到數(shù)據(jù)庫中。進一步地,在車輛自動駕駛方法中,輪廓信息可以包括:年齡、性別、情緒、健康狀態(tài)信息、偏好的行駛模式中的一項或多項。進一步地,在車輛自動駕駛方法中,不同的模式可以對應于相關聯(lián)的規(guī)劃和控制參數(shù),所述參數(shù)可以選自下列項目中的一個或多個:正常加速度、超常加速度、正常減速度、超常減速度、前輪偏角和車速比的最大值、安全距離、換道最小頻率、換道安全車距。進一步地,在車輛自動駕駛方法中,根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)可以包括:響應于車內(nèi)人員對當前駕駛狀態(tài)的反饋式命令,利用預設的對應于所述反饋的參數(shù)和調(diào)整量來進行調(diào)整,所述反饋式命令指示對駕駛狀態(tài)進行確定調(diào)整。進一步地,在車輛自動駕駛方法中,當用戶不再給出反饋式命令時,記錄當前的參數(shù)作為該用戶的偏好的駕駛模式參數(shù)。進一步地,在車輛自動駕駛方法中,根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)可以包括:響應于車內(nèi)人員對當前駕駛狀態(tài)的反饋式命令,采用增強學習方法進行調(diào)整。進一步地,在車輛自動駕駛方法中,身份識別技術中的一個或多個可以運行在本地車載計算機系統(tǒng)中、云端服務器中,或者以本地車載計算機系統(tǒng)和云端服務器相互協(xié)作的方式運行。進一步地,在車輛自動駕駛方法中,所述車內(nèi)人員的身份信息數(shù)據(jù)庫和輪廓信息數(shù)據(jù)庫中的一個或兩者存儲在云端存儲中。進一步地,車輛自動駕駛方法還可以包括:感測車內(nèi)是否存在特定動物和/或特定物品;基于感測到車內(nèi)存在特定動物和/或特定物品,確定相應的自動駕駛行駛模式。根據(jù)本發(fā)明的另一方面,提供了一種車輛自動駕駛系統(tǒng),可以包括:傳感器,感測車內(nèi)人員;輪廓信息獲得單元,用于獲得車內(nèi)人員的輪廓信息;歸類單元,對車內(nèi)人員進行歸類;以及自適應控制單元,根據(jù)所述歸類,確定相應的自動駕駛行駛模式,并對車輛進行自適應控制。進一步地,車輛自動駕駛系統(tǒng)還可以包括:反饋接收單元,在行駛過程中,持續(xù)接收車內(nèi)人員的反饋;以及所述自適應控制單元根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)。在一個示例中,車內(nèi)人員的輪廓信息可以包括車內(nèi)每個人偏好的行駛模式。在一個示例中,在車輛自動駕駛系統(tǒng)中,歸類單元對車內(nèi)人員進行歸類可以包括:確定每個車內(nèi)人員是否為病人;確定每個車內(nèi)人員是否是老人、小孩或殘疾人;以及確定是否每個人都設置了所偏好的駕駛模式。在一個示例中,在車輛自動駕駛系統(tǒng)中,自動駕駛模式可以包括:舒適模式、普通模式和運動模式,以及所述根據(jù)所述歸類,確定相應的自動駕駛行駛模式包括:確定車內(nèi)人員是否有病人,如果有病人,則確定自動駕駛模式為舒適模式;如果車內(nèi)人員沒有病人,則確定車內(nèi)每個人是否都有偏好的駕駛模式,如果車內(nèi)每個人都有偏好的駕駛模式,則使用這些偏好的駕駛模式之中舒適度最高的駕駛模式;以及如果并非車內(nèi)每個人都有偏好的駕駛模式,則確定不具有偏好的駕駛模式的人中是否存在老人、小孩或者殘疾人;以及如果存在,則使用舒適模式。在一個示例中,根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)可以包括:響應于車內(nèi)人員對當前駕駛狀態(tài)的反饋式命令,采用增強學習方法進行調(diào)整。在一個示例中,在車輛自動駕駛系統(tǒng)中,傳感器還可以感測車內(nèi)是否存在特定動物和/或特定物品;以及自適應控制單元基于感測到車內(nèi)存在特定動物和/或特定物品,確定相應的自動駕駛行駛模式。根據(jù)本發(fā)明的另一方面,提供了一種車輛自動駕駛方法,可以包括:感測車內(nèi)人員,獲得車內(nèi)人員的輪廓信息;基于所獲得的車內(nèi)人員的輪廓信息,對車輛進行自適應控制。本發(fā)明實施例的車輛自動駕駛系統(tǒng)和方法關注車內(nèi)人員的感知,并確定相應的自動駕駛行駛模式,并持續(xù)進行車內(nèi)情況感知,并對車輛進行自適應控制,能夠提供更為安全和高效的自動駕駛方法和系統(tǒng)。附圖說明從下面結(jié)合附圖對本發(fā)明實施例的詳細描述中,本發(fā)明的這些和/或其它方面和優(yōu)點將變得更加清楚并更容易理解,其中:圖1示出了根據(jù)本發(fā)明一個實施例的車輛自動駕駛系統(tǒng)100的結(jié)構示意框圖。圖2示出了根據(jù)本發(fā)明一個實施例的輪廓信息獲取單元模塊120的功能結(jié)構圖。圖3示出了根據(jù)本發(fā)明另一實施例的車輛自動駕駛系統(tǒng)200的結(jié)構框圖。圖4示出了根據(jù)本發(fā)明另一實施例的車輛自動駕駛系統(tǒng)300的結(jié)構示意圖。圖5示出了根據(jù)本發(fā)明一個實施例的車輛自動駕駛方法400的總體流程圖。圖6描述根據(jù)本發(fā)明一個實施例的示例性車輛自動駕駛方法500的更詳細過程。圖7示出了根據(jù)本發(fā)明實施例的示例性自適應控制方法600的流程圖。圖8示出了根據(jù)本發(fā)明另一實施例的使用增強學習方法的示例性自適應控制方法700的流程圖。具體實施方式為了使本領域技術人員更好地理解本發(fā)明,下面結(jié)合附圖和具體實施方式對本發(fā)明作進一步詳細說明。輪廓信息(profile),為車內(nèi)人員的資料,可以由車內(nèi)人員注冊得到,優(yōu)選包括車內(nèi)人員偏好的駕駛模式,還可以包括姓名、年齡、性別、健康狀況、情緒等等。自適應控制和/或調(diào)整,指根據(jù)車內(nèi)人員的反饋來自動調(diào)整自動駕駛的參數(shù),直至滿足車內(nèi)人員的要求。本發(fā)明關注車內(nèi)人員的感知,對車內(nèi)人員進行歸類分析,并確定相應的自動駕駛行駛模式,并持續(xù)進行車內(nèi)情況感知,并對車輛進行自適應控制,能夠提供更為安全和高效的自動駕駛方法和系統(tǒng)。圖1示出了根據(jù)本發(fā)明一個實施例的車輛自動駕駛系統(tǒng)100的結(jié)構示意框圖。車輛自動駕駛系統(tǒng)100包括傳感器110、輪廓信息獲得單元120、歸類單元130、自適應控制單元140。傳感器110感測車內(nèi)人員,輪廓信息獲得單元120用于獲得車內(nèi)人員的輪廓信息,歸類單元130對車內(nèi)人員進行歸類,自適應控制單元140,根據(jù)所述歸類,確定相應的自動駕駛行駛模式,并對車輛進行自適應控制。這里的輪廓信息獲得單元120、歸類單元130、自適應控制單元140可以由車載計算機的軟件、硬件或者兩者的結(jié)合來實現(xiàn),也可以由車載計算機協(xié)同云端的存儲和/或應用服務來實現(xiàn),在自動駕駛車輛內(nèi)安裝高性能嵌入式計算機系統(tǒng)來處理傳感器數(shù)據(jù),執(zhí)行感知、分析、規(guī)劃、決策和控制等任務。車內(nèi)計算機系統(tǒng)包含cpu、內(nèi)存和永久性存儲介質(zhì)等部件,以及可選的fpga、asic、dsp、gpu等計算加速部件。車內(nèi)計算機系統(tǒng)可以是單機系統(tǒng),也可以是分布式系統(tǒng)。如果是分布式系統(tǒng),其多個計算節(jié)點之間使用某種網(wǎng)絡連接(如以太網(wǎng)等)。分布式系統(tǒng)的多個節(jié)點可以是同構的、也可以是異構的,比如采用不同的體系結(jié)構和操作系統(tǒng)。車內(nèi)計算機系統(tǒng)可以獨立運行,也可以連接到云20。云端的系統(tǒng)可以存儲大量來自各個車輛上傳的駕駛員和乘客信息,并可以提供基于人臉識別和聲紋識別等的身份識別服務。這里的傳感器為廣義的概念,并不特指某一個傳感器設備,而可以是傳感器器件的集合。感測車內(nèi)人員包括感測車內(nèi)人員的圖像、聲音、質(zhì)量等等。例如感測車內(nèi)人員可以使用下述手段中的至少一個:攝像頭、壓力傳感器和麥克風、指紋識別器、紅外傳感器。關于車內(nèi)傳感器設備,可以考慮下面的設置。(1)車內(nèi)攝像頭??砂惭b一個或多個攝像頭,每個攝像頭可以是單目、雙目、深度攝像頭。安裝方式例如可以考慮下述兩種之一。安裝方式一:每個座位前方安裝一個正對人臉的攝像頭,可以清晰拍到人臉的正面。安裝方式二:可以選擇其他攝像頭安裝方式,比如使用一個攝像頭拍攝多個座位,前提是保證能拍到所有駕駛員和乘客的臉的正面。(2)每個座位上的壓力(質(zhì)量)傳感器??梢詫崟r的提供車內(nèi)乘客人數(shù)信息,也可以通過質(zhì)量信息識別乘客內(nèi)是否有小孩等粗略年齡信息。(3)麥克風。車內(nèi)麥克風可以獲取乘客的語音命令和反饋,通過自然語言處理來理解命令和反饋。并能根據(jù)聲紋來識別不同的人。麥克風安裝方式:可以車內(nèi)的中間位置安裝一個,也可以在前排的中間位置和后排的中間位置各安裝一個。以上傳感器器件僅為示例,可以視需要增加或減少傳感器器件,任何現(xiàn)有的或未來出現(xiàn)的傳感器器件均可以用于本發(fā)明。關于輪廓信息獲得單元120,這里的輪廓信息可以包括,例如但不限于,身份、年齡、性別、人臉特征、聲紋特征、健康狀態(tài)、情緒狀態(tài)、年齡等等。在一個優(yōu)選示例中,車內(nèi)人員的輪廓信息包括其偏好的行駛模式。在一個示例中,按照舒適程度,將行使模式分為舒適模式、普通模式和運動模式,舒適程度順次降低,不同的行使模式對應于不同的規(guī)劃和控制參數(shù),比如:正常加速度、超常加速度、正常減速度、超常減速度、橫向控制量最大值、安全距離、換道最小頻率、換道安全車距等。需要說明的是,即便同為舒適模式,對于不同人來說,對應的參數(shù)也可以視不同的。例如,關于舒適模式,一般對于老人來說,希望車輛開的盡量平穩(wěn),因此希望加速度低些,換道頻率低些;而一般對于青年人來說,則對于平穩(wěn)性沒有如此高的要求。因此,優(yōu)選地,可以針對每個人定制其偏好的自動駕駛模式。圖2示出了根據(jù)本發(fā)明一個實施例的輪廓信息獲取單元模塊120的功能結(jié)構圖。輪廓信息獲取單元模塊120可以包括身份識別模塊121、輪廓信息采集模塊124、車內(nèi)人員的其他屬性和狀態(tài)檢測模塊123以及輪廓信息綜合模塊122。在一個示例中,輪廓信息可以如下獲得:首先,由身份識別模塊121識別車內(nèi)人員的身份,例如,基于身份信息數(shù)據(jù)庫,基于車內(nèi)傳感器感測得到的人臉特征、聲紋特征、虹膜特征和紅外特征等等,通過下述身份識別技術中的一項或者其組合來識別車內(nèi)人員的身份:人臉識別、聲紋識別、指紋識別、虹膜識別、紅外識別;以及基于識別得到的車內(nèi)人員的身份,從輪廓信息數(shù)據(jù)庫檢索該車內(nèi)人員的輪廓信息,在輪廓信息數(shù)據(jù)庫中與車內(nèi)人員的身份標識相關聯(lián)地存儲了輪廓信息。這里的輪廓信息數(shù)據(jù)庫和身份信息數(shù)據(jù)庫可以是分開的,也可以是統(tǒng)一在一起共用的,這里的身份信息例如為車內(nèi)人員的id(手機號碼,身份證信息)連同車內(nèi)人員的人臉特征、聲紋特征、手紋特征、虹膜特征、紅外特征、血管特征等等能夠唯一標識一個人身份的信息,基于通過傳感器獲得的感測信息(圖像、聲音、指紋等等)和身份信息數(shù)據(jù)庫,通過識別技術來識別車內(nèi)人員的身份。輪廓信息數(shù)據(jù)庫中,與車內(nèi)人員身份標識相關聯(lián)地存儲了輪廓信息,例如姓名、年齡、性別、健康狀況、偏好的行使模式等等。在身份信息數(shù)據(jù)庫和/或輪廓信息數(shù)據(jù)庫中缺少某個車內(nèi)人員信息的情況下,輪廓信息采集模塊124來采集新人的輪廓信息,可以通過例如語音交互方式來錄入一些基本資料,比如姓名、年齡、性別、偏好的行駛模式等;車內(nèi)攝像頭可以拍攝多張照片,以及錄制語音聲紋、指紋等等,將這些信息形成身份信息記錄和/或輪廓信息記錄存儲在身份信息數(shù)據(jù)庫和/或輪廓信息數(shù)據(jù)庫中。除了獲得身份信息數(shù)據(jù)庫和/或輪廓信息數(shù)據(jù)庫中已有的輪廓信息外,還可以由車內(nèi)人員的其他屬性和狀態(tài)檢測模塊123實時地獲得當前的車內(nèi)人員信息,例如通過對攝像頭拍攝的圖像進行圖像處理、通過測量車內(nèi)人員的血壓、心跳等等、或者通過與車內(nèi)人員的語音交互來獲得車內(nèi)人員當前的情緒狀態(tài)和當前的健康狀況。輪廓信息綜合模塊122綜合來自輪廓信息數(shù)據(jù)庫的信息、輪廓信息采集模塊134采集的信息以及車內(nèi)人員的其它屬性和狀態(tài)檢測模塊123的信息,得到各個車內(nèi)人員的輪廓信息,以供后續(xù)的歸類單元和自適應控制單元使用。圖2中所示的身份識別模塊121(包括人臉識別模塊、聲紋識別模塊、虹膜識別模塊、指紋識別模塊等)等模塊和輪廓信息數(shù)據(jù)庫、身份信息數(shù)據(jù)庫可以運行和存儲在車載計算機和/或云端?;氐綀D1,歸類單元130對車內(nèi)人員進行歸類。例如,基于輪廓信息獲得單元120獲得的車內(nèi)人員的輪廓信息,判斷各個車內(nèi)人員所屬的類別,例如對車內(nèi)人員進行歸類包括:確定每個車內(nèi)人員是否為病人;確定每個車內(nèi)人員是否是老人、小孩或殘疾人;以及確定是否每個人都設置了所偏好的駕駛模式。自適應控制單元140根據(jù)所述歸類,確定相應的自動駕駛行駛模式,并對車輛進行自適應控制。自適應控制單元140根據(jù)所述歸類,確定相應的自動駕駛行駛模式包括:確定車內(nèi)人員是否有病人,如果有病人,則確定自動駕駛模式為舒適模式;如果車內(nèi)人員沒有病人,則確定車內(nèi)每個人是否都有偏好的駕駛模式,如果車內(nèi)每個人都有偏好的駕駛模式,則使用這些偏好的駕駛模式之中舒適度最高的駕駛模式;以及如果并非車內(nèi)每個人都有偏好的駕駛模式,則確定不具有偏好的駕駛模式的人中是否存在老人、小孩或者殘疾人;以及如果存在,則使用舒適模式。上述對車內(nèi)人員的歸類僅為優(yōu)選示例,可以根據(jù)需要來進行不同的歸類。后續(xù)將結(jié)合方法流程圖來詳細說明自適應控制的過程。圖3示出了根據(jù)本發(fā)明另一實施例的車輛自動駕駛系統(tǒng)200的結(jié)構框圖。相比于圖1,車輛自動駕駛系統(tǒng)200還包括反饋接收單元250。圖3中的傳感器210、輪廓信息獲得單元220和歸類單元230的結(jié)構和工作過程可以與圖1所示的對應部分類似,這里不再贅述。反饋接收單元250在行駛過程中,持續(xù)接收車內(nèi)人員的反饋,自適應控制單元240根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)。有關接收車內(nèi)人員的反饋的方式,可以為語音方式,通過語音識別模塊來識別車內(nèi)人員的反饋,例如比如“開快點、開慢點、開穩(wěn)點、別太肉”等等;也可以為其他方式,例如在車上提供預定的實體控制按鈕供按壓等;或者是通過車內(nèi)人員的手機上的車輛駕駛控制應用來進行反饋等等;或者可以用手勢來給出反饋,這對于聾啞人特別適用;。根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)可以包括:一種是根據(jù)先驗知識由算法預設每個命令需要調(diào)整的參數(shù)和調(diào)整量;另一種是采用增強學習的方法在大量的行駛中來學習確定這些參數(shù)值。圖4示出了根據(jù)本發(fā)明另一實施例的車輛自動駕駛系統(tǒng)300的結(jié)構示意圖。相比于圖3,圖4的車輛自動駕駛系統(tǒng)300還包括駕駛模式指令接收模塊360,其它模塊310、320、330、350可以與圖3所示的對應模塊相同,這里不再贅述。駕駛模式指令接收模塊360用于接收車內(nèi)人員的顯式指定車輛行駛模式,系統(tǒng)提供若干預定義的行駛模式:比如普通模式、舒適模式、運動模式等等。有關接收車內(nèi)人員的駕駛模式指令的方式,可以為語音方式,通過語音識別模塊來識別車內(nèi)人員的駕駛模式指令,例如比如“舒適模式”、“運動模式”等等;也可以為其他方式,例如在車上提供預定的實體控制按鈕供按壓等,例如兩個按鈕,一個表示“更好了”,一個表示“更差了”,當然也可以設計更多的按鈕,也可以設計其它形式的反饋硬件等;或者可以用手勢來給出反饋,這對于聾啞人特別適用;或者是通過車內(nèi)人員的手機上的車輛駕駛控制應用來進行反饋等等。在一個示例中,所述傳感器還感測車內(nèi)是否存在特定動物和/或特定物品,以及自適應控制單元基于感測到車內(nèi)存在特定動物和/或特定物品,確定相應的自動駕駛行駛模式。例如,感測車內(nèi)是否存在易碎品,例如瓷器、玻璃制品等,車內(nèi)是否存在某些小動物,例如小貓或小狗等,從而調(diào)整自動駕駛行使模式,如在感測到存在瓷器時,調(diào)整自動駕駛行使模式為舒適模式,以較平穩(wěn)地駕駛。下面結(jié)合附圖描述根據(jù)本發(fā)明實施例的車輛自動駕駛方法。車輛自動駕駛方法結(jié)合前文的車輛自動駕駛系統(tǒng)來實現(xiàn)。圖5示出了根據(jù)本發(fā)明一個實施例的車輛自動駕駛方法400的總體流程圖。如圖5所示,在步驟s410中,通過傳感器感測車內(nèi)人員,獲得車內(nèi)人員的輪廓信息。在步驟s420中,對車內(nèi)人員進行歸類。在步驟s430中,根據(jù)所述歸類,確定相應的自動駕駛行駛模式,并對車輛進行自適應控制。在一個示例中,車輛自動駕駛方法400還包括:在行駛過程中,持續(xù)接收車內(nèi)人員的反饋;以及根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)。根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)可以包括:響應于車內(nèi)人員對當前駕駛狀態(tài)的反饋式命令,利用預設的對應于所述反饋的參數(shù)和調(diào)整量來進行調(diào)整,所述反饋式命令指示對駕駛狀態(tài)進行確定調(diào)整。在一個示例中,當用戶不再給出反饋式命令時,可以記錄當前的參數(shù)作為該用戶的偏好的駕駛模式參數(shù),并更新該用戶的輪廓信息至輪廓信息數(shù)據(jù)庫。在一個示例中,根據(jù)車內(nèi)人員的反饋自適應調(diào)整自動駕駛的參數(shù)包括:響應于車內(nèi)人員對當前駕駛狀態(tài)的反饋式命令,采用增強學習方法進行調(diào)整。在一個示例中,車內(nèi)人員的輪廓信息可以包括,例如但不限于,身份、年齡、性別、人臉特征、聲紋特征、健康狀態(tài)、情緒狀態(tài)、年齡等等。每個人偏好的行駛模式可以由對應的行駛參數(shù)來表示,即可以針對每個人來定制起偏好的行使模式。在一個示例中,對車內(nèi)人員進行歸類包括:確定每個車內(nèi)人員是否為病人;確定每個車內(nèi)人員是否是老人、小孩或殘疾人;以及確定是否每個人都設置了所偏好的駕駛模式。在一個示例中,自動駕駛模式可以包括:舒適模式、普通模式和運動模式,以及所述根據(jù)所述歸類,確定相應的自動駕駛行駛模式包括:確定車內(nèi)人員是否有病人,如果有病人,則確定自動駕駛模式為舒適模式;如果車內(nèi)人員沒有病人,則確定車內(nèi)每個人是否都有偏好的駕駛模式,如果車內(nèi)每個人都有偏好的駕駛模式,則使用這些偏好的駕駛模式之中舒適度最高的駕駛模式;以及如果并非車內(nèi)每個人都有偏好的駕駛模式,則確定不具有偏好的駕駛模式的人中是否存在老人、小孩或者殘疾人;以及如果存在,則使用舒適模式。不同的駕駛模式對應于不同的規(guī)劃和控制參數(shù),這些參數(shù)例如有:正常加速度、超常加速度、正常減速度、超常減速度、前輪偏角和車速比的最大值、安全距離、換道最小頻率、換道安全車距等等。在一個示例中,感測車內(nèi)人員包括使用下述手段中的至少一個:攝像頭、壓力傳感器和麥克風、指紋識別器、紅外傳感器。在一個示例中,獲得車內(nèi)人員的輪廓信息包括:識別車內(nèi)人員的身份,識別車內(nèi)人員的身份包括基于身份信息數(shù)據(jù)庫,通過下述身份識別技術中的一項或者其組合來識別車內(nèi)人員的身份:人臉識別、聲紋識別、指紋識別、虹膜識別、紅外識別;以及基于識別得到的車內(nèi)人員的身份,從輪廓信息數(shù)據(jù)庫檢索該車內(nèi)人員的輪廓信息,在輪廓信息數(shù)據(jù)庫中與車內(nèi)人員的身份標識相關聯(lián)地存儲了輪廓信息。在一個示例中,在輪廓數(shù)據(jù)庫中未存儲該車內(nèi)人員的輪廓信息的情況下,接收車內(nèi)人員的輪廓信息輸入,并將其存儲到數(shù)據(jù)庫中。在一個示例中,身份識別技術中的一個或多個運行在云端服務器中,或者以本地車載計算機系統(tǒng)和云端服務器相互協(xié)作的方式運行。類似地,其它應用服務也可以運行在本地車載計算機系統(tǒng),或運行在云端,或者以本地車載計算機系統(tǒng)和云端服務器相互協(xié)作的方式運行。類似地,車內(nèi)人員的身份信息數(shù)據(jù)庫和輪廓信息數(shù)據(jù)庫中的一個或兩者可以存儲在本地計算機系統(tǒng)和/或存儲在云端存儲中,或者以相互協(xié)作的方式存儲在兩者中。在一個示例中,車輛自動駕駛方法還可以感測車內(nèi)是否存在特定動物和/或特定物品;基于感測到車內(nèi)存在特定動物和/或特定物品,確定相應的自動駕駛行駛模式。作為具體示例,下面結(jié)合圖6描述根據(jù)本發(fā)明一個實施例的示例性車輛自動駕駛方法500的更詳細過程。如圖6所示,行程開始后在每個周期內(nèi),車載自動駕駛計算機系統(tǒng)會讀取傳感器輸入,由各個感知模塊(如人臉識別、聲紋識別等)進行處理,再由識別模塊(如身份識別),最終按照一定的自適應算法來進行控制,直至行程結(jié)束。在自適應算法中可以考慮駕駛員和乘客的反饋來進行調(diào)整。如圖6所示,基于各個傳感器器件例如攝像頭、麥克風、體重傳感器等的輸入,各個識別模塊進行處理,具體地,在步驟s510由人臉識別模塊進行人臉識別,在步驟s520中由聲紋識別模塊進行聲紋識別,在步驟s530中由車內(nèi)人員其他屬性和狀態(tài)識別模塊來識別車內(nèi)人員的其他屬性和狀態(tài)。下面分別詳述之。(1)人臉識別具體地址,通過車載攝像頭實時獲取車內(nèi)的人臉圖像,根據(jù)人臉特征通過圖像處理識別駕駛員和車內(nèi)乘客人數(shù),并可以識別駕駛員和車內(nèi)乘客身份、年齡、性別、情緒等信息。人臉識別模塊可以運行在車載本地計算機系統(tǒng),或者運行在云端的服務器中,或者以協(xié)作方式運行在兩個系統(tǒng)中以獲得更佳效果。車內(nèi)人員的身份、年齡、性別、人臉特征等信息保存在車載本地計算機系統(tǒng)的永久性存儲器,以及可選的云端存儲中,例如存儲在身份信息數(shù)據(jù)庫和/或輪廓信息數(shù)據(jù)庫中,如前所述,身份信息數(shù)據(jù)庫和輪廓信息數(shù)據(jù)庫兩者可以合并為一,也可以分開存儲和組織。(2)聲紋識別具體地址,通過麥克風進行聲紋識別,需要車載聲紋識別模塊發(fā)起和乘車人的語音交互來實現(xiàn)。聲紋識別模塊可以運行在車載本地計算機系統(tǒng),或者運行在云端的服務器中,或者以協(xié)作方式運行在兩個系統(tǒng)中以獲得更佳效果。車內(nèi)人員的身份、年齡、性別、聲紋特征等信息可以保存在車載本地計算機系統(tǒng)的永久性存儲器,以及可選的云端存儲中,例如存儲在身份信息數(shù)據(jù)庫和/或輪廓信息數(shù)據(jù)庫中,如前所述,身份信息數(shù)據(jù)庫和輪廓信息數(shù)據(jù)庫兩者可以合并為一,也可以分開存儲和組織。(3)車內(nèi)人員的其他屬性和狀態(tài)檢測車內(nèi)人員的其他屬性和狀態(tài)檢測模塊通過對攝像頭、麥克風、壓力傳感器等傳感器器件感測的信息進行處理,可以檢測到更多的信息,包括人員數(shù)量、每個人的健康狀態(tài)(健康、疲勞、生病、殘疾等)、情緒狀態(tài)(快樂、悲傷、憤怒、緊張、驚訝等)、年齡(兒童、青年、中年、老人)等。車內(nèi)人員的其他屬性和狀態(tài)等信息可以保存在車載本地計算機系統(tǒng)的永久性存儲器,以及可選的云端存儲中,或者以協(xié)作方式運行在兩個系統(tǒng)中獲得更佳效果。例如存儲在身份信息數(shù)據(jù)庫和/或輪廓信息數(shù)據(jù)庫中,如前所述,身份信息數(shù)據(jù)庫和輪廓信息數(shù)據(jù)庫兩者可以合并為一,也可以分開存儲和組織?;氐綀D6,在步驟s540中,基于人臉識別s510、聲紋識別s520和車內(nèi)人員其他屬性和狀態(tài)識別s530的結(jié)果,參考本地/云端中存儲的用戶屬性(例如身份信息數(shù)據(jù)庫和輪廓信息數(shù)據(jù)庫中存儲的用戶屬性),來識別出車內(nèi)人員的身份信息,獲得車內(nèi)人員的輪廓信息。這里的輪廓信息可以是從輪廓信息數(shù)據(jù)庫檢索得到的,或者如后續(xù)的基于①的來源而輸入的(對于輪廓信息數(shù)據(jù)庫中不存在該車內(nèi)人員的記錄的情況)、或者是由車內(nèi)人員其他屬性和狀態(tài)識別收集到的,也可以是由上述各項組合得到。此外,在車輛自動駕駛方法500中存在語音命令識別和處理路徑。在步驟s570中,識別語音命令。需要說明的是,語音命令的監(jiān)測、識別和處理是存在于車輛自動駕駛的整個過程中的。在識別到語音命令后,在步驟s580中,判斷該語音命令是否為人工指定行駛模式。如果判斷結(jié)果為“是(y)”,則流程轉(zhuǎn)到步驟s550的自適應控制步驟;如果判斷結(jié)果為“否(n)”,則前進到步驟s590。在步驟s590中,判斷該語音命令是否為對行駛狀況的反饋。如果判斷結(jié)果為“是(y)”,則流程轉(zhuǎn)到步驟s550的自適應控制步驟;如果判斷結(jié)果為“否(n)”,則前進到步驟s591。在步驟s591中,判斷該語音命令是否為進行人員信息錄入。如果判斷結(jié)果為“是(y)”,則流程轉(zhuǎn)到步驟s540(如圖中的①所示),進行車內(nèi)人員信息錄入,其中在步驟s540中可以通過語音交互方式來錄入一些基本資料,比如年齡、性別、偏好的行駛模式;以及車內(nèi)攝像頭可以拍攝多張照片,以及錄制語音聲紋、指紋等等,將這些信息作為身份識別信息和/或輪廓信息存儲在車載計算機和/或云存儲上;如果判斷結(jié)果為“否(n)”,則確定其為無效命令,對其不予處理。在本示例中,語音識別模塊會識別上面這三種命令(人工指定行駛模式,對行駛狀況的反饋,人員信息錄入),并忽略其他無法識別的語音。根據(jù)需要,也可以設計、識別和處理其他命令。語音識別模塊可以運行在車載本地計算機系統(tǒng),或者運行在云端的服務器中,或者以協(xié)作方式運行在兩個系統(tǒng)中以獲得更佳效果。在步驟s550中,進行自適應控制。后面將參考圖7給出自適應控制方法示例的詳細描述。在步驟s560中,判斷是否車輛自動駕駛行程結(jié)束,如結(jié)果為“y”,則過程結(jié)果,否則返回到過程開始,繼續(xù)監(jiān)視傳感器的輸入。自適應的控制調(diào)整方法可以有兩種,一種是根據(jù)先驗知識由算法預設每個命令需要調(diào)整的參數(shù)和調(diào)整量。另一種是采用增強學習的方法在大量的行駛中來學習確定這些參數(shù)值。下面分別結(jié)合圖7和圖8對上述兩種自適應控制調(diào)整方法的示例加以描述。下面結(jié)合圖7給出根據(jù)先驗知識的自適應控制方法示例的詳細描述。圖7示出了根據(jù)本發(fā)明實施例的示例性自適應控制方法600的流程圖,自適應控制方法600可以應用于圖6所示的步驟s550。如圖7所示,在步驟s610中,基于車內(nèi)人員的輪廓信息,判斷各個車內(nèi)人員是否被歸為病人,當確定某個車內(nèi)人員被歸為病人時,流程轉(zhuǎn)到步驟s611,系統(tǒng)默認采用舒適模式。如果基于車內(nèi)人員的輪廓信息,確定車內(nèi)人員中不存在病人,則流程前進到步驟s620。在步驟s620中,判斷車內(nèi)人員是否每個人都有偏好模式,具體地址,檢查每個車內(nèi)人員的輪廓信息,看是否都設定了自己偏好的駕駛模式。如果步驟s620確定每個車內(nèi)人員都有自己偏好的駕駛模式,則轉(zhuǎn)到步驟s621,在步驟s621中,將車輛的駕駛模式設置為所有車內(nèi)人員的偏好的駕駛模式之中舒適度最高的駕駛模式。如果步驟s620確定不是每個車內(nèi)人員都有自己偏好的駕駛模式,則前進到步驟s630。在步驟s630中,判斷未設定偏好的駕駛模式中的人中是否有老人、小孩和殘疾人,如果判斷結(jié)果為是,則轉(zhuǎn)到步驟s631,在步驟s631中,默認使用舒適模式。在步驟s640中,自適應控制單元收集傳感器數(shù)據(jù),接收車內(nèi)人員的語音反饋。在步驟s650中,判斷是否存在語音反饋。在判斷結(jié)果為是的情況下,前進到步驟s660,否則跳回到步驟s640。在步驟s660中,根據(jù)每個人的語音反饋,自適應調(diào)節(jié)控制,并用這些特征來更新相應個人的行駛模式。比如自動駕駛系統(tǒng)對舒適模式提供了默認的控制參數(shù),而某個乘客要求行駛中的控制更平穩(wěn)和安全,這時他會發(fā)出命令“再穩(wěn)點”,自動駕駛系統(tǒng)收到反饋命令后會對這些參數(shù)進行細微調(diào)整。而該乘客可能會反復發(fā)出命令來調(diào)整,直到最終不再調(diào)整時,系統(tǒng)記錄該乘客的個性化的舒適模式參數(shù)作為該乘客偏好的駕駛模式,并更新該乘客的輪廓信息至身份信息數(shù)據(jù)庫和/或輪廓信息數(shù)據(jù)庫。在步驟s670中,判斷車輛是否行駛結(jié)束,例如已經(jīng)到達目的地,或者接收到乘客的停車命令等等。在步驟s670判斷車輛行駛結(jié)束的情況下,過程結(jié)束,否則返回到步驟s640。圖8示出了根據(jù)本發(fā)明另一實施例的使用增強學習方法的示例性自適應控制方法700的流程圖,自適應控制方法700可以應用于圖6所示的步驟s550。相比于圖7,圖8的不同點在于用使用增強學習方法調(diào)整參數(shù)控制量的步驟s750代替了步驟s660,以及不存在與圖7的判定是否存在語音反饋的步驟s650對應的步驟。圖8中其余的步驟和圖7中對應標號的步驟類似,這里不再贅述。圖8中去掉了語音反饋判斷步驟是因為,在增強學習方法中,將語音反饋作為增強學習方法的一個回報函數(shù)值,當車內(nèi)人員沒有語音時,也認為是存在一定回報函數(shù)值的,因此無需如圖7那樣特別判斷是否存在語音反饋來作為流程跳轉(zhuǎn)的條件。下面給出使用增強學習方法調(diào)整自動駕駛規(guī)劃和控制參數(shù)控制量的示例性實現(xiàn)的描述,該示例性實現(xiàn)可以用于圖8的步驟s750。增強學習算法有不同的分類,比如蒙特卡羅方法和時間差分法,但這些方法的共同點和核心包括狀態(tài)集、動作集、回報函數(shù)。在一個示例中,狀態(tài)集、動作集、回報函數(shù)定義如下。狀態(tài)集s:s1:縱向車速s2:縱向加速度s3:橫向速度s4:橫向加速度s5:和本車道前車之間距離s6:和本車道后車之間距離s7:和左側(cè)車道前車之間距離s8:和左側(cè)車道后車之間距離s9:和右側(cè)車道前車之間距離s10:和右側(cè)車道后車之間距離s11:期望的縱向車速s12:期望的橫向車速s13:期望變道的方位上面所有的狀態(tài)都是離散化后的區(qū)間值。動作集a:a1:油門為0,剎車為0,前輪偏角為0a2:油門為0,剎車為0,前輪偏角為+0.5度a3:油門為0,剎車為0,前輪偏角為+1度…a51:油門為0,剎車為0,前輪偏角為+25度a52:油門為0,剎車為0,前輪偏角為-0.5度a53:油門為0,剎車為0,前輪偏角為-1.0度…a100:油門為0,剎車為0,前輪偏角為-25度a101:油門為1,剎車為0,前輪偏角為0a102:油門為2,剎車為0,前輪偏角為0a103:油門為3,剎車為0,前輪偏角為0a104:油門為4,剎車為0,前輪偏角為0a105:油門為0,剎車為1,前輪偏角為0a106:油門為0,剎車為2,前輪偏角為0a107:油門為0,剎車為3,前輪偏角為0a108:油門為0,剎車為4,前輪偏角為0上面所有的動作(油門、剎車和前輪偏角)是離散化后的值?;貓蠛瘮?shù)r:車內(nèi)人員的反饋,此時的反饋信息是用車內(nèi)人員的滿意度來衡量,分為5個離散值如下表所示,其中如表中第4行所示,對于沒有反饋的情況,將其回報函數(shù)值r設置為0,視為與車內(nèi)人員回應(例如以語音方式)以“一般”“正好”的情況相同。此表的反饋信息與回報函數(shù)值r之間的對應設置僅為示例,本領域技術人員可以根據(jù)情況來進行設計。反饋信息回報r非常糟糕-2更差了-1一般、正好或沒有反饋0更好了+1非常好+2作為增強學習方法中的時間差分法類型的例子,以q-learning算法為例,示例性流程如下:1.初始化q(s,a)為任意值2.重復下面的循環(huán)直到policy的變化量小于預設的閾值·初始化s為任意值·重復下面的步驟直到s為終止狀態(tài)·應用q中的policyπ(s,a)(比如采用ε-greedy方法),對當前狀態(tài)s選擇一個動作α·執(zhí)行動作α,觀察即時回報r,以及下一個狀態(tài)s′·q(s,a)+=α[r+γmaxa′q(s′,a′)-q(s,a)]·s=s′在上面的算法中,a是控制學習速度的系數(shù)。ε-greedy方法的公式如下:ε∈[0,1]這里,優(yōu)選地,自適應規(guī)劃和控制模塊運行在車載本地計算機系統(tǒng)上。在前面的示例性描述中,自動駕駛模式被描述為包括舒適模式、普通模式和運動模式。此僅為示例,視需要可以進行更細致的分類,或者進行更粗粒度的分類。需要說明的是,在圖7和圖8中,以語音反饋作為反饋方式的例子,但這僅為示例,可以視情況采用其它的反饋方式,例如車上設置的實體按鈕,乘客手機上的app程序,乘客的手勢等等。本文中的車輛應該做廣義解釋,除了包括陸地上行駛的各種大中小型車輛外,還可以包括水面上行駛的輪船,乃至空中駕駛的飛行器等。應該注意,以上討論的方法、系統(tǒng)和設備僅意圖作為例子。需要強調(diào)的是,各個實施例可以在適當時省略、替換或者添加各種過程或者組件。例如,應該理解,在替換實施例中,可以按與所述不同的順序進行方法,并且可以添加、省略或組合各個步驟。而且,可以在各種其他實施例中組合關于某些實施例所述的特征。可以按類似的方式組合實施例的不同方面和要素。而且,應該強調(diào),技術不斷發(fā)展以及因此本文所示例的許多要素僅是例子,而不應被解釋為限制本發(fā)明的范圍。此外,可以通過硬件、軟件、固件、中間件、微代碼、硬件描述語言或其任意組合來實現(xiàn)實施例。當以軟件、固件、中間件或微代碼實現(xiàn)任務時,用于進行任務所需的程序代碼或者碼段可以存儲在諸如存儲介質(zhì)的計算機可讀介質(zhì)中,處理器可以進行所需的任務。以上已經(jīng)描述了本發(fā)明的各實施例,上述說明是示例性的,并非窮盡性的,并且也不限于所披露的各實施例。在不偏離所說明的各實施例的范圍和精神的情況下,對于本
技術領域:
的普通技術人員來說許多修改和變更都是顯而易見的。因此,本發(fā)明的保護范圍應該以權利要求的保護范圍為準。當前第1頁12