專利名稱:用于控制計算器系統(tǒng)的裝置和方法
用于控制計算器系統(tǒng)的裝置和方法
背景技術(shù):
復(fù)雜半導(dǎo)體器件如微控制器(nC)或ASIC的制造容易出現(xiàn)錯誤. 由于隨著結(jié)構(gòu)尺寸變得越來越小而使摻雜成為統(tǒng)計過程,因此即使長 期的錯誤也在制造過程中不可避免。甚至有跡象表明,盡管存在巨大 的努力和進步未來錯誤的出現(xiàn)率還將上升.產(chǎn)率,即正確工作的器件 與制造好的器件數(shù)量的比值對主導(dǎo)的制造過程來說大約是90% (即在 此已經(jīng)有10%的廢品),但是還有可能出現(xiàn)低得多的值。用于提高產(chǎn) 率的機制罔此直接降低了成本。此外出于測試和制造的考慮強化了能 夠在現(xiàn)場應(yīng)付出現(xiàn)錯誤的器件的要求。
為了在運行時容忍在制造存儲器器件如閃存、RAM或R0M時的錯誤, 目前已經(jīng)部分采用的手段是使用糾錯碼(ECC),在這種手段中除了存 儲數(shù)據(jù)位之外還一起存儲校驗位.校驗位使得在只有一位(或已知最 大數(shù)量的位)出現(xiàn)錯誤時可以通過附加邏輯檢測和校正該錯誤.這使 得整個器件(或者一個器件的相應(yīng)子部件)即使在出現(xiàn)錯誤時也提供 正確的結(jié)果,校驗位的一起存儲需要很多的附加花費,而必要的附加 邏輯實際上不會引起很多的附加成本.
半導(dǎo)體電路、尤其是計算器系統(tǒng)中的錯誤也可能在該電路運行時 出現(xiàn),在大多數(shù)情況下不可能在出現(xiàn)永久錯誤時也保證系統(tǒng)形式的高 度可用性.幾個例外之一是用于存儲器的ECC機制.對于處理器中、 尤其是CPU中的瞬時錯誤,公知恢復(fù)或復(fù)位措施。但對于執(zhí)行單元中 的錯誤還不知道用于容許永久錯誤的現(xiàn)實的、廉價的概念.
發(fā)明內(nèi)容
本發(fā)明要解決的第一技術(shù)問題是改善^C或半導(dǎo)體器件的制造過程 的產(chǎn)率,尤其是通過也能使用具有錯誤功能單元的器件來改善.本發(fā)
明要解決的第二技術(shù)問題是提高器件在運行時的可用性.為此要提供 用于識別器件中出現(xiàn)錯誤的執(zhí)行單元(例如核、ALU、處理器)的裝置, 而且實現(xiàn)"優(yōu)雅降級"或使用該器件的系統(tǒng)在運行時的緊急啟動.考察一種半導(dǎo)體電路如nc,該半導(dǎo)體電路包含至少兩個相同或相
同類型的功能單元.在制造過程結(jié)束時、在安裝時、在診斷時或在運 行時的測試階段,借助測試程序識別潛在的有錯的功能單元,這優(yōu)選 可以借助例如在切換和比較單元中示出的切換和比較功能來進行,該 切換和比較單元將一個功能單元的輸出信號與至少一個另外的功能單 元的輸出信號和/或與其它參考值相比較,在存儲元件中存儲哪些功能 單元出現(xiàn)了錯誤.這些功能單元例如由切換和比較單元或者通過中斷 裝置停用.盡管器件包含有錯的功能單元,但是該器件仍然能夠使用 并工作.
優(yōu)選地描述一種用于控制具有至少兩個相同或相同類型的功能單 元的計算器系統(tǒng)的方法,其中根據(jù)預(yù)定條件啟動和/或停用功能單元.
優(yōu)選地描述一種方法,其特征在于,功能單元的啟動和/或停用根 據(jù)至少一個用于識別計算器系統(tǒng)中錯誤的第一方法步驟的結(jié)果和/或 至少一個用于使別有錯的功能單元的第二方法步驟的結(jié)果來進行,
優(yōu)選地描述一種方法,其特征在于,所述計算器系統(tǒng)包括至少兩 個相同或相同類型的功能單元,在計算器系統(tǒng)的該至少兩個相同或相 同類型的功能單元的至少兩個運行模式之間切換,第一運行模式相當(dāng) 于比較模式,第二運行模式相當(dāng)于性能模式。
優(yōu)選地描述一種方法,其特征在于,在比較模式中識別在待比較 功能單元的輸出信號中的錯誤,該比較模式相當(dāng)于用于識別計算器系 統(tǒng)中的錯誤的第一方法步驟。
優(yōu)選地描述一種方法,其特征在于,將計算器系統(tǒng)的選定的功能 單元切換到這樣一個運行模式下,在該運行模式中有錯功能單元的識 別通過比較該功能單元的輸出信號與參考值來實現(xiàn),該運行模式相當(dāng) 于用于識別計算器系統(tǒng)中的有錯功能單元的笫二方法步驟.
優(yōu)選地描述一種方法,其特征在于,所述參考值存儲在計算器系 統(tǒng)的存儲裝置中,在切換到用于識別錯誤的運行模式時從該存儲裝置 中讀取該參考值.
優(yōu)選地描述一種方法,其特征在于,在計算器系統(tǒng)運行期間周期 地或者應(yīng)要求在至少兩個運行模式之間切換。
優(yōu)選地描述一種方法,其特征在于,在至少兩個運行模式之間的 切換是為了識別錯誤和/或識別有錯的功能單元而進行的。優(yōu)選地描述一種方法,其特征在于,至少為計算器系統(tǒng)的被識別 為有錯的功能單元形成配置狀態(tài)和/或錯誤狀態(tài),
優(yōu)選地描述一種方法,其特征在于,功能單元的停用這樣進行, 將關(guān)于該功能單元的配置狀態(tài)或錯誤狀態(tài)的信息存儲在存儲裝置中, 使得該信息可以在半導(dǎo)體系統(tǒng)初始化和/或運行時被讀取出,并且處理 所存儲的信息,使得不能在運行時使用標記為有錯的單元.
優(yōu)選地描述一種方法,其特征在于,為計算器系統(tǒng)的所有可被啟 動和/或可被停用的功能單元形成配置狀態(tài)和/或錯誤狀態(tài),
優(yōu)選地描述一種方法,其特征在于,將關(guān)于可被啟動和/或可被停 用的功能單元的配置狀態(tài)和/或錯誤狀態(tài)的信息存儲在存儲裝置中.
優(yōu)選地描述一種方法,其特征在于,所述計算器系統(tǒng)包括至少兩 個相同或相同類型的功能單元,所述相同或相同類型的功能單元中至 少一個功能單元在計算器系統(tǒng)中按照標準被停用。
優(yōu)選地描述一種方法,其特征在于,將關(guān)于已被停用的功能單元 的配置狀態(tài)的至少 一條信息存儲在存儲裝置中.
優(yōu)選地描述一種方法,其特征在于,在識別出有錯的功能單元之 時或之后對計算器系統(tǒng)轉(zhuǎn)換配置,使得至少被識別為有錯的功能單元 遭到停用.
優(yōu)選地描述一種方法,其特征在于,在由于錯誤而停用功能單元 的情況下,將關(guān)于該功能單元的配置狀態(tài)和/或錯誤狀態(tài)的信息寫入存 儲裝置中.
優(yōu)選地描述一種方法,其特征在于,在識別出有錯的功能單元之 時或之后對計算器系統(tǒng)轉(zhuǎn)換配置,其中停用被識別為有錯的功能單元, 并啟動按照標準被停用、但沒有錯的功能單元.
優(yōu)選地描述一種方法,其特征在于,用于識別錯誤的第一方法步 驟相當(dāng)于計算器系統(tǒng)的至少兩個相同或相同類型的功能單元按照規(guī)定 運行在比較模式下。
優(yōu)選地描述一種方法,其特征在于,用于識別有錯的單元的第二 步稞相當(dāng)于在至少一個功能單元上運行錯誤識別例程以及將錯誤識別 例程的結(jié)果與參考值相比較.
優(yōu)選地描述一種方法,其特征在于,在執(zhí)行用于識別有錯單元的 方法之前或之時對計算器系統(tǒng)轉(zhuǎn)換配置,該轉(zhuǎn)換配置使得可以在相同或相同類型的功能單元上執(zhí)行不同的功能、指令、程序段或程序.優(yōu)選地描述一種方法,其特征在于,將錯誤識別例程的參考值與 錯誤識別例程一起存儲在存儲裝置中.優(yōu)選地描述一種方法,其特征在于,在識別出有錯的功能單元之 時或之后對計算器系統(tǒng)轉(zhuǎn)換配置,使得至少被識別為有錯的功能單元 遭到停用。優(yōu)選地描述一種方法,其特征在于,在由于錯誤而停用功能單元 的情況下,將該功能單元的配置狀態(tài)和錯誤狀態(tài)寫入存儲裝置中.優(yōu)選地描述一種方法,其特征在于,在轉(zhuǎn)換計算器系統(tǒng)的配置之 前用于在第一運行模式中處理的功能、指令、程序段或程序的至少一 部分在該計算器系統(tǒng)轉(zhuǎn)換配置之后在第二運行模式中處理.優(yōu)選地描述一種方法,其特征在于,所述第一運行模式相當(dāng)于比 較模式,第二運行模式相當(dāng)于只有一個功能單元啟動的性能模式或錯誤模式,優(yōu)選地描述一種方法,其特征在于,功能單元的停用通過中斷與 計算器系統(tǒng)的功能單元的電連接或者計算器系統(tǒng)的功能單元之間的電 連接來不可逆地進行。優(yōu)選地描述一種方法,其特征在于,中斷在計算器系統(tǒng)中的電連 接通過電作用于所述連接的至少一部分來實現(xiàn).優(yōu)選地描述一種方法,其特征在于,功能單元的啟動和/或停用在 計算器系統(tǒng)運行期間并且使用是計算器系統(tǒng)的部件或者總是與計算器 系統(tǒng)連接的裝置來進行.優(yōu)選地描述一種用于控制具有至少兩個相同或相同類型的功能單 元的計算器系統(tǒng)的裝置,其特征在于,具有根據(jù)預(yù)定條件啟動和/或停 用功能單元的裝置.優(yōu)選地包含一種裝置,其特征在于,具有用于識別計算器系統(tǒng)中 的錯誤和/或識別有錯功能單元的裝置。優(yōu)選地包含一種裝置,其中該裝置包含切換裝置,該切換裝置使 得可以在計算器系統(tǒng)的至少兩個相同或相同類型的功能單元的至少兩 個運行模式之間切換,笫一運行模式相當(dāng)于比較模式,第二運行模式 相當(dāng)于性能模式.優(yōu)選地包含一種裝置,其特征在于,該裝置包括用于將計算器系統(tǒng)的選定的功能單元切換到這樣一個運行模式下的單元,在該運行模 式中有錯功能單元的識別通過比較該功能單元的輸出信號與參考值來 實現(xiàn).優(yōu)選地包含一種裝置,其特征在于,該裝置包括比較裝置,用于 將功能單元的輸出信號與至少一個其它功能單元的輸出信號或者與參 考值相比較,并且在出現(xiàn)差異時產(chǎn)生錯誤信息.優(yōu)選地包含一種裝置,其特征在于,該裝置包括存儲裝置,在該 存儲裝置中存儲針對功能單元的輸出信號的參考值,并且還包括用于 將來自存儲裝置的參考值輸入比較裝置的單元.優(yōu)選地包含一種裝置,其特征在于,具有用于為計算器系統(tǒng)的所 有可被啟動和/或可被停用的功能單元形成配置狀態(tài)和/或錯誤狀態(tài)的 單元,優(yōu)選地包含一種裝置,其特征在于,該裝置包含用于存儲數(shù)據(jù)的 單元,在該數(shù)據(jù)中存儲關(guān)于可被啟動和/或可被停用的功能單元的配置 狀態(tài)或錯誤狀態(tài)的至少一條信息。優(yōu)選地包含一種裝置,其中所述用于存儲數(shù)據(jù)的單元是非易失存 儲裝置,優(yōu)選地包含一種裝置,其特征在于,具有在初始化計算器系統(tǒng)時 和/或在計算器系統(tǒng)運行時讀取存儲在存儲裝置中的功能單元的配置 狀態(tài)和/或錯誤狀態(tài),并根據(jù)讀取的數(shù)據(jù)和比較裝置的錯誤信號啟動和 /或停用功能單元的單元。優(yōu)選地包含一種裝置,其中包含可以非可逆地停用功能單元的單元,優(yōu)選地包含一種裝置,其包括為了非可逆地停用功能單元而中斷 與該功能單元的或者在該功能單元內(nèi)的至少一個電連接的單元.優(yōu)選地包含一種裝置,其包括可以通過電作用于至功能單元或功 能單元中的電連接的至少一部分來中斷該電連接的單元.優(yōu)選地包舍一種裝置,其特征在于,具有為了識別錯誤、用于啟 動和/或停用功能單元而作為計算器系統(tǒng)的部件或者一直與該計算器 系統(tǒng)連接的單元。其它優(yōu)點和優(yōu)選實施方式由權(quán)利要求的特征以及描述給出.
圖1示出具有開關(guān)邏輯和處理邏輯的通用切換部件,圖2示出切換部件與存儲元件的連接,閨3示出采用存儲元件來提高產(chǎn)率的原理方法,圖4示出用于提高可用性、優(yōu)雅降級和緊急運行的原理方法,圖5示出切換部件與影響部件的連接,圖6示出采用影響部件提高產(chǎn)率的原理方法,圖7示出可能存儲元件的結(jié)構(gòu)。
具體實施方式
下面,執(zhí)行單元既表示處理器/核/CPU,也表示FPU (浮點單元)、 DSP (數(shù)字信號處理器)、協(xié)處理器或ALU (算術(shù)邏輯單元).圖1首先示出切換和比較單元的一般情況,以及針對多于兩個執(zhí)行 單元的使用。從n個要考慮的執(zhí)行單元向切換和比較部件N100輸出n 個信號N140,…,N14n.該切換和比較部件N100可以從該輸入信號中產(chǎn) 生多達n個輸出信號N160,…,N16n.在最簡單的情況下,即"純性能 模式",所有信號N14i導(dǎo)向?qū)?yīng)的輸出信號N16i。在相反的極限情況 下,即"純比較模式",所有信號N140,…,N14n僅導(dǎo)向恰好一個輸出 信號N16i'在圖1中可以考慮如何能形成不同的模式.為此在NIOO中包含開關(guān) 邏輯N110的邏輯部件。首先開關(guān)邏輯的任務(wù)是確定哪些輸入端沒有接 通到輸出端,即哪些輸入端被忽略掉了、沒有結(jié)果或被抑制了。開關(guān) 邏輯的該功能在下面通常也稱為開關(guān)邏輯的笫一功能.此外,開關(guān)邏 輯N110要確定到底存在多少輸出信號,以及哪一些輸入信號用于產(chǎn)生 哪一些輸出信號.在此一個輸入信號最多用于產(chǎn)生恰好一個輸出信號. 開關(guān)邏輯的該功能在下面通常稱為開關(guān)邏輯的第二功能.因此,不截止信號地按照數(shù)學(xué)形式另外公式化地通過開關(guān)邏輯定義 一個函數(shù),該函數(shù)向集合{N140,...,N14n}的每個元素分配集合 (N160,…,N16n)的一個元素. 一般地利用對單個輸入信號的截止,通 過開關(guān)邏輯來定義一個函數(shù),該函數(shù)向集合(N140,…,N14n)的確定子 集(未被截止的信號)的每個元素分配集合(N160,…,N16n)的一個元 素.然后處理邏輯N120對每個輸出端N16i確定輸入端以什么樣的形式用于產(chǎn)生該輸出信號,為了示例性描述不同的變化可能,在不限制一 般性的條件下假定輸出N160通過信號N141, ..., N14m產(chǎn)生。如果m = 1, 則這簡單地表示該信號的導(dǎo)通,如果m=2則將信號N141、 N142相比較。 該比較可以同步或異步地執(zhí)行,該比較可以按照位來執(zhí)行或只針對有 效位執(zhí)行或還同時具有容差帶地執(zhí)行.優(yōu)選的可能在于,執(zhí)行單元運 行在時鐘同步模式下(即在相同的時鐘內(nèi)具有相同的指令).但是固 定的時鐘差或相位差也是優(yōu)選的解決方案. 如果m〉-3則存在多種可能.第一種可能在于,比較所有信號并且當(dāng)存在至少兩個不同的值時檢 測到錯誤,對該錯誤可選擇加以通知。第二種可能在于,進行m選k (k>m/2).這可以通過使用比較器來 實現(xiàn)??蛇x地,如果這些信號之一被識別為有偏差,則產(chǎn)生錯誤信號. 如果全部3個信號都不同,則可以產(chǎn)生可能不同的錯誤信號.第三種可能在于,將這些值引入一個算法中.這例如可以是形成平 均值、中值,或使用容錯的算法(FTA).這樣的FTA基于刪除輸入值 的極值并采用對剩余值求平均值的類型.這種求平均值可以在剩余值 的整個集合上進行,或者優(yōu)選在很容易用HW形成的子集上進行,在這 種情況下不總是需要實際比較這些值。在形成平均值時,例如只需要 相加和相除,F(xiàn)TM、 FTA或中值需要部分的分類.必要時還可以在極值 足夠大時選擇輸出錯誤信號,為簡要起見,將多個信號處理為一個信號的上述不同可能簡稱為比 較運算.處理邏輯的任務(wù)因此就是對每個輸出信號并因此也對所屬的輸入信 號確定比較運算的精確構(gòu)成。下面將其稱為處理邏輯的第二功能.由 此一般可以實現(xiàn)的對有錯執(zhí)行單元的識別在下面稱為處理邏輯的笫一 功能.開關(guān)邏輯N110 (即上述函數(shù))的信息和處理邏輯(即針對每個輸出 信號即每個函數(shù)值確定比較運算)的信息的組合是模式信息,而且該 模式信息確定了模式。該信息在通常情況下自然是多值的,即不僅僅 通過一個邏輯位表示。不是所有理論上可想到的模式在給定的實施中 都是有意義的,優(yōu)選要限制所允許的模式的數(shù)量.要強調(diào)的是,在只有兩個執(zhí)行單元的情況下,此時只存在一個比較模式,整個信息可以 濃縮到一個邏輯位.從性能模式到比較模式的切換在一般情況下的特征在于,在性能模 式中反映到不同的榆出的執(zhí)行單元在比較模式下反映到相同的輸出上 的.這一點優(yōu)選的這樣來實現(xiàn),存在執(zhí)行單元的子系統(tǒng),其中在性能模式中要在子系統(tǒng)中考慮的所有輸入信號N14i直接接通到對應(yīng)的輸出 信號N16i,而在比較模式中這些輸入信號要反映到一個輸出上,可替 換的,該切換可以通過更改配對來實現(xiàn).由此表示,在一般情況下不 能稱為性能模式和比較模式,雖然在本發(fā)明所給定的實施方式中可以 限制所允許的模式的集合,使得可以是這種情況.但是總是稱為從性 能模式切換到比較模式(反之亦然).下面描述如何借助這種切換和比較部件以及一些其它元件在特定條 件下提高半導(dǎo)體器件如JiC在制造過程中的產(chǎn)率.基本思想粗略地描述如下在該器件例如HC上需要比在運行時更多的執(zhí)行單元.由此在運行時也可以用少于正確工作的執(zhí)行單元的全部數(shù)量的執(zhí)行 單元工作.前提是,未正確工作的單元被識別出并且對整個系統(tǒng)沒有 影響.上述切換和比較單元的使用使得可以通過開關(guān)邏輯N110防止有 錯的執(zhí)行單元的信號在系統(tǒng)中進一步傳播.處理邏輯N120使得可以對不同的執(zhí)行單元的信號進行比較.通過合 適的比較可以識別出有錯的執(zhí)行單元.這在采用足以覆蓋錯誤的測試 程序時得以實現(xiàn)。必要時還可以一起采用用于識別的外部裝置.通過在某個時刻如在帶端、在初始化時刻或在安裝時進行這樣的測 試,將結(jié)果(即對有錯的執(zhí)行單元的清楚識別)存儲在盡可能非易失 的存儲器中,以及讓該結(jié)果影響開關(guān)邏輯NllO,使得有錯的執(zhí)行單元 的信號沒有影響力,可以獲得這樣一種nC,即使存在有錯的執(zhí)行單元 該W的正確工作的執(zhí)行單元仍然可以使用。通過這種在產(chǎn)品中實現(xiàn)的容錯性可以提高產(chǎn)率,因為這樣一來只要 仍然正確工作的執(zhí)行單元的數(shù)量足夠大,就可以一直使用有錯的器件, 這取決于應(yīng)用。下面詳細介紹該思想。切換和比較單元的可能的邏輯結(jié)構(gòu)如上所述。但是為了使用在此描述的本發(fā)明,優(yōu)選地不需要這些部件這樣存在,而且也不需要公知的 子部件一開關(guān)和處理邏輯.對于開關(guān)邏輯的第一功能有決定意義的是,可能有錯的部件的輸出 可以按照合適的形式來忽略.這可以通過例如用開關(guān)中斷這些輸出來 實現(xiàn).另一個可能是,將這些輸出接通到針對有錯信號的一個標準"接受器(Auffaenger)"上。另一個可能在于,將該輸出信號標記為無 效.附加或替換的另一個可能在于,通過停用相應(yīng)的部件本身來防止 這種輸出信號的出現(xiàn)。這又可以通過停用部件、停止、中斷時鐘或中 斷輸入信號來實現(xiàn).這也具有最小化損耗功率并由此優(yōu)化壽命、可靠 性和溫度負荷的優(yōu)點.下面將所有其輸出可以通過某一種手段被忽略 掉的執(zhí)行單元稱為消極或停用.首先對處理邏輯的第一功能起決定意義的是,可以識別出有錯的部 件.優(yōu)選的可能性在于,讓所有執(zhí)行單元并行地執(zhí)行相同的程序。優(yōu) 選但非必要的,可以通過將執(zhí)行單元運行在時鐘同步模式下或者具有 固定的時鐘差或相位差地運行來實現(xiàn).由此通過合適的比較可以通過 多數(shù)判決識別出可能存在錯誤的部件。可選的,在制造測試、初始化 測試或帶端測試中另外還可以通過外部單元(監(jiān)視狗,其它nC,測試 設(shè)備,ASIC)將該程序的結(jié)果與亊先知道的結(jié)果相比較.這尤其是在 僅存在兩個執(zhí)行單元時特別有利,因為在這種情況下在兩個執(zhí)行單元 之間出現(xiàn)差異時需要第三方信息來識別有錯的執(zhí)行單元.這樣的比較 可以在上述比較運算之外實現(xiàn),即僅成對地或僅對子集執(zhí)行該比較, 直到可以唯一地識別出可能有錯的執(zhí)行單元。由此作為第 一功能的結(jié) 果,處理邏輯一定會識別出有錯的部件.測試程序必須這樣構(gòu)造,錯誤以盡可能大的概率產(chǎn)生影響.為了開 發(fā)這樣的程序,例如采用錯誤模型(例如固定測試模型, stuck-at-modell),運行應(yīng)用程序代碼的一部分,或者運行完整的指 令測試.在帶端測試的情況下,該帶端測試相當(dāng)于目前限制在執(zhí)行單 元上的測試程序。但是還可以將其與目前常見的帶端測試結(jié)合,并且 用這種程序只測試那些通過第一帶端測試已經(jīng)出現(xiàn)故障的器件.后一 種措施尤其是具有以下優(yōu)點只對本來屬于廢品的器件進行額外的處 理步驟.每個通過該后一種"拯救步驟"獲得的器件直接提高了制造 過程的產(chǎn)率.在處理邏輯的笫一功能識別出有錯的單元之后,必須將該信息存儲 起來.在將本發(fā)明的方法用于制造過程以提高產(chǎn)率時,優(yōu)選采用非易 失的存儲元件。然后在該存儲元件中存儲哪些執(zhí)行單元是停用的.在圖2中示出該存儲元件的功能.困2中的切換和比較單元N500 的元件N510、 N520、 N54i、 N56i具有與圖1的切換和比較單元N100 的元件N110、N120、N14i、N16i相同的功能.此外還示出存儲元件N530。 處理邏輯N520向存儲元件N530發(fā)送關(guān)于被識別為有錯的執(zhí)行單元的 信息。開關(guān)邏輯N510可以訪問該存儲元件N530,并且執(zhí)行開關(guān)邏輯的 第一功能,使得由N530標記為停用的元件實際上也是停用的,該存儲元件當(dāng)然可以位于切換和比較單元中,但是也可以位于切換 和比較單元之外,甚至位于該器件之外.例如在將^C安裝在控制設(shè)備 或PC中時可以考慮外部的元件,因為這樣可以采用外設(shè)來進行更為全 面的測試.用于提高制造時的產(chǎn)率的基本方法思想在圖3中示出,在第一步驟 N600(識別步驟)中,識別有錯的執(zhí)行單元.該識別利用處理邏輯N520 的第一功能,以及由此利用測試程序.在第二步稞N610 (存儲步驟) 中存儲錯誤信息。相應(yīng)的信息由處理邏輯N520發(fā)送給存儲元件N530. 在笫三步驟N620 (配置)中,開關(guān)邏輯N510利用來自N530的信息, 并將開關(guān)邏輯的第一功能用于根據(jù)所要求的啟動和停用來配置執(zhí)行單 元的輸出.要強調(diào)的是,這雖然可以選擇通過SW進行,但在優(yōu)選應(yīng)用 中配置不是通過SW控制來執(zhí)行的.停用的主要原因是出現(xiàn)了錯誤.但在優(yōu)選的擴'展中其它原因也可行. 從而例如甚至對完全無錯的器件也可以將執(zhí)行單元在存儲元件中標記 為停用。尤其是如果測試不僅在帶端,而且也在運行時(例如在初始化階段 或甚至在正常運行期間)執(zhí)行,就可以檢測到未在制造期間而是在運 行中出現(xiàn)的錯誤。通過如在圖1中所示的開關(guān)邏輯的第二功能(啟動 的執(zhí)行單元在運行時彼此關(guān)聯(lián))和處理邏輯的笫二功能(對接通到一 個輸出端上的信號進行比較),可以很容易也在運行時檢測到錯誤并 識別出有錯的執(zhí)行單元.如果將有錯的執(zhí)行單元標記為停用,則可以在運行中出現(xiàn)錯誤時將 識別為有錯的單元換成無錯的但是停用的單元.優(yōu)選的,為此在存儲元件N530中存儲關(guān)于該執(zhí)行單元是否只是停用或者該執(zhí)行單元還有錯 誤的信息.優(yōu)選的,不能在運行時更改給出的執(zhí)行單元是有錯的信息,圖7示出存儲元件O100(對應(yīng)于N530 )的原理上的可能結(jié)構(gòu).該存 儲元件0100包括第一存儲區(qū)0110,其中優(yōu)選對應(yīng)于執(zhí)行單元的數(shù)量而 具有存儲位置0120, ...,012n.每個存儲位置優(yōu)選通過至少一位實現(xiàn). 存儲位置012i的號碼或地址與執(zhí)行單元的號碼或標識唯一關(guān)聯(lián).在 0120中的設(shè)置為0的一位,例如表示所屬的執(zhí)行單元是啟動的。如果 設(shè)置為1,則所屬的執(zhí)行單元應(yīng)當(dāng)是停用的.該信息可以容錯或者與其 他信息關(guān)聯(lián)地存放在存儲位置0120, ..., 012n中,但是涉及該應(yīng)用的基 礎(chǔ)信息內(nèi)容仍然保持相同.可選的,另外還具有第二存儲區(qū)0140,其中優(yōu)選地對應(yīng)于執(zhí)行單元 的數(shù)量而具有存儲位置0130, ...,013n.每個存儲位置優(yōu)選通過至少一 位實現(xiàn),存儲位置013i的號碼或地址與執(zhí)行單元的號碼或標識唯一關(guān) 聯(lián)。在0130中的設(shè)置為0的一位,例如表示所屬的執(zhí)行單元是無錯的. 如果設(shè)置為1,則所屬的執(zhí)行單元應(yīng)當(dāng)是有錯的.該信息可以容錯或者 與其他信息關(guān)聯(lián)地存放在存儲位置O130,".,O13n中,但是涉及該應(yīng)用的基礎(chǔ)信息內(nèi)容仍然保持相同.可選的,該存儲區(qū)不能被寫入,或者 僅在特殊情況下可以被寫入,或者通過特殊方式被寫入,從而保證一 旦被標記為有錯的執(zhí)行單元不會被誤標記為無錯.通過采用停用但無錯的執(zhí)行單元,可以采用將該方法用于無錯的器 件的冷冗余來提高可用性和可靠性。另一個采用本發(fā)明的可能在于,實現(xiàn)優(yōu)雅降級和自我保護 (1 imp-home )模式,其前提是,在運行時通過上述處理邏輯的第二功能來發(fā)現(xiàn)錯誤。優(yōu) 選采用的方法在圖4中示出。首先在步驟N700 (錯誤發(fā)現(xiàn))發(fā)現(xiàn)錯誤, 這例如可以通過采用測試程序來進行.但如果系統(tǒng)處于比較模式,例 如通過處理邏輯和開關(guān)邏輯的笫二功能調(diào)整到該比較模式,則這樣的 錯誤發(fā)現(xiàn)在正常運行時也可以進行,即應(yīng)用軟件作為測試程序工作. 這出于兩個原因是特別有利的 一方面不需要專用的測試程序,另一 方面發(fā)揮作用的執(zhí)行單元的所有錯誤都按照這種方式被發(fā)現(xiàn)。在步驟 N705中檢查通過開關(guān)和處理邏輯的現(xiàn)有配置是否已經(jīng)能夠識別出有錯 的執(zhí)行單元,如果是,則步驟N710(用于發(fā)現(xiàn)錯誤的配置)和N7aO(識別步驟)就已經(jīng)結(jié)束,并且直接轉(zhuǎn)到步驟N730.這例如當(dāng)錯誤出現(xiàn)在 將3個執(zhí)行單元的信號進行比較的子系統(tǒng)中時就是這樣.如果(在步 稞N705 )不是這樣(例如,如果要在具有兩個在比較模式下運行的執(zhí) 行單元的子系統(tǒng)中發(fā)現(xiàn)錯誤),則必須在步驟N710中才選擇允許識別 錯誤的配置,在最簡單的情況下,這例如通過將"懷疑候選者"(即 參與產(chǎn)生了錯誤的子系統(tǒng)的所有執(zhí)行單元)與足夠多的其他執(zhí)行單元 一起通過開關(guān)邏輯N510組合為一個輸出信號。優(yōu)選的,在此又將公開 了該錯誤的SW部件用作測試程序,但是還可以采用專用的測試程序。 處理邏輯的第一功能由此允許執(zhí)行步碟N720,并識別出有錯的執(zhí)行單 元,但是替換的還可以選擇其它用于識別的方法.例如,假定一個懷 疑候選者并將它與另一個無錯的執(zhí)行單元輛合。如果沒有識別出錯誤, 則另一個執(zhí)行單元是有錯的.如果識別出錯誤,則可以推斷在該執(zhí)行 單元中出現(xiàn)錯誤.后一種方法雖然沒有提供相同的識別可靠性,但是 更容易在運行時采用,因此當(dāng)例如在汽車中恰好正在進行一個關(guān)鍵性 的、受到該器件影響的駕駛操作時是很有利的。在有錯執(zhí)行單元的識 別結(jié)束之后,運行兩個步驟N730 (存儲步猓,對應(yīng)于N610)和N740 (配置,對應(yīng)于N620 ). 要強調(diào)的是,在最后一個步驟中現(xiàn)在通過本發(fā)明的方法存在更多的 優(yōu)選可能。如果存在足夠多的無錯但停用的執(zhí)行單元,則可以如上所述重新建 立完全可以工作的系統(tǒng)。如果存在太少的無錯的執(zhí)行單元來用于正常運行,則可以讓現(xiàn)有的 軟件就像在現(xiàn)有的執(zhí)行單元上那樣良好地運行.這尤其是當(dāng)指定該系 統(tǒng)在正常情況下具有運行時保留(Laufzeitreserven)時是特別有利 的.由此可能數(shù)量減少的執(zhí)行單元也能提供足夠的性能以保證運行, 這尤其是在系統(tǒng)層上可以通過避免特別耗費性能的運行狀態(tài)(例如汽 車發(fā)動機的高轉(zhuǎn)數(shù))來支持.如果存在太少的無錯的執(zhí)行單元來用于正常運行,則可以替換地只 讓一部分應(yīng)用運行.如果存在太少的無錯的執(zhí)行單元來用于正常運行,則在笫三種可能 中可以讓應(yīng)用運行在其它模式下,例如可以棄用很強的比較模式,而 只使用較弱的比較模式或者采用性能模式,在這種情況下,雖然對于后續(xù)的運行只給出較弱的錯誤識別或容錯性,但是可能更能容忍,因 為該狀態(tài)可能只需要再保持有限的時間.這種選擇尤其是很容易用本 發(fā)明實現(xiàn),因為只需要采用在此講述的部件和方法.這些變形的組合 當(dāng)然也可以考慮。采用本發(fā)明的這種思想的另 一種基本可能在于,棄用存儲元件并使 用其它裝置來停用可能有缺陷的執(zhí)行單元,使得該執(zhí)行單元可靠和不 可逆地停用,這可以通過影響(例如分離或連接)器件中的導(dǎo)線來進 行.不同的可能是采用專用導(dǎo)線的訪保險(Antifuse)(這可以在運行時,在維護時, 在安裝時或在制造時使用),對導(dǎo)線進行機械處理(焊接,分離), 用激光、電子射線、X射線燃燒,或者用特殊的電信號和化學(xué)影響來作 用于導(dǎo)線.為此必須用影響部件來代替存儲元件。在圖5中示出該影響部件的 功能.圖5中的切換和比較單元N800的元件N810、 N820、 N84i、 N86i 具有與圖1的切換和比較單元N100的元件NllO、 N120、 NHi、 N16i 相同的功能,此外還示出影響部件N830.處理邏輯N820向影響部件 N830發(fā)送關(guān)于被識別為有錯的執(zhí)行單元的信息.該影響部件具有如上所列舉的用于影響器件中的導(dǎo)線或功能組從而使得執(zhí)行單元被停用的 裝置.N830可以是該器件中的部件,控制設(shè)備的部件或系統(tǒng)的部件, N830還可以是制造過程中的機器或這種機器的操作人員,還可以在維 護時使用該部件??蛇x的,還可以向開關(guān)邏輯發(fā)送相應(yīng)的信息,由此 該開關(guān)邏輯執(zhí)行第一功能,使得被N830標記為停用的元件實際上也停 用.采用影響部件N830來提高產(chǎn)率的基本方法思想在圖6中示出。在第 一步驟N900 (識別步驟)中,識別有錯的執(zhí)行單元.該識別利用處理 邏輯N820的第一功能,以及由此利用測試程序。在第二步稞N910中 向影響部件N830發(fā)送處理邏輯N820的錯誤信息.在第三步驟N920中, 影響部件N830利用該信息,用提供給它的裝置來影響器件中的導(dǎo)線和 功能組,使得有錯的部件停用.在可選的第四步驟N930中,開關(guān)邏輯 N810利用該信息,并將開關(guān)邏輯的笫一功能用于根據(jù)所要求的啟動和 停用來配置執(zhí)行單元的輸出,當(dāng)然還可以在運行時使用這樣的影響部件.在使用存儲元件中得到 的所有優(yōu)點也可以在此使用,因為對系統(tǒng)的作用是相同的.但是有利的是,影響部件在系統(tǒng)中作為HW部件存在.除了用于在實施例部分提到的執(zhí)行單元之外,還可以將優(yōu)選的方法 和裝置用于半導(dǎo)體電路的其它部件,如模擬/數(shù)字轉(zhuǎn)換器,定時器部件, 中斷控制器,通信控制器或控制單元,下面將半導(dǎo)體電路的所有部件 總 結(jié)為功能單元的概念.在另一個優(yōu)選實施例中,上述發(fā)明與用于其它存儲元件的ECC保 險一起采用。在這種情況下形成高度可用的器件,其中存儲器以及執(zhí) 行單元都設(shè)計為容錯的,而且因此也可以最大化產(chǎn)率,同時又保證運 行時的最佳可用性.
權(quán)利要求
1.一種用于控制具有至少兩個相同或相同類型的功能單元的計算器系統(tǒng)的方法,其中根據(jù)預(yù)定條件啟動和/或停用功能單元。
2. 根據(jù)權(quán)利要求1所迷的方法,其特征在于,功能單元的啟動和/或停用根據(jù)至少一個用于識別計算器系統(tǒng)中錯誤的第一方法步驟的 結(jié)果和/或至少一個用于使別有錯的功能單元的第二方法步驟的結(jié)果來進行.
3. 根據(jù)權(quán)利要求l所述的方法,其特征在于,所述計算器系統(tǒng)包 括至少兩個相同或相同類型的功能單元,在計算器系統(tǒng)的該至少兩個 相同或相同類型的功能單元的至少兩個運行模式之間切換,第一運行 模式相當(dāng)于比較模式,第二運行模式相當(dāng)于性能模式.
4. 根據(jù)權(quán)利要求2或3所述的方法,其特征在于,在比較模式中 識別在待比較功能單元的輸出信號中的錯誤,該比較模式相當(dāng)于用于 識別計算器系統(tǒng)中的錯誤的第一方法步驟。
5. 根據(jù)上述權(quán)利要求之一所述的方法,其特征在于,將計算器系 統(tǒng)的選定的功能單元切換到這樣一個運行模式下,在該運行模式中有 錯功能單元的識別通過比較該功能單元的輸出信號與參考值來實現(xiàn), 該運行模式相當(dāng)于用于識別計算器系統(tǒng)中的有錯功能單元的第二方法 步驟。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述參考值存儲在 計算器系統(tǒng)的存儲裝置中,在切換到用于識別錯誤的運行模式時從該 存儲裝置中讀取該參考值.
7. 根據(jù)權(quán)利要求3或5所述的方法,其特征在于,在計算器系統(tǒng) 運行期間周期地或者應(yīng)要求在至少兩個運行模式之間切換.
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,在至少兩個運行模 式之間的切換是為了識別錯誤和/或識別有錯的功能單元而進行的,
9. 根據(jù)上述權(quán)利要求之一所述的方法,其特征在于,至少為計算 器系統(tǒng)的被識別為有錯的功能單元形成配置狀態(tài)和/或錯誤狀態(tài).
10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,功能單元的停用 這樣進行,將關(guān)于該功能單元的配置狀態(tài)或錯誤狀態(tài)的信息存儲在存 儲器裝置中,使得該信息可以在半導(dǎo)體系統(tǒng)初始化和/或運行時被讀取出,并且處理所存儲的信息,使得不能在運行時使用標記為有錯的單 元。
11. 根據(jù)上述權(quán)利要求之一所述的方法,其特征在于,為計算器 系統(tǒng)的所有可被啟動和/或可被停用的功能單元形成配置狀態(tài)和/或錯 誤狀態(tài)。
12. 根據(jù)權(quán)利要求11所述的方法,其特征在于,將關(guān)于可被啟動 和/或可被停用的功能單元的配置狀態(tài)或錯誤狀態(tài)的信息存儲在存儲 器裝置中。
13. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計算器系統(tǒng) 包括至少兩個相同或相同類型的功能單元,所述相同或相同類型的功 能單元中至少一個功能單元在計算器系統(tǒng)中按照標準被停用.
14. 根據(jù)權(quán)利要求13所述的方法,其特征在于,將關(guān)于已被停用的功能單元的配置狀態(tài)的至少一條信息存儲在存儲器裝置中。
15. 根據(jù)權(quán)利要求14所述的方法,其特征在于,在識別出有錯的功能單元之時或之后對計算器系統(tǒng)轉(zhuǎn)換配置,使得至少被識別為有錯 的功能單元遭到停用.
16. 根據(jù)權(quán)利要求15所述的方法,其特征在于,在由于錯誤而停 用功能單元的情況下,將關(guān)于該功能單元的配置狀態(tài)和/或錯誤狀態(tài)的 信息寫入存儲裝置中。
17. 根據(jù)權(quán)利要求15所述的方法,其特征在于,在識別出有錯的 功能單元之時或之后對計算器系統(tǒng)轉(zhuǎn)換配置,其中停用被識別為有錯 的功能單元,并啟動按照標準被停用、但沒有錯的功能單元.
18. 根據(jù)權(quán)利要求3所述的方法,其特征在于,用于識別錯誤的 第一方法步驟相當(dāng)于計算器系統(tǒng)的至少兩個相同或相同類型的功能單 元按照規(guī)定運行在比較模式下。
19. 根據(jù)權(quán)利要求18所述的方法,其特征在于,用于識別有錯的 單元的第二步驟相當(dāng)于在至少一個功能單元上運行錯誤識別例程以及 將錯誤識別例程的結(jié)果與參考值相比較.
20. 根據(jù)權(quán)利要求19所述的方法,其特征在于,在執(zhí)行用于識別有錯單元的方法之前或之時對計算器系統(tǒng)轉(zhuǎn)換配置,該轉(zhuǎn)換配置使得 可以在相同或相同類型的功能單元上執(zhí)行不同的功能、指令、程序段或程序。
21. 根據(jù)權(quán)利要求19所述的方法,其特征在于,將錯誤識別例程 的參考值與錯誤識別例程一起存儲在存儲裝置中.
22. 根據(jù)權(quán)利要求19所述的方法,其特征在于,在識別出有錯的 功能單元之時或之后對計算器系統(tǒng)轉(zhuǎn)換配置,使得至少被識別為有錯 的功能單元遭到停用.
23. 根據(jù)權(quán)利要求22所述的方法,其特征在于,在由于錯誤而停 用功能單元的情況下,將該功能單元的配置狀態(tài)和錯誤狀態(tài)寫入存儲 裝置中,
24. 根據(jù)權(quán)利要求22所述的方法,其特征在于,在轉(zhuǎn)換計算器系 統(tǒng)的配置之前用于在第一運行模式中處理的功能、指令、程序段或程 序的至少一部分在該計算器系統(tǒng)轉(zhuǎn)換配置之后在第二運行模式中處 理.
25. 根據(jù)權(quán)利要求24所述的方法,其特征在于,所述第一運行模 式相當(dāng)于比較模式,第二運行模式相當(dāng)于只有一個功能單元啟動的性 能模式或錯誤模式,
26. 根據(jù)權(quán)利要求15或22所述的方法,其特征在于,功能單元 的停用通過中斷與計算器系統(tǒng)的功能單元的電連接或者計算器系統(tǒng)的 功能單元之間的電連接來不可逆地進行.
27. 根據(jù)權(quán)利要求26所述的方法,其特征在于,中斷在計算器系統(tǒng)中的電連接通過電作用于所述連接的至少一部分來實現(xiàn).
28. 根據(jù)上述權(quán)利要求之一所述的方法,其特征在于,功能單元 的啟動和/或停用在計算器系統(tǒng)運行期間并且使用是計算器系統(tǒng)的部 件或者總是與計算器系統(tǒng)連接的裝置來進行.
29. —種用于控制具有至少兩個相同或相同類型的功能單元的計 算器系統(tǒng)的裝置,其特征在于,具有根據(jù)預(yù)定條件啟動和/或停用功能 單元的裝置.
30. 根據(jù)權(quán)利要求29所述的裝置,其特征在于,具有用于識別計 算器系統(tǒng)中的錯誤和/或識別有錯功能單元的裝置。
31. 根據(jù)權(quán)利要求30所述的裝置,其中該裝置包含切換裝置,該 切換裝置使得可以在計算器系統(tǒng)的至少兩個相同或相同類型的功能單 元的至少兩個運行模式之間切換,第一運行模式相當(dāng)于比較模式,第 二運行模式相當(dāng)于性能模式.
32. 根據(jù)權(quán)利要求30所述的裝置,其特征在于,該裝置包括用于 將計算器系統(tǒng)的選定的功能單元切換到這樣一個運行模式下的單元, 在該運行模式中有錯功能單元的識別通過比較該功能單元的輸出信號與參考值來實現(xiàn).
33. 根據(jù)權(quán)利要求32所述的裝置,其特征在于,該裝置包括比較裝置,用于將功能單元的輸出信號與至少一個其它功能單元的輸出信 號或者與參考值相比較并且在出現(xiàn)差異時產(chǎn)生錯誤信息.
34. 根據(jù)權(quán)利要求33所述的裝置,其特征在于,該裝置包括存儲 裝置,在該存儲裝置中存儲針對功能單元的輸出信號的參考值,并且 還包括用于將來自存儲裝置的參考值輸入比較裝置的單元.
35. 根據(jù)權(quán)利要求29至34中任一項所迷的裝置,其特征在于, 具有用于為計算器系統(tǒng)的所有可被啟動和/或可被停用的功能單元形 成配置狀態(tài)和/或錯誤狀態(tài)的單元。
36. 根據(jù)權(quán)利要求29至35中任一項所迷的裝置,其特征在于, 該裝置包含用于存儲數(shù)據(jù)的單元,在該數(shù)據(jù)中存儲關(guān)于可被啟動和/或 可被停用的功能單元的配置狀態(tài)或錯誤狀態(tài)的至少一條信息.
37. 根據(jù)權(quán)利要求36所述的裝置,其中所述用于存儲數(shù)據(jù)的單元是非易失存儲裝置.
38. 根據(jù)權(quán)利要求29至37中任一項所述的裝置,其特征在于, 具有在初始化計算器系統(tǒng)時和/或在計算器系統(tǒng)運行時讀取存儲在存 儲裝置中的功能單元的配置狀態(tài)和/或錯誤狀態(tài),并根據(jù)讀取的數(shù)據(jù)和 比較裝置的錯誤信號啟動和/或停用功能單元的單元,
39. 根據(jù)權(quán)利要求29至38中任一項所述的裝置,其中包含可以 非可逆地停用功能單元的單元,
40. 根據(jù)權(quán)利要求39所述的裝置,其包括為了非可逆地停用功能 單元而中斷與該功能單元的或者在該功能單元內(nèi)的至少一個電連接的 單元,
41. 根據(jù)權(quán)利要求40所述的裝置,其包括可以通過電作用于與功 能單元的或功能單元中的電連接的至少一部分來中斷該電連接的單 元,
42. 根據(jù)權(quán)利要求29至41中任一項所迷的裝置,其特征在于, 具有為了識別錯誤、為了啟動和/或停用功能單元而作為計算器系統(tǒng)的部件或者一直與該計算器系統(tǒng)連接的單元。
全文摘要
用于控制具有至少兩個相同或相同類型的功能單元的計算器系統(tǒng)的裝置和方法,其中根據(jù)預(yù)定條件啟動和/或停用功能單元。
文檔編號G06F11/18GK101238449SQ200680029273
公開日2008年8月6日 申請日期2006年7月21日 優(yōu)先權(quán)日2005年8月8日
發(fā)明者B·米勒, E·博爾, R·格梅利克, R·韋伯爾, Y·科拉尼 申請人:羅伯特·博世有限公司