由人工智慧驱动的设计应用
英文原文:
2023年12月12日於《Semiconductor Engineering》刊登
根據現場量測結果,評估電路健康狀態與退化率(degradation rate)
汽車產業如今正在經歷一場重大轉型,電氣化(electrification)、互連性(connectivity)與自動駕駛功能的崛起,推動著更先進半導體的龐大需求。除此之"外,相關監管法規預期也將針對车用級晶片提出極具挑戰性的安全與可靠度要求。而這些需求應該在廣泛的運作條件與日益延長的产物壽命等考量下,被充分理解並予以管理。
那麼,现代汽车晶片的要求為何?
前所未有的尖端技術製程、先進 IP與繁複设计,讓车用晶片與解决方案供應商面臨製程變異(process variability)、老化(aging)與退化(degradation)所致的風險。物理缺陷是無可避免的,其中包含測試逃脫、潛在缺陷與應力引起的缺陷。一般而言,使用強度可說是一種催化劑,受到頻繁重度使用的零件會更快發生故障。
晶片本质上并不可靠,也与安全毫无相关。但是只要付出相對應的「代價」,晶片就可以根據需求變得可靠且安全。這些代價包括设计工作、增加的電路、功率與效能的經常性費用,以及不斷增加的開發成本等。
許多产物都是在動態的操作或環境條件下運作,尤其是車輛,必須應對極端天氣變化、劇烈振動、複雜的相互連結性以及驅動晶片设计的其他物理影響等。可靠度工程師會將這些因素納入任務剖析(mission profile)清單中,並在進行故障分析時加以運用。然後,這些裝置被设计成可針對代表性任務剖析達到可靠度與安全預期。通常預期使用壽命可單純以指定溫度下的工作時數呈現。特別針對汽車的可靠度分析,(預期的)「任務剖析」被定義為元件在其使用壽命和相應的工作時數內,所面臨的相關環境與功能負載的集合。最簡單的形式是以溫度為基礎的任務剖析,透過表格呈現出處於某個溫度下所經歷的時間。除此之"外,更多繁複的應用場景(像是在停車場/怠速/市區行駛/高速公路行駛等所花費的時間)也會被納入其中。在设计階段期間,我們會投入時間進行所有必要的精準審核(due diligence),以確保裝置能夠成功滿足應用要求。
在「更嚴苛」的環境中,裝置磨損速度可能會比預期地更快,而導致可靠度與品質問題。因此,目標是在於測量並解讀電路監控器(in-circuit monitor)測得的數據資料,將實測情況跟預期的情況進行比較,並提出可行見解(actionable insights)來協助應對操作/執行環境中所面臨的挑戰。
這些計算中使用的核心概念為元件所承受的強度,並根據溫度與電壓等運作條件進行評估。對於絕大多數的故障機制而言,溫度是一項強大的加速因子,通常以著名的阿瑞尼斯方程式(Arrhenius equation)進行建模。電壓越高也會導致強度增加,可以透過電壓加速(voltage acceleration)或強度因子來體現。最後,訊號的狀態(負載因子,duty factor)或活動(轉換)也在特定退化機制的惡化中扮演重要角色。
可能要復原並解讀環境監測器(電壓/溫度/訊號與電路活動/工作負載等,如果有的話)所測量的資料,才能建置可精準反映产物實際使用(in-field)狀況的任務剖析。
新思科技透過「晶片生命週期管理 (Silicon Lifecycle Management, SLM)」全方位解决方案的分析技術,在深矽(deep-silicon)可觀測性(observability)市場中扮演著領導角色。SLM 的主要差異在於能夠讓客戶透過端到端(end-to-end)解决方案使用經實際矽晶验证(silicon-proven)的感測器 IP(包含硬體與軟體)。其中涵蓋自動化實作(implementation)、利用感測器資料來加速新产物上市和良率提升(yield ramp),或者在正常現場運作期間進行洞察分析,最終實現裝置層級(device-level)和車隊層級(fleet-level)的壽命可靠度管理。
新思科技提供了一個豐富的製程、電壓與溫度(Process, Voltage and Temperature, PVT) 監測器元件資料庫,可以智慧化地嵌入设计中,在足夠的空間與時間粒度(granularity)下進行環境和活動資料監測。除此之"外,我們也提供分析輔助資料檔(晶載與晶片外元件資料庫與工具集) ,此為一種預測性架構,可將資料處理成有意義的可靠度與功能安全(functional safety)指標,並藉由數據可視化工具(dashboard)將結果轉化為可行的車隊層級摘要。
從晶片供應商所提供的平均故障時間(Meant-Time-To-Failure, MTTF)基準資料開始,累積的強度會逐漸縮短零件的預期壽命,讓實地(in-field)和雲端(cloud)的 SLM軟體能夠持續評估汽車或車隊晶片中每個元件的剩餘使用壽命(Remaining Useful Life, RUL)、故障時間(Failure-in-Time, FIT)、故障率與更新的安全操作區域 (Safe Operating Area, SOA) 等指標。整體而言,這是一種以預測為基礎的间接方法。
此外,還可以利用實地監控器所取得的現場量測資料,預測产物的各個元件、甚至完整系統的剩餘使用壽命。路徑裕度監控器 (Path Margin Monitors, PMM)、製程偵測器(Process Detectors, PD)、時序與延遲監控器(Clock and Delay Monitor, CDM)、以及UCIe監控、追蹤與修復IP (Monitor, Track and Repair, MTR IP)均提供前所未有的深矽資料,以及對電路實際狀態更直接的測量。所收集的資料會評估電路的健康狀態與退化率,以及目前的效能裕度(margin)。邏輯與记忆体 BIST 等感測器的完整性資料也是對電路所承受的所有故障、錯誤、失效與缺陷進行的直接測量。總結來看,這是一種基於觀測的直接方法。
最後,對老化、退化與磨損問題進行一致的車隊層級管理,可將零星且罕見的(裝置層級)退化事件彙總為重要趨勢與群體層級的觀測結果,並針對技術、IP與设计的韌性(resiliency)提供非凡見解。
為因應半導體壽命的全新挑戰,ISO/TR 9839「道路車輛 – 根據ISO 26262-5 對硬體進行預測性維護的應用」工作小組[1]針對第三版ISO 26262建立了一份建議清單。在這項提案中,從早期模型和设计到現場應用,對於老化或強度過大(over-stressed)狀況所造成的退化性間歇故障(degrading intermittent faults),都必須根據基於永久(permanent)和暫時性(transient)故障的考量加以管理。
预测性维护概念可作為有效的安全机制来抵御退化性间歇故障,并针对间歇故障提供充分又即时的侦测与覆盖。而前述建议的标準更新,针对预测性维护技术提出两种应用。
第一个使用案例调查由随机事件造成的故障。如果故障导致寿命提前终止(贰苍诲-辞蹿-尝颈蹿别),是因為依循可直接在線(online)測量的已知退化物理定律(degradation physical law),那麼預測技術就有助於減緩故障的影響。使用新思科技電路(in-circuit)監控器、RO、PMM、CDM、MTR以及相關分析,即可成功完成此案例。
第二个使用案例,则解决了系统性电路退化所导致的故障。在这种情况下,可使用实际(「线上」)测量的任务剖析资料来执行退化或老化模型,以进行寿命终止的计算。使用建议的基於预测的间接方法可实现这个目标,即透过分析处理新思科技监控滨笔提供的测量环境电压、温度与工作负载资料。
新思科技的 SLM 方案提供豐富的IP元件資料庫、分析原理與技術工具,可實作最高效的任務剖析與預測性維護架構。
其所提出的方法可以滿足最先進(state-of-the-art, SOTA)、直接的加速因子,乃至於基於感測器的複雜邏輯與记忆体健康狀態評估。在經濟層面上,此解决方案可在晶載(on-chip)、邊緣(edge)或雲端(cloud)平台進行實作,並提供高度差異化的見解,可用於提升可靠度並改善現場運作。
如欲瞭解新思科技 SLM 解决方案詳細資訊,請造訪我們的网站。
参考资料