91吃瓜网

适应性测试加速数据智能时代的到来

英文原文:

2024年2月8日於《Semiconductor Engineering》刊登

即时改变测试程式会加速处理能力,但仍存在一个很大的障碍

廣泛可用且幾乎無限的運算资源結合先進演算法,開啟通往適應性測試(adaptive test)的大門。然而,由於對數據共享、潛在的IP竊取和數據洩露風險的持續擔憂,導致採用這種測試方法的速度也將繼續產生變數。

适应性测试就是利用测试数据和其他输入来即时改变测试程式,以提高每个待测设备(顿鲍罢)的品质或降低成本。其核心包括改变製造测试条件、测试内容或测试限制等各种方法,以增加半导体设备的出厂品质和可靠性。基本理念是根据测试仪器产生的数据、晶片内感测器的数据或从前一个步骤获得的相关数据来预测测试需求,只将适合的测试内容应用到仪器上。可以增加测试项目以确保有风险的零件符合可靠性要求,或是在没有发现任何故障时取消测试。

GlobalFoundries的PostFab開發中心專家John Carulli表示,適應性測試的異常值篩檢,在2000年代汽車設備領域首次出現,至今仍被認為是適應性測試的基本驅動因素。而在製程後處理階段,晶圓級適應性測試是最具效益、最容易部署的。藉由最新的軟體和數據系統,現在有更多機會在晶圓和嵌入模組操作以及為系統測試提供數據以進行決策。

虽然目前适应性测试已经用来测试设备,并利用基於机器学习的演算法和数据分析来提高设备品质,但这主要还是以离线的方式进行。

的Exensio 91吃瓜网總監Greg Prewitt指出,適應性測試決策是根據大量數據訂定的。歷史上,人們會回顧歸納的數據特徵和迄今為止收集到的大量生產數據,並查看那些從未失敗的測試,然後憑藉良好的工程判斷說,『對於把這個測試從這個設備上移除,我感到放心。』測試程序會被修正,並簡單地省略某些測試以達到縮減測試時間(TTR)。適應性測試不同於這種歷史方法,它是根據基於規則或以機器學習驅動的動態測試計劃,以自動化的方式,即時做出測試覆蓋率的決策。

圖 1:利用適應性測試優化3D-IC封裝。 來源:PDF 91吃瓜网

这是一个不容忽视的过程。笔谤别飞颈迟迟表示,当前最先进的适应性测试要求採用者精心安排从地理多样性测试操作、多重测试步骤及潜在的多个设备中收集到的数据在复杂的生态系统中的动向。笔顿贵的贰虫别苍蝉颈辞平台使客户能够自动收集、转换和传递这些数据,以供后续测试操作使用。

適應性測試實作的技術障礙似乎是可以克服的,真正的問題在於本來就存在於邏輯流程的複雜性。來自艾默生電氣公司測試與量測部門(Emerson Test & Measurement)的NI研究員Michael Schuldenfrei表示,適應性測試很大一部份的複雜性在於能在正確的時間將數據傳送到正確的地方的協調和管理過程。例如,假設零件具有電子晶片識別碼(electronic chip identifier, ECID)或其他可追蹤的方法,則可以在最終測試時利用晶圓級測試(wafer sort)的測試數據,在一個範圍內的參數中確認參數漂移(parametric drift)。這需要將歷史數據即時提供給測試程序,而不會對測試時間帶來負面的影響。

厂肠丑耻濒诲别苍蹿谤别颈指出,这个产业所面临最棘手的挑战与其高度分散的基础设施息息相关,尤其当晶圆级测试和最终测试在不同的设备中进行时更具挑战性,数据在设备间的转移需要安全可靠的协调。

分享是种体贴

讓必要的數據在需要的時間和地點可以被使用是一個巨大的障礙,這主要是肇因於晶片设计及晶圓廠代工分工模式。 的策略內容業務經理Ken Butler表示,對適應性測試來說,數據安全是一個重要議題,特別是在分散的製造和測試流程中,設備所有者和製造夥伴分屬不同公司的情況下。當數據和應用程式必須跨公司共享時,這些資訊的安全性就非常重要。Advantest 的 ACS 實時數據基礎設施(Real-Time Data Infrastructure, RTDI)解决方案具有多項功能,可以確保數據能夠安全地共享,以完成適應性測試流程和即時推論,毋需要將專有數據資料揭露給未經授權的實體。

圖2:在任何測試插入即時適應性測試的數據基礎架構,確保開發的測試數據、測試程序及第三方數據分析的安全。 來源: Advantest

安全的數據共享始於強大的加密技術。Butler表示,Advantest使用大量的加密技術來傳輸信息,但系統本身的架構在物理上是安全的;因為計算平台上沒有連接鍵盤,不允許使用 USB 隨身碟,而且它被存放在一個上鎖的匣子裡,以防止被任意存取。在測試過程的最後,所有數據都會被清除。因為數據被刪除了,後台也沒有保留任何可被人攫取的數據。

然而,當涉及從设计到製造測試,甚至是在現場數據測試中進行數據共享時,需要更多的作業來將數據置入到各種不同的设计背景脈絡中。智慧製造产物經理Eli Roth指出,數據的可用性可能仍然是我們必須就此達成共識的關鍵部分,工程師需要了解晶片的前後脈絡以有效地降低測試成本;特別的是測試數據的前後關係有時對上下游设计人員來說是沒有意義的。

Roth強調,確定數據共享協議是 SEMI 智慧 AI 產業諮詢委員會的主要目標之"一;要如何讓這些數據不僅可用,還可以看出前後脈絡,是當前我們面臨的挑戰。

Teradyne 已經投資開發自有的平行計算平台,近期更強調反饋和前饋(feed-forward),或是雙向數據串流。有鑑於實時適應性測試即將到來,我們專注於確保測試儀器輸出的數據是真實的,沒有被任何人假造,並且不需要在測試儀器上用另一個軟體適切地擷取數據。Roth提到,假設一家晶片设计公司的设计元件可以跟競爭對手的元件用相同生產線來製造生產,那麼公司的競爭優勢在哪裡?它就在於數據。所以我們的想法是將數據打包成標準格式。這在我們所有的測試人員來說都是一樣的。數據的結構是相同的,可以輸入到任何你想要的數據來源。然後,再藉由一個標準將這些數據轉換成你所屬的數據模型,這比嘗試從頭開始為適應性測試構建所有不同的解决方案更有效率。

現有的A4 TEMS SEMI 標準已在很多公司被使用,這是一項針對半導體自動測試設備的測試機事件訊息傳遞的規範,描述這個數據資料串流協定以及數據資料的結構。然而,這個標準並未延伸到數據資料的儲存或封包方式;它採用發布-訂閱模型來顯示用戶可以訂閱的可用數據。

适应性测试的最佳插入点

大多数业内专家都同意,适应性测试可以在多个测试插入点使用。在所有情况下,越早识别出潜在故障,对於设备的品质和製造效率都是越好的。

NI 的Schuldenfrei表示,在晶圓級測試、最終測試、burn-in測試和系統級測試都能執行適應性測試。在晶圓級測試中,常常以縮短測試時間來提高測試效率、降低成本,同時將測試逃脫(test escapes)的風險降到最低。在最終(封裝)測試也有相同的好處,但在最終測試中使用適應性測試有更具說服力的理由。在晶圓級測試中,透過統計或基於人工智能的演算法進行的元件重分配後處理(例如,異常檢測),可以在晶圓完成測試後離線進行。這些演算法更新的分配結果可以透過無墨(數位)晶圓圖應用。相較之"下,在最終測試中,待測設備的最終分配決策需要在它從插槽中被移除之"前進行,而這需要即時決策。

适应性测试的最早版本都是关於测试时间的缩短。适应性测试促使测试时间的缩短,包括更少的产耻谤苍-颈苍应力测试。但要从单纯的测试时间缩短进展到基於离线机器学习建模和大规模品质改善各方面取得重大进展,整个生态系统和数据共享的执行都需要进行改变。

Schuldenfrei提到,我們的大多數客戶不再談論DPPM甚至DPPB。任何測試逃脫都被認為是極度棘手的問題。目前有幾種普遍應用的適應性測試,包括適應性測試時間縮短(ATTR)、適應性測試增強、適應性異常值檢測,以及各種相關應用,如倚賴測試程序與外部服务之"間的準確及即時數據交換的漂移檢測(drift detection)。

适应性测试限制调整的最常见例子是零件平均测试(笔础罢)和动态零件测试(顿笔础罢)。笔础罢是一种可追溯到1990年代的统计流程,并由汽车工程委员会(础贰颁)於2011年进行更新。在这个流程中,根据测试期间收集的数据,可以根据正在测试的批次零件的行為来调整(通常是紧缩)一项或多项测试的规格限制。这种调整是為了能更完善地筛选潜在的异常设备,这些设备在技术上符合操作规格,但可能於最终应用中存在早期故障的风险。

础诲惫补苍迟别蝉迟的叠耻迟濒别谤指出,虽然笔础罢和顿笔础罢多年来一直被业界所使用,但透过现今先进的计算能力和分析能力,会有更好的方法来辨别具有潜在风险的元件设备,同时减少与这种筛选形式相关的产量损失。

圖3: (上)含有異常值的分布圖。 來源: 
(下) 基於機器學習的演算法可以更完善的辨別真正的異常值及有產能的設備。來源: Synopsys

先進的混合訊號晶片或系統單晶片(SoC) 可能會使用由新思科技(Synopsys)、proteanTecs 及其他公司提供的多種晶片感測器或監控器 IP。普遍的做法是在晶片上嵌入各種感測器,例如環形振盪器(ring oscillator)、溫度感測器、老化感測器等,來調整晶片的效能並監控晶片的健康狀況。ProteanTecs 提供稱為Agents的片上(on-chip)監控器,和以雲端為基礎的軟體,將監控數據與數據分析進行關聯。

GlobalFoundries的Carulli指出,常見的感測器和測量數據包括 Vmin、贵max、Iddq、Idd、製程環形振盪器、IR 壓降檢測器、抖動(jitter)檢測器、熱感測器—任何在類比/混合訊號/射頻设计中的類比量測數據等。在晶圓層級的典型異常情況可能是將Vmin用於近鄰殘值演算法。而在模組層級的典型情況可能是將雙變量(bivariate)模型用在 Iddq 對照Fmax来检测异常行為。

Carulli 表示,Advantest 的一個更先進的案例是使用他們的 ACS 系統改進數位預失真(pre-distortion)測試,將主要輸入數據轉移到相鄰的伺服器系統進行建模和優化,然後將優化條件發送回測試儀器以獲得更好的結果。

Butler 提到,另一個例子是調整測試限制以改善元件品質。在製造半導體元件時,會分開進行多次製程程序,這時候工程師會刻意變更製程以找出該元件在最壞情況和最佳情況的效能。客戶會根據製程廣度設定限制,但現實情況是,晶圓廠將盡可能嚴格控制材料。因此,需要收集資訊以得知如何緊縮這些規範。

其他人也指出類似的演變。新思科技 SLM 分析解决方案資深产物經理 Guy Cortez 指出,例如,Vdd 消耗測試結果(如圖 3所示)可以與內嵌的晶片內監控器或感測器數據資料相關聯,並從演算法中得到雙變量相關性;該演算法根據個別即時運行的晶片,推導生成適應性測試的限制。這種全新的更完善的DPAT方法能夠更好地識別真正的異常值,以提高品質,同時不僅不會犧牲產量,而是提升產量。

Cortez 接著表示,這個例子所展示的晶片內監控器或感測器數據需要在设计階段將監控器或感測器IP 實例化 (instantiation) 到设计中。新思科技提供這些監控器和感測器的 IP,而在 Silicon.da 分析解决方案中顯示的分析結果可以透過新思科技或任何其他第三方 IP 供應商獲取監控器和感測器數據。

结论

自動測試設備(ATE)供應商正在構建基礎設施,以支持即時適應性測試的使用,並結合先進的異常檢測方法和更嚴格的測試限制來提高設備品質。晶片上感測器已證明能夠捕捉個別晶片的行為,而基於機器學習的演算法則提供了先進的模型。但是,適應性測試相關的邏輯流程運作取決於業界在加密和處理關鍵數據的標準方法,同時保護晶片製造商和晶片设计公司開發IP的進度。