En praktisk guide till hur KLA-liknande inspektion och metrologi påverkar yield, skrot, cykeltid och kostnad—vad du bör följa och hur fabriker väljer verktyg.

Inspektion och metrologi är fabriken "ögon", men de söker efter olika saker.
Inspektion svarar: Är något fel någonstans på wafer? Den skannar efter defekter som partiklar, repor, mönsterbrott, kontaminering eller subtila anomalier som korrelerar med framtida fel.
Metrologi svarar: Gör processen vad vi avsåg? Den mäter kritiska dimensioner (CD), overlay (lager-till-lager-inpassning), filmtjocklek och andra parametrar som avgör om chippet kommer att fungera.
En fabrik kan bara kontrollera det den kan mäta—men mätning tar också tid i verktyg, ingenjörsresurser och plats i kön. Det skapar en konstant avvägning:
Om inspektionen är för långsam kan defekter spridas över lotter innan någon märker det. Om metrologin är för brusig kan ingenjörer börja "jaga spöken" och justera en process som inte faktiskt driver bort.
De flesta av de mest betydelsefulla besluten i en fab är inte dramatiska—det är rutinbeslut som fattas dussintals gånger per dag baserat på mätdata:
Dessa beslut avgör tyst yield, cykeltid och kostnad per wafer. De bästa fabrikerna mäter inte bara mycket—de mäter rätt saker, med rätt frekvens, och med förtroende för signalen.
Den här artikeln fokuserar på begrepp du kan använda för att förstå hur leverantörer som KLA passar in i yield-hantering—varför vissa mätningar är viktiga, hur de driver åtgärder och hur de påverkar ekonomin.
Den kommer inte att gå in på proprietära specifikationer eller modell-för-modell-krav. Istället förklarar den den praktiska logiken bakom inspektions- och metrologival, och hur dessa val sprider sig in i konkurrenskraften.
En wafer mäts inte "en gång". Den kontrolleras upprepade gånger när den rör sig genom loopar av mönstring och materialförändring. En förenklad väg ser ut så här: litografi (skriv mönstret) → etch (överför det) → deposition (lägg till filmer) → CMP (planarisera) → upprepa för dussintals lager → elektrisk test och slutsortering.
Mätningar läggs in där variation blir dyrt att fixa senare:
Fabriker mäter inte allt i samma takt. Kritiska lager (snäva designregler, känsliga overlay-budgetar, nya processsteg) får ofta högre sampling—fler wafers per lot, fler sites per wafer och mer frekvent inspektion. Mindre kritiska eller mogna lager använder ofta lättare sampling för att skydda genomströmningen.
Provtagningsplanen är lika mycket ett affärsbeslut som ett tekniskt: mäter du för lite ökar escapes; mäter du för mycket blir cykeltiden lidande.
Praktiskt mål är balans: tillräcklig inline-täckning för att styra processen i tid, plus riktade offline-insatser när data visar förändring.
Inspektion beskrivs ofta som "att hitta defekter", men det operativa jobbet är att avgöra vilka signaler som är värda att reagera på. En modern fabrik kan generera miljontals defekt"händelser" per dag; endast en bråkdel påverkar elektrisk prestanda. Plattformar och verktyg (inklusive KLA-klass system) hjälper till att göra om råa bilder till beslut—but avvägningarna kvarstår.
Defekter varierar efter lager, mönster och processsteg:
Många av dessa ser liknande ut vid första anblick. En ljus "fläck" kan vara en ofarlig resist-bit på ett lager, men ett yield-killer på ett annat.
En killer-defekt är en som sannolikt orsakar funktionellt fel (öppning, kort, läckage, parametrisk förskjutning). En nuisance-defekt är verklig eller till synes verklig men påverkar inte yield—tänk kosmetisk mönsterrugghet som ligger inom marginal.
Klassificering spelar roll eftersom fabriker inte bara betalar för upptäckt; de betalar för vad upptäckten triggar: granskningstid, lot-holds, återarbete, ingenjörsanalys och verktygsstopp. Bättre klassificering betyder färre dyra reaktioner.
På hög nivå är defekttäthet "hur många defekter per ytenhet." När chips blir större eller designregler snävare, ökar sannolikheten att minst en killer landar i ett kritiskt område. Därför kan även modest minskning av killer-defekttäthet ge märkbar yield-ökning.
Inget inspektionssystem är perfekt:
Målet är inte att "hitta allt" utan att hitta rätt saker tidigt nog—och billigt nog—för att påverka utfallen.
Metrologi är hur en fabrik går från "verktyget körde" till "mönstret är faktiskt som vi avsåg." Tre mätningar återkommer ofta i yield-lärande eftersom de kopplar direkt till om transistorer och ledare fungerar: critical dimension (CD), overlay och drift.
CD är den uppmätta bredden på ett tryckt element—tänk grindlängd eller bredden på en smal metalllinje. När CD är även lite fel skiftar elektriskt beteende snabbt: för smalt kan öka resistans eller orsaka öppningar; för brett kan orsaka kortslutningar eller ändra transistorers drivström. Moderna konstruktioner har små marginaler, så ett par nanometers bias kan flytta dig från "säkert" till "systematiskt fel" över många die.
CD-problem har ofta igenkännbara fokus-/exponeringssignaturer. Om fokus är fel kan linjer se rundade, nippade eller "klämda" ut. Om exponeringsdos är fel kan funktioner tona för stora eller för små. Det är frågor om mönsterfidelitet: formen kan vara förvrängd även om medelbredden ser acceptabel ut.
Overlay mäter hur väl ett lager ligger i förhållande till föregående lager. Om inpassningsfel ackumuleras kan vias missa sina mål, kontakter landa delvis eller kanter överlappa felaktigt. Ett chip kan ha "perfekta" CD på varje lager men ändå misslyckas för att lagren inte linjer upp.
I stora drag använder fabriker optisk metrologi för snabba, högkapacitetsmätningar och SEM-baserad metrologi när man behöver skarpare, mer detaljerade vyer av små funktioner. Leverantörer väljs efter hur väl mätningarna fångar verklig drift tidigt—innan det blir lot-bred yield-förlust.
Processdrift är den tysta fienden: temperatur, kemi, verktygsslitage eller reticle-ändringar kan knuffa CD och overlay långsamt, tills fabriken plötsligt är utanför spec.
Mätningar minskar bara kostnader när de triggar konsekventa beslut. Den "sista milen" är Statistical Process Control (SPC): rutinen som förvandlar inspektions- och metrologisignaler till åtgärder som operatörer litar på.
Tänk dig att en CD-mätning efter ett etch-steg börjar driva bredare.
Feedback-kontroll är den klassiska loopen: du mäter resultatet och justerar sedan etch-receptet så att nästa lot landar tillbaka på mål. Det är kraftfullt, men alltid ett steg efter.
Feedforward-kontroll använder upstream-information för att förhindra att felet uppträder senare. Om tillexempel litografi-overlay eller fokusmätningar indikerar en känd bias på en specifik scanner, kan du automatiskt justera efterföljande etch- eller deposettings innan lotten bearbetas.
SPC-diagram ritar kontrollgränser (ofta baserade på processvariation) runt ett mål. När data korsar dessa gränser är det en avvikelse—en signal om att processen förändrats, inte bara normalt brus.
Om team rutinmässigt kringgår larm för att "det är nog okej", händer två saker:
Pålitliga larm möjliggör snabba, repeterbara innehållstaganden: stoppa linjen av rätt skäl, inte hela tiden.
Latens är tiden mellan bearbetning och en användbar mätning. Om CD-resultat anländer efter att flera lotter redan körts, fixar feedback-korrigering framtiden medan defekter hopar sig i nuet. Lägre latens (eller smartare sampling) krymper det "i-riskzon" materialet och förbättrar både feedback och feedforward.
När gränser, svarplaner och ägarskap är tydliga går färre lotter på hold "bara för säkerhets skull", och färre wafers behöver dyrt återarbete. Vinsten är lugnare drift: mindre variation, färre överraskningar och snabbare yield-inlärning.
Mätning är inte "overhead" i en fab—det är val som antingen förhindrar dyra misstag eller skapar dyrt extraarbete. Kostnadspåverkan syns i förutsägbara fack:
Högre inspektionskänslighet (till exempel att pressa ner till mindre defektstorlekar) kan minska escapes—men den kan också översvämma ingenjörer med nuisance-signaler. Om varje "möjlig defekt" blir ett hold betalar fabriken i verktygsidledtid, kötillväxt och analystid.
Ekonomisk fråga är inte "Kan verktyget se det?" utan "Förebygger åtgärdandet mer förlust än det skapar?"
Var du mäter mer—eller mindre—är lika viktigt som vilket verktyg du köper. Hög-risklager (nya processsteg, snäva overlay-lager, kända svaga punkter) bör oftast ha tätare sampling. Stabilt, mogna lager tjänar ofta på lättare sampling plus starka SPC-skydd.
Många fabriker använder inspektions-/metrologiutdata för att finjustera detta lager för lager: öka täckning där avvikelser är frekventa, dra tillbaka där signaler sällan driver åtgärd.
En bra fångst: tidig upptäckt av en fokusdrift som skulle ha degraderat en hel lot, möjliggjorde snabb korrigering och sparade efterföljande litografi-/etch-steg.
Dyrt brus: upprepade flaggningar av harmlösa mönsterartefakter som triggar holds och granskningar, medan yield och elektriska resultat förblir oförändrade—bränner cykeltid utan att minska skrot.
Yield-inlärning sker inte "gratis." Varje inspektionsskanning, metrologiprov och defektgranskning använder knapp verktygskapacitet—och när den kapaciteten är tajt blir mätning en fabrikskonstraint som förlänger cykeltid.
Den största cykeltidspåverkan är sällan själva skanningen; det är väntan. Fabriker ser ofta köer byggas vid:
Dessa köer saktar ner lotter över hela linjen, ökar WIP och kan tvinga suboptimala beslut—som att hoppa över bekräftande mätningar bara för att hålla material i rörelse.
Planering av mätkapacitet är inte bara "köp tillräckligt med verktyg." Det handlar om att matcha kapacitet till receptmix. Ett långt, känsligt inspektionsrecept kan konsumera flera gånger verktygstiden jämfört med en lätt övervakning.
Nyckelgrepp fabriker använder:
Automatisering förbättrar cykeltid när den minskar det "mellanarbete" som skapar väntan:
Den största vinsten av hastighet är inlärning. När inspektions- och metrologiresultat snabbt flödar in i en tydlig, åtgärdbar diagnos undviker fabriken att upprepa samma avvikelse över flera lotter. Det minskar återarbete, skrot och den ackumulerande cykeltidspåverkan av "mer sampling för att vi är oroliga."
Att krympa funktioner gör inte bara chips snabbare—det gör mätning svårare. På avancerade noder blir "tillåtna fel" så små att inspektionskänslighet och metrologiprecision måste förbättras samtidigt. Konsekvensen är enkel: en defekt eller några nanometer av drift som tidigare var ofarligt kan plötsligt göra en wafer från "bra" till "marginal."
EUV förändrar defekt- och metrologiproblemet på några viktiga sätt:
Detta driver fabriker mot mer känslig inspektion, smartare sampling och tätare koppling mellan vad som mäts och vad som justeras.
Även med EUV involverar många lager fortfarande multi-patterning-steg och komplexa 3D-staplar (fler filmer, fler gränssnitt, mer topografi). Det ökar chansen för:
Metrologimål kan bli mindre representativa, och recept måste ofta fintrimmas för att förbli korrelerade med yield.
Inte varje lager behöver samma känslighet eller precision. Logik, minne och effektkomponenter betonar olika felmekanismer, och inom en och samma krets kan gate-, kontakt-, via- och metallager kräva mycket olika inspektionsgränser och metrologi-osäkerhet. Vinnande fabriker behandlar mätstrategi som lager-för-lager-ingenjörskonst, inte en enda inställning.
Inspektion och metrologi hjälper bara yield om resultaten är repeterbara skift-till-skift och verktyg-till-verktyg. I praktiken beror det mindre på mätfysik och mer på operationell disciplin: recept, tool matching, kalibrering och kontrollerad förändring.
Ett "recept" är den sparade uppsättningen mätplatser, optik-/benseinstellungen, fokusstrategier, tröskelvärden, provtagningsplaner och klassificeringsregler som används för ett givet lager/produkt. Bra recepthantering gör ett komplext verktyg till ett konsekvent fabriksinstrument.
Små receptskillnader kan skapa "falska" avvikelser—ett skift ser fler defekter bara för att känsligheten ändrats. Många fabriker behandlar recept som produktiva tillgångar: versionshanterade, åtkomstkontrollerade och knutna till produkt/lager-ID så att samma wafer mäts likadant varje gång.
De flesta högvolymsfabriker kör flera verktyg (ofta flera generationer) för kapacitet och redundans. Om Verktyg A läser 3 nm högre CD än Verktyg B har du inte två processer—du har två linjaler.
Kalibrering håller linjalen förankrad till en referens. Matchning håller olika linjaler i linje. Detta inkluderar periodiska gauge-kontroller, referenswafers och statistisk övervakning av offset och drift. Leverantörer erbjuder matching-arbetsflöden, men fabriker behöver fortfarande tydligt ägarskap: vem godkänner offset, hur ofta re-matchas och vilka gränser triggar stopp.
Recept måste ändras när material, mönster eller mål ändras—men varje ändring behöver validering. En vanlig praxis är "shadow mode": kör det uppdaterade receptet parallellt, jämför deltas och promovera det endast om det bevarar korrelation och inte bryter downstream SPC-gränser.
Daglig stabilitet beror på snabba, konsekventa beslut:
När detta arbetsflöde är standardiserat blir mätning en pålitlig kontrollloop snarare än en annan källa till variabilitet.
Mätning förbättrar bara konkurrenskraft om den förändrar beslut snabbare än processen driver. KPI:erna nedan kopplar inspektions-/metrologiprestanda till yield, cykeltid och kostnad—utan att din veckovisa review blir ett data-dump.
Capture rate: andelen verkliga yield-begränsande defekter din inspektion hittar. Följ per defekttyp och lager, inte bara ett enda huvudtal.
Defect adder: defekter som introduceras av mätstegen själva (hantering, extra kötid som leder till WIP-risk, återarbete). Om din adder stiger kan "mer sampling" slå tillbaka.
Nuisance rate: andelen detekterade händelser som inte är åtgärdbara (brus, harmlösa mönsterartefakter). Hög nuisance-rate förbrukar granskningskapacitet och fördröjer root-cause-arbete.
Precision: repeterbarhet för ett verktyg på samma funktion; kopplad direkt till hur snäva dina kontrollgränser kan vara.
Accuracy: närhet till det sanna värdet (eller en överenskommen referens). Precision utan accuracy kan driva systematisk felstyrning.
TMU (total measurement uncertainty): en praktisk sammanslagning som kombinerar repeterbarhet, matching, samplingeffekter och receptkänslighet.
Tool matching: överensstämmelse mellan verktyg som kör samma recept. Dålig matchning blåser upp uppfattad processvariation och komplicerar dispatch.
Excursion rate: hur ofta processen lämnar sitt normala fönster (per modul, lager och skift). Para med escape rate (avvikelser som inte fångas innan downstream påverkan).
Mean time to detect (MTTD): tid från avvikelsestart till upptäckt. Att korta MTTD ger ofta större vinster än marginella förbättringar i rena verktygsspecifikationer.
Lots on hold: volym och ålder på hold-lotter som orsakas av metrologi/inspektionssignaler. För låg kan betyda att ni missar problem; för hög skadar cykeltiden.
Yield learning rate: yield-ökning per vecka/månad efter stora förändringar (ny nod, nytt toolset, större receptrevidering).
Cost of poor quality (COPQ): skrot + återarbete + skyndningar + sena upptäcktskostnader kopplade till escapes.
Cykeltidspåverkan: mätorsakad kötid och återarbeteloopar. En nyttig vy är "minuter av cykeltid tillsatt per lot" per kontrollsteg.
Om du vill ha en enkel startpunkt, välj en KPI från varje grupp och granska den tillsammans med SPC-signaler i samma möte. För mer om att omvandla mätningar till åtgärdsloopar, se /blog/from-measurements-to-action-spc-feedback-feedforward.
Val av verktyg i en fab är mer som att välja en del av fabrikens nervsystem än att köpa ett fristående instrument. Team utvärderar både hårdvaran och det omgivande mätprogrammet: vad det kan hitta, hur snabbt det körs och hur tillförlitligt dess data kan driva beslut.
Först tittar fabriker på känslighet (minsta defekt eller processändring verktyget kan upptäcka pålitligt) och nuisance-rate (hur ofta det flaggar harmlösa signaler). Ett verktyg som hittar fler problem är inte automatiskt bättre om det överväldigar ingenjörer med falska larm.
Sedan kommer throughput: wafers per timme vid önskade receptinställningar. Ett verktyg som bara når spec i ett långsamt läge kan skapa flaskhalsar.
Tredje är ägar- och driftkostnad, som innefattar mer än inköpspriset:
Fabriker granskar också hur smidigt verktyget pluggar in i befintliga system: MES/SPC, standard fab-kommunikationsgränssnitt och dataformat som möjliggör automatisk diagramgenerering, avvikelsedetektion och lot-disposition. Lika viktigt är granskningsarbetsflödet—hur defekter klassificeras, hur sampling hanteras och hur snabbt resultat återförs till processmodulen.
En vanlig pilotstrategi använder split lots (skicka matchade wafers genom olika mätmetoder) plus golden wafers för att kontrollera verktyg-till-verktyg-konsistens över tid. Resultaten jämförs mot en baslinje: nuvarande yield, nuvarande detektionsgränser och hastigheten i korrigerande åtgärder.
I många fabriker utvärderas leverantörer som KLA tillsammans med andra inspektions- och metrologileverantörer i samma kategorier—kapabilitet, fabriksanpassning och ekonomi—eftersom det vinnande valet förbättrar beslut per wafer, inte bara mätningar per wafer.
Yield-inlärning är en enkel kedja av orsak och verkan, även om verktygen är komplexa: upptäck → diagnostisera → korrigera.
Inspektion hittar var och när defekter uppträder. Metrologi förklarar hur långt processen drivit (CD, overlay, filmtjocklek osv.). Processkontroll förvandlar den evidensen till åtgärd—justera recept, trimma scanners/etch-verktyg, skärpa underhåll eller ändra samplingplaner.
Använd den här listan när du vill ha större yield-effekt utan att "bara köpa mer mätningar."
En underskattad hävstång är hur snabbt team kan operationalisera mätdata—instrumentpaneler som kombinerar SPC-signaler, tool matching-status, hold-aging och MTTD/escape-trender.
Här kan en "vibe-coding" plattform som Koder.ai hjälpa: teamen kan beskriva arbetsflödet de vill ha i chatt och generera en lätt intern webbapp (t.ex. en SPC-översiktskonsol, en triage-kö för avvikelser eller en KPI-instrumentpanel), och sedan iterera när processen utvecklas. Eftersom Koder.ai stödjer React-baserade webappar med Go + PostgreSQL-backends—och koden kan exporteras—fungerar den både för snabba piloter och mer formell överlämning till intern engineering.
Om du vill fräscha upp hur dessa bitar hänger ihop, se /blog/yield-management-basics. För frågor om kostnad och adoption kan /pricing hjälpa till att rama in vad "bra" ROI ser ut som.
Inspektion söker efter oväntade defekter (partiklar, repor, brott i mönster, anomalier) och svarar på frågan: ”Är något fel någonstans på wafer?”
Metrologi mäter avsedd processutgång (CD, overlay, filmtjocklek, planaritetsmått) och svarar: ”Träffade processen målet?”
I praktiken använder fabriker inspektion för att hitta yield-killande fel tidigt, och metrologi för att hindra processdrift från att bli ett lot-breda förluster.
Därför att mätning ligger bakom rutinbeslut som i slutändan påverkar avkastning och kostnad:
Bättre snabbhet, repeterbarhet och klassificering gör att mätningar blir snabba innehållstaganden och färre dyra överraskningar.
Vanliga insertpunkter är precis efter steg där variation blir dyr att åtgärda senare:
Tanken är att mäta där det påverkar beslut tidigt nog för att göra skillnad.
Ett provtagningsplan definierar hur ofta och hur djupt du mäter (wafers per lot, sites per wafer, vilka lager).
Praktisk tumregel:
Översampling kan bli en flaskhals för ledtiden; undersampling ökar risken för escapes.
Inline-mätningar sker i produktionsflödet, nära processverktyget, så de är snabbare för reglerloopar och minskar „at-risk“-WIP.
Offline-mätningar är oftast långsammare men djupare (felsökning, korrelation, rotorsaksbekräftelse).
En bra modell är: tillräcklig inline-täckning för att styra dagliga beslut, plus riktade offline-undersökningar när inline-signaler indikerar förändring.
Ett killer-fel orsakar sannolikt funktionellt fel (öppningar, kortslutningar, läckage, parametrisk förändring).
Ett nuisance-fel är verkligt (eller verkar vara verkligt) men påverkar inte yield.
Varför det spelar roll: kostnaden är inte bara upptäckt—det är reaktionen (holds, granskningar, återarbete, driftstopp). Bättre klassificering minskar dyra överreaktioner utan att öka escapes.
False negatives (missade killers) visar sig senare som yield-förluster—efter att mer värde lagts till—så de är mest skadliga.
False positives skapar "dyrt brus": onödiga holds, extra granskningar och längre köer.
Det praktiska målet är inte att "hitta allt", utan att hitta rätt signaler tidigt nog för att trigga lämpliga åtgärder till en acceptabel kostnad.
CD (critical dimension) är den uppmätta bredden/storleken på ett tryckt element—tänk grindlängd eller en smal metallspårbredd.
Små CD-avvikelser kan snabbt förändra elektriskt beteende (motstånd, läckage, drivström) eftersom moderna marginaler är små.
Många CD-problem har igenkännbara fokus-/exponeringssignaturer, så att para CD-metrologi med tydliga SPC-åtgärder ger ofta hög avkastning.
Overlay mäter hur väl ett lager ligger i förhållande till ett tidigare lager.
Ett chip kan ha "bra CD" på varje lager men ändå misslyckas om vias missar mål eller kontakter hamnar delvis fel på grund av fel i inpassning.
Overlay-kontroll är extra kritisk när inpassningsbudgetar är hårda eller fel ackumuleras över flera patterningsteg.
Latens är tiden från att en wafer behandlats till att en användbar mätning finns tillgänglig.
Om resultat kommer efter att flera lotter redan körts, kan du bara rätta framtiden medan förluster samlas upp i nuet.
För att minska latensens effekt:
Detta ger ofta bättre resultat än marginella förbättringar i rå verktygskänslighet.