Aktuální vydání

celé číslo

08

2021

Digitální transformace a konvergence provozních, informačních a inženýrských systémů

Výzkum, vývoj a vzdělávání v automatizaci

celé číslo

Různé přístupy při vyhodnocování kalibračních údajů

V článku jsou stručně představeny a posouzeny různé základní způsoby výpočtu hodnot parametrů kalibrační rovnice s použitím sady výchozích údajů pocházejících z kalibrace termoelektrického článku typu S ve vybraných pevných bodech teplotní stupnice ITS-90. Uvedené metody a závěry jejich posouzení mají při vyhodnocování souborů reálných údajů širší využití. 

In the article, some basic methods used for calibration model parameter calculations are briefly described and evaluated. A set of data obtained by the calibration of type S thermocouple at various ITS-90 temperatute scale fix points is used for demonstration. The discussed methods as well as results of their acceptability assessment could be widely exploited at real laboratory data processsing.

1. Úvod

K určování hodnot parametrů kalibračních rovnic je v laboratořích používáno několik postupů, které jsou založeny na evropských normách, např. EN 60584. V normách jsou stanoveny základní polynomy, které by měly popisovat chování jednotlivých typů snímačů (čidel) teploty. Cílem tohoto článku je ukázat, jaký význam mají při výpočtu hodnot parametrů kalibrační rovnice chybějící nebo odlehlé kalibrační údaje.

Různé způsoby výpočtu hodnot parametrů kalibrační rovnice a příklady výsledků výpočtu jsou ukázány při použití jedné a téže sady výchozích údajů pocházejících z kalibrace termoelektrického článku typu S ve vybraných pevných bodech teplotní stupnice ITS-90.

Výpočty byly provedeny s použitím programu Matlab®, verze 2011a.

2. Matematický aparát

2.1 Kalibrační rovnice versus sada údajů z kalibrace

Při kalibraci snímače teploty se stanovuje velikost jeho výstupního signálu jen v několika vybraných, přesně daných bodech teplotní stupnice. Snímač je ovšem v praxi používán k měření teploty v celém jeho měřicím (pracovním) rozsahu. Aby toto bylo možné, je třeba vhodně stanovit závislost výstupního signálu snímače na teplotě, jíž je snímač vystaven (kterou měří), a vice versa – tedy statickou převodní charakteristiku snímače, v praxi i dále v tomto článku označovanou jako kalibrační rovnice. Vhodná kalibrační rovnice je taková, která dostatečně vystihuje chování toho kterého snímače. V praxi obecně není dostatečně vhodná kalibrační rovnice ve tvaru přímky (výstupní signál se nemění lineárně s teplotou), ale polynomu. Doporučuje se popisovat chování snímačů kalibračními rovnicemi ve tvaru polynomu druhého řádu. Při použití řádů vyšších často vznikají výrazné chyby a fyzikální nesmysly.

Hodnoty parametrů kalibrační rovnice bývají i nyní určovány s použitím údajů z pouhých tří namísto ze všech teplotních bodů, v nichž byl snímač kalibrován (tj. namísto využití úplné sady kalibračních údajů). Tento způsob výpočtu může vést k nevhodnému stanovení kalibrační rovnice s ohledem na úplnou sadu kalibračních údajů v důsledku nesprávného výběru bodů použitých pro výpočet.

K demonstraci možných chyb je v článku zkoumán vztah mezi kalibrační rovnicí určenou při použití úplné sady kalibračních údajů a kalibračními rovnicemi určenými jinými metodami výpočtu. K proložení údajů získaných při kalibrací vhodnou kalibrační závislostí je použita jednak dobře známá metoda nejmenších čtverců, jednak její modifikace. Kalibrační rovnice má ve všech případech tvar polynomu druhého řádu.

2.2 Metoda nejmenších čtverců a její vážená forma

Metoda nejmenších čtverců (MNČ) představuje způsob, jak jednoduchým výpočtem při použití lineární algebry určit regresní polynom (kalibrační rovnici) co nejlépe prokládající soubor bodů získaných měřením. Poloha každého z těchto bodů v rovinném kartézském souřadném systému je určena dvojicí hodnot: hodnotou nezávisle proměnné x (v daném případě příslušná referenční teplota t90) a závisle proměnné y (naměřená hodnota výstupního signálu z kalibrovaného snímače). Hledaná regresní funkce f(x, θ) vykazuje v každém změřeném bodě odchylku e, tedy pro i-tý změřený bod platí

 ei = yif(xi, θ)                                         (1)

 kde θ je vektor hodnot hledaných koeficientů kalibrační rovnice.

Podle metody nejmenších čtverců představuje nejlepší proložení daných údajů regresní funkce minimalizující součet druhých mocnin (čtverců) odchylek (odtud název metody) přes všechny body vstupující do výpočtu, tedy

 kde    vzorec                                                       (2)

θ je odhad vektoru θ,

e je vektor hodnot odchylek ei, i = 1, …, n,

n    počet bodů ve výpočtu,

přičemž parciální derivace odchylky podle hledaných koeficientů je rovna nule

 vzorec                                                                  (3)

 Hledané hodnoty koeficientů kalibrační rovnice se poté určí řešením soustavy lineár­ních rovnic. Důležitá je skutečnost, že při použití metody nejmenších čtverců vstupují do výpočtu všechny naměřené údaje se stejnou váhou.

Modifikací uvedené metody nejmenších čtverců je vážená metoda nejmenších čtverců (VMNČ), také popsaná v mnoha zdrojích, např. [3], [4]. Přestože jde o metodu vcelku jednoduchou, při aproximaci průběhu kalibračních závislostí představuje mocný nástroj. Do výpočtu hledaných hodnot koeficientů regresní funkce vstupuje další člen – vektor, popř. matice vah w (popř. W). Hodnoty vah wi přiřazují každému jednotlivému páru údajů určitou důležitost (váhu), a tím určují vliv konkrétního bodu ve finálním výpočtu regresního polynomu – čím větší wi, tím větší váhu má daný bod ve výpočtu. Rovnici (2) lze v tomto případě přepsat do tvaru

 vzorec                                                      (4)

 Váhy wi lze stanovit mnoha různými způsoby; v daném případě je vhodné jejich vyjádření při použití nejistot ui způsobem     

vzorec                                                             (5)

2.3 Robustní přístup

Nedostatkem již uvedených metod MNČ a VMNČ je jejich velká citlivost na odlehlé hodnoty (extrémní hodnoty, které jsou platnou částí sady údajů). Obecně se předpokládá, že chyby při kalibraci mají normální (gaussovské) rozdělení pravděpodobnosti a že odlehlé hodnoty se vyskytují zřídka. Druhá mocnina jim příslušných odchylek ovšem výrazně zvyšuje efekt odlehlých hodnot a tyto mají na výslednou regresi velký vliv.

K minimalizaci vlivu odlehlých hodnot je možné použít robustní metody regrese, např. metodu LAR (Least Absolute Residuals), spočívající v minimalizaci součtu absolutních hodnot odchylek ei místo jejich druhých mocnin podle vztahu

vzorec                                                      (6)

kde p je volitelný parametr splňující podmínku p ≥ 1, v tomto článku je p = 1.

Výsledkem je, že odlehlé hodnoty mají ve výsledné regresi menší vliv na výsledek.

2.4 Statistické vyhodnocení

Za účelem objektivního porovnání výsledků regrese dosažených při použití uvedených metod MNČ, VMNČ a LAR jsou dále sledována následující tři kritéria:

1.  Prostá hodnota součtu druhých mocnin odchylek SSE (Sum of Squares Error), s nímž pracují MNČ a VMNČ (1), když

vzorec                                                      (7)

2.  Hodnota koeficientu determinance Rsquare jako statistiky informující o tom, jak velkou část variability proměnné y vysvětluje regresní polynom (model) a jak velká část zůstala neobjasněna; definice je následující

vzorec                                                      (8)

kde y je hodnota yi předpovídaná regresním modelem (kalibrační rovnicí),                                                                    
průměrná hodnota ze všech (měřených, dostupných) dat.

Statistika Rsquare může nabývat hodnot mezi 0 a 1. Čím je hodnota blíže jedné, tím větší část variability je vysvětlena modelem.

3.  Hodnota ukazatele je RMSE (Root Mean Square Error), opět založeného na metodě nejmenších čtverců odchylek

vzorec                                                      (9)

4. Výsledky

4.1 Výchozí kalibrační údaje

Regresní metody uvedené v kap. 2.2 a 2.3 byly porovnány při použití údajů (naměřeného elektrického napětí, resp. elektromotorické síly E) získaných při kalibraci termoelektrického článku typu S. Kalibrace byla provedena v pevných bodech In, Zn, Al, Ag, Au a Cu teplotní stupnice ITS-90. K regresi byl použit polynom druhého řádu.

Údaje vstupující do regresních výpočtů jsou v odchylkovém tvaru uvedeny v tab. 1, kde hodnoty ve sloupci Nejistota Uc jsou použity k výpočtu vah podle (5). Zpracovávaná sada dat obsahuje jeden odlehlý údaj E naměřený v pevném bodě Sn (231,9 °C). Vliv odlehlého údaje na výslednou kalibrační rovnici je v dalším textu vysvětlen jednotlivě pro každou použitou regresní metodu. Pojem kalibrační rovnice je v této kapitole použit ve významu kalibrační rovnice v odchylkovém vyjádření.

4.2 Výsledky regrese při použití různých metod

Nejprve byla kalibrační rovnice určena při použití prosté metody nejmenších čtverců (MNČ, obr. 1). Tato metoda využívá k určení kalibrační rovnice všechny dostupné údaje, přičemž všechny body mají tutéž váhu. Hledání nejvhodnějšího regresního polynomu probíhá tak, že je hledán polynom, který proloží kalibrační údaje tak, že hodnota SSE (7) je nejmenší. Jelikož MNČ představuje nerobustní regresní metodu, není vhodná ke zpracování souborů údajů obsahujících odlehlé hodnoty.

Následně byly kalibrační údaje zpracovány při použití vážené metody nejmenších čtverců (VMNČ, obr. 2), umožňující vzít při výpočtu v úvahu i nejistoty, s jakými byla uskutečněna jednotlivá měření. Čím větší je nejistota, tím menší je vliv konkrétního bodu ve výsledném výpočtu hodnot parametrů kalibrační rovnice. Výpočet nejistot je ovšem závislý na mnoha okolnostech, takže nepředstavuje spolehlivý způsob detekce odlehlých hodnot.

Robustní metoda regrese umožňuje detekovat odlehlé údaje, které sice zůstávají platnou součástí sady kalibračních dat, ale jejich vliv je při výpočtu hodnot parametrů kalibrační rovnice minimalizován. Výsledky dosažené při po­užití robustních metod regrese jsou ukázány na obr. 3obr. 4.

Na obr. 3 je zobrazen výsle­dek získaný při použití MNČ v kombinaci s robustní metodou regrese. Je dobře patrné, že určená kalibrační rovnice vhodně prokládá reálné údaje a že vliv odlehlého údaje je jen minimální. Obdobně lze hodnotit i výsledek použití VMNČ v kombinaci s robustní metodou (obr. 4).

Ve všech čtyřech uvedených obrázcích jsou současně zobrazeny meze konfidenčních intervalů určující pásmo, v němž se kalibrační závislost nachází s pravděpodobností 95 %.

4.3 Statistické porovnání výsledků regrese

Po nalezení kalibračních závislostí (rovnice) znázorněných na obr. 1obr. 4 byly dále pro porovnání stanoveny hodnoty objektivních statistických kritérií uvedených v kap. 2.4. Výsledky jsou v tab. 2.

Důvodem významně větších hodnot SSE u vážených metod regrese je skutečnost, že údaj naměřený s větší nejistotou má menší váhu, a tedy také menší vliv na výsledné proložení než údaj naměřený s menší nejistotou, jehož váha je větší.

Robustní metody regrese dokážou identifikovat odlehlé údaje a znalost vah není nezbytná. Protože odlehlé údaje mají při těchto výpočtech velmi malý vliv, je hodnota SSE větší než u nerobustních metod. To ale neznamená, že by nerobustní metody popisovaly chování snímače lépe.

Z obdržených výsledků je patrné, že robustní metody regrese díky schopnosti identifikovat odlehlé údaje jsou mocným nástrojem při vyhodnocování reálných údajů naměřených v kalibrační laboratoři. Vykazují také užší konfidenční interval. Statistiky po­dle kap. 2.4 zjišťují u souborů reálných údajů velmi velké hodnoty SSERMSE a velmi malé hodnoty Rsquare. Důvodem je, že tyto statistiky jsou z definice vypočítávány ze všech naměřených údajů, bez jakýchkoliv vah nebo detekce údajů odlehlých hodnot.

Ke zpracování reálných údajů naměřených v laboratoři na termočláncích i jiných typech snímačů se pro jejich výhodné vlastnosti doporučuje používat vážené robustní metody regrese.

5. Závěr

V článku je probírána vhodnost použití čtyř různých přístupů ke zpracování údajů pocházejících z kalibrací snímačů teploty. V souborech údajů tohoto druhu se často vyskytují údaje odlehlých hodnot, s nimiž je třeba se korektně vypořádat.

Nejjednodušší ze zmiňovaných metod regrese je metoda nejmenších čtverců odchylek údajů získaných měřením od hodnot předpovídaných regresním modelem (kalibrační rovnicí). Pro výpočet hodnot parametrů kalibrační rovnice jsou použity všechny naměřené údaje bez rozdílu a s touž váhou. Použít tuto metodu regrese je vhodné za účelem rychlého odhadu hodnot parametrů kalibrační rovnice. Jelikož ovšem nedokáže odhalit údaje odlehlých (extrémních) hodnot, není pro zpracování souborů reálných údajů příliš vhodná.

Vážená metoda nejmenších čtverců umožňuje zahrnout do výpočtu nejistoty měření, podle nichž je každému páru údajů přiřazena určitá váha, která pak ovlivňuje výsledné stanovení kalibrační rovnice. S čím větší nejistotou byl bod změřen, tím méně ovlivní výsledek regrese. Jde tudíž o metodu, kterou lze doporučit ke zpracování souborů reálných údajů.

Robustní přístup umožňuje objektivně zjistit údaje odlehlých hodnot, které pak mají na výsledné stanovení kalibrační rovnice jen minimální vliv. Při použití tohoto přístupu výsledná kalibrační závislost respektuje především všechny „správné“ údaje a nedochází k posunu výsledku v důsledku přítomnosti odlehlých údajů.

Na základě předložených výsledků je vhodné používat pro soubory reálných údajů kombinaci robustní a vážené metody regrese, která spojuje přednosti plynoucí z respektování nejistot měření i detekce odlehlých údajů.

Literatura:

[1] NICHOLAS, J. V. – WHITE, D. R.: Traceable Temperatures. 1994, ISBN 0471938033.

[2] EN 60584-1 Thermocouples Part 1: Reference tables (1995). Ref. No. EN 60584-1:1995.

[3] http://www.efunda.com/math/leastsquares/leastsquares.cfm. October 2011.

[4] RAO, R. – TOUTENBURG, H. – FIEGER, A. – HEUMANN, C. – NITTNER, T. – SCHEID, S.: Linear Models: Least Squares and Alternatives. Springer Series in Statistics, 1999, ISBN 0387988483.

Lenka Kňazovická, Vysoká škola chemicko-technologická
v Praze, ústav počítačové a řídicí techniky (lknazovicka@cmi.cz),

Radek Strnad, Český metrologický institut, oddělení primární

metrologie tepelně-technických veličin (rstrnad@cmi.cz)

Tab. 1. Naměřené kalibrační údaje (odchylkové vyjádření)

Teplota t90 (°C)

Odchylka od reference
(
EEref) podle ČSN EN 60584-1 (µV)

Nejistota

Uc
(µV)

156,598 5

–2,7

1,4

231,928

10,0

1,0

419,527

3,9

1,8

660,323

17,0

1,6

961,78

38,8

2,3

1 064,18

51,7

8,0

1 084,62

51,7

2,4

Tab. 2. Statistické porovnání výsledků regrese (získaných kalibračních rovnic)

Kritérium

Regresní metoda

nevážená & nerobustní

nevážená & robustní

vážená &
nerobustní

vážená &
robustní

SSE

152,3

173,4

1 987

2 398

Rsquare

0,956

0,949

0,925

0,909

RMSE

5,5

5,9

19,9

21,9

 

Obr. 1. Regrese kalibračních údajů při použití metody nejmenších čtverců odchylek (nevážená, nerobustní)

Obr. 2. Regrese kalibračních údajů při použití vážené metody nejmenších čtverců odchylek (vážená, nerobustní)

Obr. 3. Regrese kalibračních údajů při použití metody nejmenších čtverců odchylek v kombinaci s robustní metodou (nevážená, robustní)

Obr. 4. Regrese kalibračních údajů při použití vážené metody nejmenších čtverců odchylek v kombinaci s robustní metodou (vážená, robustní)