「測定の不確かさ」実践編：評価の仕組みと合否判定の真実

2026.02.25 校正: 「測定の不確かさ」実践編：評価の仕組みと合否判定の真実

前回は、測定の不確かさが「測定結果の確かさ」を数量化した指標であり、真の値が誰にも分からないという前提から、誤差 (Error) ではなく不確かさ (Uncertainty) の概念が重視されるようになった背景を解説しました。今回の続編では、その不確かさをどのように見つけ出し、どのように計算し、どのように検査結果に適用するのかという、より実践的で深い内容に焦点を当てて解説していきます。

1. なぜ測定を繰り返すのか？— タイプA評価の統計的基礎

エアリークテスターで同じ製品を複数回測定すると、結果が微妙に異なることがあります。これは異常ではなく、測定対象物に元々ある自然な変動かもしれませんし、計測器が完全に安定していないためかもしれません。不確かさの評価方法のうち、タイプA評価は、統計的手法を用いて不確かさを推定する方法であり、通常、この繰り返し測定の結果 (データ群) から得られます。

1.1 最良推定値とばらつき

複数回測定を行った際、私たちが求めるのは「真の値の最良推定値」です。最も良い推定値は、得られた測定結果の平均値 (算術平均 \( \overline{x}\) ) を取ることによって得られます。一般的に、測定回数が多ければ多いほど、この平均値は理想的な推定値に近づきます。
次に重要なのが、この測定結果のばらつき (Spread) 標準偏差です。

1.2 標準偏差と平均値の標準不確かさ

測定回数が限られている場合、私たちは推定標準偏差 sを求めます。このsは、個々の測定値が平均からどれだけ離れているかを示す指標です。
しかし、タイプA評価で本当に求めているのは、個々の測定値のばらつきを示すsではなく、平均値の推定精度です。平均値の推定精度は、測定回数nを増やすことで向上します。この平均値のばらつきを示すのが、平均値の標準不確かさ (または平均値の標準偏差) です。

平均値の標準不確かさ \( u = \displaystyle \frac{8}{\sqrt{n}} \)

この式が示すように、測定回数nが増えるほど、分母の \( \sqrt{n} \) が大きくなり、平均値の不確かさuは減少します。したがって、繰り返し測定は、単にミス (作業者の誤り) のリスクを減らすだけでなく、統計的に不確かさを低減させるという役割を果たします。

2. タイプA評価とタイプB評価 — 評価方法による分類

不確かさの要因には、測定を繰り返すごとにランダムに変動する「偶然的要因 (Random)」と、測定期間中一定で影響を及ぼし続ける「系統的要因 (Systematic)」があることを前回確認しました。重要なのは、タイプA評価とタイプB評価の分類は、この要因の特性 (偶然か系統か) によるものではなく、評価の方法によって分けられているということです。

タイプA評価
測定結果のデータ群に対して統計学的手法 (繰り返し測定、平均、標準偏差など) を適用して評価します。
タイプB評価
統計的手法によらず、校正証明書、製造者の仕様書、過去の経験、公表情報など、その他のすべての情報を用いて不確かさを推定する方法です。

2.1 未知のかたより（Unknown Bias）の取り扱い

測定の不確かさでいう「ばらつき」には、通常のばらつきだけでなく、「未知のかたより」も含まれます。例えば、エアリークテスターの検査室の温度が、表示では20.0 ℃であったとしても、その表示には校正に基づく不確かさ (例えば ±0.5 ℃) があるかもしれません。この 0.5 ℃の範囲内のどこかに真の温度が存在していますが、それがどこかは分かりません。この測定期間中一定だが、値が不確かなかたよりを未知のかたよりと呼び、これを評価するのがタイプB評価の主要な役割となります。
もしこの温度の不確かさが、エアリークテスターの流量測定結果に影響を及ぼすことが分かっている場合 (例えば、1 ℃の上昇で 0.01 mL/minのズレが生じる)、その影響を計算し、タイプB評価の不確かさとして組み込む必要があります。

2.2 不確かさの統一的表現：標準不確かさ ( \( u \) )

個々の不確かさ要因（繰り返し測定、校正の不確かさ、温度の影響など）は、それぞれ異なる単位や表現 (例: 95%の信頼区間、最大許容差、標準偏差) で示されている可能性があります。
これらすべての要因を合成し、一つの総合的な不確かさを得るために、すべての寄与成分を標準不確かさ ( \( u \) ) に変換して統一的に表現する必要があります。標準不確かさは、「1標準偏差のプラスマイナス値に相当する幅」とみなされます。

タイプB評価を行う際、情報が上限と下限しかない場合（例えば「( \( ±a \) )の範囲内に入ることが等しく起こりそう」な場合）、矩形分布 (一様分布) を仮定します。矩形分布の場合、標準不確かさ \( u \) は、半値幅 \( a \) を \(\sqrt{3} \) で割って求められます。

矩形分布の標準不確かさ \( u = \displaystyle\frac{a}{\sqrt{3}} \)

3. 全体像を把握する：合成標準不確かさ ( \( u_{c} \) ) と拡張不確かさ ( \( U \) )

すべての要因を標準不確かさ \( u \) に統一できたら、次にそれらを総合して、測定全体の不確かさ合成標準不確かさ ( \( u_{c} \) ) を求めます。

3.1 平方和法 (SRSS) による合成

不確かさの成分が相互に関連していない (相関がない) 場合、合成標準不確かさを計算するために、平方和法 (二乗和の平方根: SRSS) という確立されたルールを用います。
例えば、測定結果 \( Y \) が複数の入力値 \( X_{1} \), \( X_{2} \), \( \cdots\) の足し算や引き算で求められる場合、合成標準不確かさ \( u_{c} \) は次のように計算されます。

\(u_{c}=\sqrt{u_{1}^{2}+u_{2}^{2}+u_{3}^{2}+\cdots }\)

この計算では、個々の標準不確かさ \( u_{i} \) を2乗して合計し、その平方根を取ります。これにより、ある特定の要因が他の要因よりも極端に大きい場合でも、その大きな要因が合成不確かさに支配的な影響を与えるようになります。
もし計算が掛け算や割り算を含む場合は、相対標準不確かさ（分数不確かさ）の形で平方和法を適用することができます。

3.2 拡張不確かさ ( \( U \) ) と信頼水準

合成標準不確かさ \( u_{c} \) は、測定結果が正規分布していると仮定した場合、「1標準偏差」と同等とみなされます。しかし、通常、私たちは 68% の信頼水準（\( k = 1 \)）ではなく、より高い信頼度、例えば 95% の信頼水準を伴う不確かさ区間を求めたいと考えます。そこで、 \( u_{c} \) に包含係数kを掛けて、拡張不確かさ \( U \) を求めます。

\( U = k \times u_{c}\)

最も一般的に使用されるのは( \( k = 2 \) )であり、これにより約95%の信頼水準が得られます。最終的な測定結果は、この拡張不確かさUを伴って「 \( X \pm U \) (信頼水準95%)」のように表記されます。

4. 不確かさ評価の目的 — 合否判定の確実性

不確かさの評価は、合否判定 (仕様への適合性) を正しく判断するために不可欠です。
当社のエアリークテスターの場合、「漏れ量が 0.5 mL/min以下であれば合格」という仕様 (許容限界) があるとき、測定結果 \( X \) がこの限界値に近い場合、不確かさ \( U \) の存在が極めて重要になります。
たとえ測定値 \( X \) が合格域に入っていても、その拡張不確かさ \( U \) の幅が広いために、真の値が含まれる区間 \( X \pm U \) の一部が許容限界をわずかに超えてしまう場合があります。このような場合、製品が確実に合格したとは言い切れません。不確かさが大きいほど、許容範囲ギリギリの製品について、その適合性を確実をもって表明することは難しくなります。
不確かさを評価し、その値を小さく抑えること (例えば、よりトレーサブルな校正済みの機器を選び、既知の系統的効果を補正すること) は、測定が目的にかなったものかどうか (Fit for Purpose) を正しく判断するために必要不可欠なのです。測定結果は、不確かさの表明が伴って初めて完全なものとなります。

5. 不確かさ評価の姿勢

不確かさの評価は、厳密な思考力、知的誠実さ、そして専門的技能に依存します。GUM (測定における不確かさの表現のガイド) は評価の枠組みを提供しますが、それは単なる定型的な作業や数学的な処理ではなく、測定対象や測定の性質についての深い知識が必要です。私たちは、お客様に提供するエアリークテスターの測定結果が客観的な品質を持つことを保証するため、不確かさの概念を深く理解し、その評価に誠実に向き合う必要があります。この深い理解が、お客様の製品の品質管理と、リスクを伴う合否判定の判断を支える確かな基盤となります。

不確かさの評価は、測定という道具を過信せず、その限界を知り、より良く利用するための道しるべきです。
これはまるで、精密な手術を行う外科医が、メスそのものの切れ味だけでなく、周囲の照明や麻酔の効き具合、患者の体調など、あらゆる「不確かな要因」を数値化・管理することで、手術の成功率 (測定の確実性) を高める作業に似ています。不確かさ評価は、最高の品質を追求するために避けて通れない、技術者にとっての必須スキルなのです。

一覧に戻る