Lab Med Qual Assur 2024; 46(4): 200-207
Published online December 31, 2024
https://doi.org/10.15263/jlmqa.2024.46.4.200
Copyright © Korean Association of External Quality Assessment Service.
Jong Hyeon Lee1 , Sang-Mi Kim1
, Jong Do Seo2
, Yeo-Min Yun2
, and Hyung-Doo Park1
1Department of Laboratory Medicine and Genetics, Samsung Medical Center, Sungkyunkwan University School of Medicine; 2Department of Laboratory Medicine, Konkuk University Medical Center, Seoul, Korea
Correspondence to:Hyung-Doo Park
Department of Laboratory Medicine and Genetics, Samsung Medical Center, Sungkyunkwan University School of Medicine, 81 Irwon-ro, Gangnam-gu, Seoul 06351, Korea
Tel +82-2-3410-0290
E-mail nayadoo@hanmail.net
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Background: Commutability refers to the consistency of results from different measurement procedures in regards to a reference material (RM) and representative samples. In this study, we evaluated the commutability of laboratory-prepared pooled sera and commercial quality control materials in the thyroid-stimulating hormone (TSH) proficiency testing program of the Korean Association of External Quality Assessment Service.
Methods: Serum TSH from 30 patients was measured in triplicate. Two levels of lab-prepared pooled sera and three levels of commercial materials (Bio-Rad Liquichek Immunoassay Plus) were tested in triplicate at five positions per immunoassay platform (Beckman Coulter UniCel DxI 800, Abbott Alinity i, Roche Cobas e801, Siemens Atellica IM 1600). Commutability was assessed by comparing method differences in patient samples to RMs using the ‘International Federation of Clinical Chemistry and Laboratory Medicine’ protocol with a desirable bias of 10% based on biological variation.
Results: The median TSH level for the 30 patient samples was 2.51–3.07 μIU/mL, with a coefficient of variation ranging from 1.51% to 4.32%. The median TSH levels of the in-house prepared materials were 0.912–1.01 μIU/mL for RM2 and 9.10–10.9 μIU/mL for RM4. The median TSH levels of the commercial materials were 0.391–0.464 μIU/mL for RM1, 4.39–5.24 μIU/mL for RM3, and 28.2–35.5 μIU/mL for RM5. The in-house prepared materials (RM2, RM4) demonstrated commutability across all six method combinations. Among the commercial materials, RM1 and RM3 showed commutability in four method combinations, while RM5 showed commutability in three method combinations.
Conclusions: The evaluation results for the TSH proficiency testing materials showed that the in-house prepared materials had higher commutability than the commercial materials.
Keywords: Commutability, Laboratory proficiency testing, Thyroid-stimulating hormone
혈중 갑상선자극호르몬(thyroid-stimulating hormone, TSH) 농도는 갑상선기능을 평가하고 갑상선 질환의 진단을 위해 thyroxine (T4), triiodothyronine (T3), free thyroxine (free T4) 등과 함께 측정된다[1]. Free T4와 달리 아직까지 갑상선자극호르몬검사의 기준측정법(reference measurement procedure)은 없으며, 대부분의 검사실에선 전기화학발광면역검사법(electrochemiluminescence immunoassay)을 통해 TSH 농도를 측정한다[2]. 그러나 면역측정법을 이용하는 제조사마다 사용하는 항체가 다르기 때문에 동일 검체로 측정하여도 다양한 결과를 보일 수 있다. 갑상선질환의 진단 및 치료 후 추적관찰이 용이하도록, 장비의 종류와 시약에 관계없이 비교 가능한 측정결과를 얻어야 할 필요성이 제기되었고 2010년 International Federation of Clinical Chemistry (IFCC)에서 Working Group for Standardization of Thyroid Function Tests를 설립하여 갑상선기능검사의 표준화를 위한 보고서를 발표하였다[3-5].
대한진단검사정도관리협회에서는 갑상선기능을 반영하는 호르몬검사 4종(TSH, total T4, free T4 및 total T3) 등에 대한 외부정도관리를 2023년 시범사업으로 도입한 후 2024년부터 정규사업으로 시행하고 있다.
교환가능성(commutability)은 서로 다른 검사방법으로 측정한 결과에 대해 환자 검체에서 나타나는 측정값 간의 수학적 관계가 표준물질에서도 동일하거나 유사하게 나타내는 것을 의미한다. 외부정도관리를 위해 사용되는 물질은 교환가능성이 있는 것을 사용하는 것이 권고된다[6].
Clinical and Laboratory Standard Institute (CLSI) guideline EP30-A 및 CLSI EP14A-3 및 IFCC는 교환가능성을 평가할 수 있는 통계학적 방법을 제시하고 있다[7-9]. 2023년 호르몬검사 신빙도조사사업에서 잔여 혈청을 혼합하여 제조한 자가제조물질을 외부정도관리물질로 사용하기 시작하였으며, 본 연구에서는 IFCC에서 제시한 평가방법에 따라서 TSH 외부정도관리에 사용되는 자가제조물질의 교환가능성을 평가하였다.
평가에는 개별 환자 혈청, 혼주혈청 및 상품화 정도관리물질을 사용하였다. 상품화 정도관리물질은 3가지 농도(Bio-Rad Laboratories, Hercules, CA, USA)의 동일한 제품(lot no.: 40410)의 Liquichek Immunoassay Plus Control로 구성되었다. 개별 환자 검체(clinical sample)로는 2023년 2월부터 4월까지 진료 목적으로 검사한 후 폐기예정인 잔여 혈청을 수집하였다. 혼주혈청을 제조하기 위하여 TSH 농도 4 μIU/mL을 기준으로 이보다 낮거나 높은 목표구간을 설정한 후 폐기되는 잔여 혈청을 수집하였으며, 제조 전까지 −60℃ 이하에서 냉동보관하였다. 충분한 검체를 확보한 후 잔여 혈청을 4–8℃ 저온실에서 해동한 후 한 용기에 담고 50 rpm 교반기를 이용하여 혼합하였다. 혼합된 검체를 0.2 μm 필터에서 1회 여과시킨 후 교반기를 이용하여 교반한 후 500 μL씩 분주하여 −60℃ 이하에서 냉동보관하였다. 상용화된 정도관리물질 및 혼주혈청을 참조물질(reference material)로 사용했다. 30개의 개별 환자 검체는 각각 3회 반복 측정하였으며, 신빙도조사에 사용할 두 가지 농도의 혼주혈청 외에 세 가지 농도의 상품화 정도관리물질을 각각 5개의 위치(position)에서 3회씩 반복 측정하여 총 15회씩 측정하였다. 위치(position)는 IFCC에서 제시한 평가방법에서 참조물질의 농도측정의 정확성을 높이기 위해 실험설계 시 고려되는 요소다. 검체 농도 측정 시 같은 참조물질을 검사차례 내 여러 위치(position)에서 측정하여, 교환가능성 평가 시 검사차례 간 비정밀도(between-run imprecision)의 원인 중 위치에 따라 오차가 생기는 영향(position effect)을 고려한다.
UniCel DxI 800 immunoassay System (Beckman Coulter Inc., Brea, CA, USA), Cobas 8000 e801 analyzer (Roche Diagnostics, Mannheim, Germany), Alinity I (Abbott, Slingo, Ireland), 그리고 Atellica IM 1600 analyzer (Siemens Healthineer, Erlangen, Germany), 총 4개 제조사의 장비를 이용하여 전용시약으로 TSH 검사를 시행하였다.
통계처리는 Analyze-it for Microsoft Excel ver. 6.15.4 (Analyse-it Software Ltd., Leeds, UK) 프로그램, Microsoft Office Excel 2021 (Microsoft Corp., Redmond, WA, USA)을 이용하였다. 검사법 간 상관관계는 Passing-Bablok 선형회귀분석 및 Pearson 상관계수(Pearson correlation coefficients)로 확인하였으며, 통계학적 유의수준은 P-value <0.05로 정의하였다. 검사법 간 검체의 교환가능성 비교평가를 위하여 IFCC Working Group에서 권장하는 편차의 차이를 이용하여 분석하였다. 농도에 따른 편차의 분포를 균일하게 하기 위해 IFCC 프로토콜에 따라 농도를 로그(ln)로 변환한 값으로 분석하였다.
RM, reference material; CS, clinical sample.
BRM은 참조물질인 자가제조시약 또는 상용화 내부정도관리물질에서 검사법 간 측정값 편차의 평균을 의미하며, BCS는 개별 환자 검체의 검사법 간 측정값 편차의 평균을 의미한다. dRM은 참조물질 측정값과 환자 검체 측정값과의 편차의 평균을 나타내는 변수로, 참조물질에서 측정된 검사법 간 편차의 평균(BRM)과 환자 검체에서 측정된 검사법 간 편차의 평균(BCS) 간의 차이를 통해 계산된다. 교환가능성 평가를 위해 참조물질이 교환가능성이 있다고 간주될 수 있는 |dRM|의 최댓값을 설정하여야 하며, 이 최댓값을 교환가능성 평가기준(C)이라고 한다.
u (BRM)과 u (BCS)은 참조물질과 개별 환자 검체의 측정불확도(measurement uncertainity)를 의미한다. 측정불확도는 검사법 간 측정값의 편차가 참값으로부터 차이날 수 있는 정도를 나타내는 지표이다. u (BRM)의 측정불확도는 검사법 내에서 반복 측정된 참조물질의 표준편차(SPos-mean (x), SPos-mean (y))를 이용하여 계산되며, u (BCS)는 각 검사법에서 측정된 환자 검체의 농도차의 표준편차(SB)를 이용하여 계산된다. u (dRM)은 u (BRM)과 u (BCS)의 값을 이용하여 계산되며 coverage factor를 곱하여 확장불확도(expanded uncertainty)인 U (dRM)을 계산하였고 교환가능성을 평가하였다. 네 종류 장비에서 측정한 개별 환자 검체, 자가제조물질 및 상품화물질의 결과를 개별 환자 검체의 장비 간 편차의 평균과 참조물질(자가제조물질 및 상품화물질)의 장비 간 편차의 평균의 차이를 이용하여 IFCC group protocol에 따라 분석하였으며, dRM±U (dRM)이 0±교환가능성 평가기준(C) 이내에 있으면 교환가능성이 있고(commutable), 평가기준 범위 밖에 있으면 교환가능성이 없으며(non-commutable), 두 구간이 일부 겹치면 판정보류(incoclusive)로 평가하였다. 검사법 간 측정값 간 편차 측정 시 로그값으로 변환한 값을 이용하였으며 확장계수(coverage factor)는 1.9로 설정하였고, 교환가능성 평가기준(C)은 유럽임상화학진단검사의학회(European Federation of Clinical Chemistry and Laboratory Medicine, EFLM)에서 제공하는 생물학적 변이(biological variation)을 참고하여 desirable bias인 10%로 설정하였기에 궁극적으로 dRM±U (dRM) 구간이 0±0.1 구간 이내에 있는지를 통해 교환가능성을 평가했다.
TSH 검사의 4개 시약 제조사별로 측정한 개별 환자 검체의 측정값에 대한 precision profile을 확인하였고, 개별 환자 검체의 TSH 농도에 따라 검사법 간 편차의 경향성을 확인하기 위해 각 환자 검체에 대한 측정 편차를 로그로 변환한 difference plot을 확인하였다(Figs. 1, 2). Precison profie의 x축은 검사법에서 반복 측정한 환자 검체 농도의 평균값으로, y축은 환자 검체 농도를 로그로 변환한 값의 표준편차로 설청하였으며, difference plot의 x축은 검사법 비교조합에서 측정된 환자 검체 농도의 평균값으로, y축은 검사법 비교조합에서 측정된 환자 검체의 농도 차이를 로그로 변환한 값으로 설정하였다.
네 종류의 검사법을 사용하여 측정한 개별 환자 검체, 자가제조물질 및 상용화 정도관리물질의 결과를 통해 6가지의 검사법 조합에서 참조물질의 dRM±U (dRM)이 0±0.1 이내에 있는지를 확인하였다(Fig. 3). 검사법 비교조합 간의 교환가능성 평가에 error component로서 sample specific effect와 position effect에 대해서 F-test로 검정을 시행하였다. Sample specific effect의 경우, 6가지 검사법 조합에서 유의확률 1% 수준에서 귀무가설을 기각하였고, position effect의 경우 6가지 검사법 조합 중 모든 참조물질에서 유의확률 5% 수준에서 귀무가설을 기각하는 경우는 없었다.
두 개의 자가제조물질(RM2, RM4)은 UniCel DxI 800–Alinity I, UniCel DxI 800–Cobas e801, UniCel DxI 800–Atelica IM 1600, Cobas e801–Atellica IM 1600, Cobas e801–Alinity I, Atelica IM 1600–Alinity I 등 총 6가지의 검사법 간 조합 비교결과분석에서 모두 교환가능성 평가기준 이내에 존재하여 교환가능성이 있었다. 상용화 정도관리물질의 경우 2개의 상용화 물질(RM1, RM3)은 6가지의 비교결과 중 DxI 800–Alinity I, DxI 800–Atelica IM 1600, Cobas e801–Alinity i, Atelica IM 1600–Alinity I 등 네 가지의 검사법 간 조합에서만 교환가능성이 확인되었으며, 나머지 1개의 상용화 물질(RM5)은 6가지의 비교결과 중 DxI 800–Cobas e801, DxI 800–Atellica IM 1600, Atelica IM 1600–Alinity i 등 세 가지의 검사법 간 조합에서만 교환가능성이 확인되었다(Fig. 3).
TSH는 아직까지 기준측정방법이 없으며 임상검사실에서는 일반적으로 면역측정법을 기반으로 하기 때문에 제조사별로 사용하는 항체의 특이성이나 항원결정기의 차이로 인한 측정값에 차이를 보일 수 있으며, 여러 임상검사실의 측정방법 및 측정장비 간 검사결과들의 일치화를 위한 노력이 지속적으로 이뤄지고 있다[10,11]. 2010년 IFCC에서는 갑상선기능검사 항목인 total T4, total T3, free T4, free T3의 표준화를 위해 검사법 간 상관성 평가를 실시하였고, 16가지의 검사법 중 세 가지의 검사법에서 결과값이 측정값의 평균 10% 이상 벗어났고, 환자의 검체를 이용하여 보정 후 16가지 검사법 모두에서 측정값의 평균 10% 이내의 오차를 보였다[5]. 2013년 Miller와 Myers [12]는 측정소급성(traceability)을 위해 환자의 검체와 같이 교환가능성이 있는 검체를 사용하여 보정하는 것과 검사결과의 일치성을 평가하는 외부정도관리에서 교환가능성이 있는 외부정도관리물질을 사용해야 한다고 제안했다.
대한진단검사정도관리협회에서 2023년부터 TSH에 대한 외부정도관리를 별도의 프로그램으로 분리하면서 시범사업(호르몬검사 5)으로 도입하였고, 상용화 정도관리물질 이외에도 폐기되는 혈청을 혼합하여 제조한 검체를 정도관리물질로 사용하였다. 본 연구에서는 IFCC Working Group에서 제안하는 지침에 따라 TSH에 대한 자가제조 검체의 교환가능성을 평가하였는데[3-5,13], 혼주혈청으로 제조한 물질과 상용화 정도관리물질을 네 가지의 플랫폼으로 측정한 결과의 변이계수값은 각각 5% 미만이었으며, 생물학적 변이에 근거한 최적의(optimum) 분석적 허용기준인 12.4% 이내의 우수한 결과를 보였다. 자가제조한 혼주혈청(RM2, RM4)의 경우 6가지의 검사법 비교조합에서 모두 교환가능성이 있었으나 상용화 정도관리물질(RM1, RM3, RM5)의 경우 일부에서 교환가능성이 확인되지 않았다. 특히 RM5의 경우 Cobas e801–Alinity I 조합에서 교환가능성이 없는(non-commutable) 것으로 분석되는데, 이는 기질효과로 인해 결과 차이를 보인 것으로 생각된다. 검사법 비교조합 간의 교환가능성 평가에 error component로서 sample specific effect와 position effect에 대해서 F-test로 검정을 시행하였다, sample specific effect의 경우, 6가지 검사법 조합에서 유의확률 1% 수준에서 귀무가설을 기각하였고, position effect의 경우 6가지 검사법 조합에서 일부 참조물질에 대해 유의확률 5% 수준에서 귀무가설을 기각하였으나 5개의 참조물질에서 귀무가설을 기각하는 검사법 조합은 없었다.
대한진단검사정도관리협회의 신빙도조사 호르몬검사 5 프로그램 2023년 1차 결과보고서에는 TSH 측정값에 대한 동료그룹의 평균농도, 표준편차, 변이계수값, 중앙값, 최솟값, 최댓값이 제공되는데, 상용화 물질(CH5-23-03)의 경우 62기관이 참여한 Alinity i의 평균값은 0.685 μIU/mL으로 146기관이 참여한 Cobas e801의 평균값 0.869 μIU/mL에 비하여 81% 수준의 농도를 보였지만, 교환가능성이 없기 때문에 이 차이가 환자 검체의 검사결과 차이를 반영하지 않으므로 신빙도조사 결과해석에 제한적인 측면이 있다.
본 연구에서는 신빙도조사에 사용되는 자가제조물질 및 상용화 정도관리물질에 대한 교환가능성을 평가하기 위해 IFCC Working Group에서 제안하는 통계방법을 이용하였으므로 개별 환자 검체 결과의 농도변동 및 CLSI 가이드라인에서 제시한 교환가능성 평가법으로 분석하면 결과가 달라질 수 있는 한계점이 있다[8]. 또한 검사법 간 환자 검체 측정값의 편차에 경향성이 있는 경우, 교환가능성 평가를 위해 사용되는 통계량인 dRM, u (dRM)을 계산했을 때 BCS 대신 moving average를, u (BCS)2 대신 u(moving average)2을 이용한 분석을 시행하여 검사법 조합에 따라 다른 변수를 사용한 한계점이 있다. 그렇지만 갑상선자극호르몬 신빙도조사 프로그램에 사용된 두 종류의 자가제조물질을 비롯하여 세 가지 상용화 정도관리물질의 교환가능성을 평가한 결과가 갑상선자극호르몬검사의 신빙도조사 결과를 해석하는 데 도움이 되고 혈청풀을 이용한 자가제조물질의 신빙도조사 사용 확대에 기여할 것으로 생각된다.
이 연구는 대한진단검사정도관리협회의 2023년도 학술연구과제 연구비 지원으로 수행되었다(과제번호: 2023-06).
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |