Lab Med Qual Assur 2024; 46(4): 214-224
Published online December 31, 2024
https://doi.org/10.15263/jlmqa.2024.46.4.214
Copyright © Korean Association of External Quality Assessment Service.
So Young Kang1 , Min-Jeong Kim2
, Min Young Lee1
, Myeong Hee Kim1
, and Woo In Lee1
1Department of Laboratory Medicine, Kyung Hee University College of Medicine; 2Department of Consumer Economics, Sookmyung Women’s University, Seoul, Korea
Correspondence to:So Young Kang
Department of Laboratory Medicine, Kyung Hee University Hospital at Gangdong, 892 Dongnam-ro, Gangdong-gu, Seoul 05278, Korea
Tel +82-2-440-7191
E-mail sykangmd@daum.net
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Background: Thyroid function tests (TFT) produce varying results depending on the method, complicating standardization due to the lack of reference materials and methods. This study aims to harmonize TFT methods by deriving a recalibration equation using percentile transformation.
Methods: Data from the Korean Association of External Quality Assessment Service (2017–2020) were analyzed, focusing on the three most used automated immunoassay analyzers. Outliers were excluded, and data were transformed into percentiles. A recalibration equation was derived through regression analysis, and the harmonization of results before and after recalibration was evaluated. Clinical sample measurements using the three methods and their reference intervals were applied to the recalibration equation.
Results: Before recalibration, significant differences between methods were observed: 1.08 to 2.67 μIU/mL thyroid-stimulating hormone (TSH), 0.17 to 0.49 ng/mL triiodothyronine (T3), and 0.08 to 0.63 ng/dL free thyroxine (FT4). After recalibration, these differences were significantly reduced to 0.09 to 0.23 μIU/mL TSH, 0.002 to 0.006 ng/mL T3, and −0.01 to 0.02 ng/dL FT4. The distribution of clinical sample results remained consistent based on the reference interval before and after recalibration. However, differences persisted when applying clinical sample results to the recalibration equation. The difference in the TSH reference interval increased after recalibration, whereas the FT4 reference interval aligned more closely between methods.
Conclusions: Future studies should include multiple centers, sufficient clinical samples with various result levels, and multiple reagent lots. These studies should derive recalibration equations, and results from healthy individuals using various methods should be applied to establish a common reference interval.
Keywords: Harmonization, Standardization, Thyroid function tests, External quality assessment, Percentile transformation, Recalibration
자동면역장비를 이용한 갑상선기능검사인 갑상선자극호르몬(thyroid stimulating hormone, TSH)과 갑상선호르몬 triiodothyronine (T3)와 free thyroxine 4 (FT4) 검사는 임상검사실에서 가장 많이 시행하는 진단면역검사 중 하나다. 그러나 진단면역검사가 갖는 제조회사별 방법 간 변동성으로 인해 분석법에 따라 서로 다른 결과를 보임에도 참고물질 및/혹은 참고방법의 부재로 인해 표준화(standardization)가 어려운 실정이다. 게다가 결과 해석에 결정적인 참고구간의 설정법까지 동일하지 않아 분석법마다 참고구간이 다르게 설정되어 있다(Table 1). 이로 인해 분석법별 비호환성이 발생하여 보건통계 측면에서는 일관된 통계자료를 얻기 어려워지고, 환자 개인이나 건강보험 측면에서는 검사비용 증가와 결과 해석의 혼동이 초래될 수밖에 없다. 검사의 표준화가 거의 불가능한 현 상황을 해결하기 위한 대안으로 수학적 방법을 통한 조화(harmonization)에 관한 연구가 서구권을 중심으로 진행되었고, 본 연구 또한 이러한 시도의 일환이다.
Table 1 . Comparison of manufacturer’s RIs for TSH, T3, and FT4
A | B | C | |
---|---|---|---|
Instrument (manufacturer) | Architect i2000 (Abbott Diagnostics) | DxI 800 (Beckman Coulter Diagnostics) | Cobas e801 (Roche Diagnostics) |
Principle | Chemiluminescence microparticle immunoassay | Paramagnetic particle chemiluminescence immunoassay | Electrochemiluminescence immunoassay |
Reference material | |||
TSH | WHO 2nd IS 80/558 | WHO 3rd IS 81/565 | WHO 2nd IS 80/558 |
T3 | Triiodo-L-thyroxine solution (CRM) | USP reference material liothyronine | Reference standards by weighing T3 into analyte-free human serum matrix |
FT4 | Internal reference standard | Manufacturer’s working calibrator traceable to USP reference material | Standardized against the Enzymun FT4 test over a chain of Elecsys FT4 generations |
Manufacturer’s RI (unit) | |||
TSH (μIU/mL) | 0.35–4.94 (99 percentiles from 549 individuals defined as normal by the AxSYM ultrasensitive hTSH II and AxSYM FT4 assays) | 0.38–5.33 (97.5 percentiles from 393 healthy euthyroid adults) | 0.27–4.2 (95 percentiles from 516 healthy subjects) |
T3 (ng/mL) | 0.64–1.52 (95 percentiles from 260 individuals determined as normal by ARCHITECT anti-Tg, anti-TPO, and TSH assays) | 0.87–1.78 (95 percentiles from 239 ambulatory subjects) | 0.8–2.0 (95 percentiles from 514 healthy subjects) |
FT4 (ng/dL) | 0.70–1.48 (99 percentiles from 411 individuals determined as normal by AxSYM ultrasensitive hTSH II and AxSYM FT4 assays) | 0.61–1.12 (95 percentile from 316 subjects with TSH value 0.3–3.0 μIU/mL) | 0.93–1.70 (95 percentiles from 801 healthy subjects) |
Abbreviations: RI, reference interval; TSH, thyroid stimulating hormone; T3, triiodothyronine; FT4, free thyroxine; WHO, World Health Organization; IS, international standard; CRM, certified reference material, USP, United State Pharmacopeia.
현재까지 갑상선호르몬 T3와 FT4의 참고방법이 각각 동위원소희석 질량분석법, 평형투석 동위원소희석-액체크로마토그래피 탠덤질량분석법으로 개발되어 있는 반면 TSH의 경우는 개발된 참고물질이나 참고방법이 없는 상황이다. 따라서 현재 갑상선기능검사의 글로벌 표준화를 목표로 IFCC C-STFT (International Federation of Clinical Chemistry and Laboratory Medicine the Committee for Standardization of Thyroid Function Tests)가 주도하여 T3와 FT4의 표준화와 TSH의 조화 과정을 진행하고 있다[1-3]. 그러나 여전히 각 제조사는 이러한 추세와는 별개로 각자의 측정추적성을 수립하여 사용하고 있어, TSH뿐만 아니라 참고방법이 개발되어 있는 T3와 FT4마저 분석법 간 표준화가 이루어지지 않아 분석법 간 결과 차이가 지속되고 있다.
따라서 본 연구에서는 TSH뿐만 아니라 T3와 FT4 이 세 가지 항목 모두에 대해 표준화가 아닌 수학적 방법을 이용한 조화를 목표로 하고자 하였다. 조화는 일종의 수학적 표준화 과정으로, 수학적인 방법으로 유도한 목표값을 마치 참고방법 혹은 참고물질로 측정한 결과로 간주하는 것이다. 분석법 간 결과의 조화를 위해 사용하는 수학적 방법으로는 합의 평균법[4], 요인 분석법(factor analysis) [5], 주성분 분석법(principal component analysis) [6], 분위수 변환법(percentile transformation) [7] 등이 있으며, 본 연구에서는 분위수 변환법을 사용하여 분석법 간 조화된 데이터로 전환한 후 회귀분석을 통해 보정식을 유도하고자 한다.
본 연구의 목적은 첫째, 대한진단검사정도관리협회의 TSH, T3, FT4 신빙도조사사업 결과를 분위수 변환하여 데이터를 전환한 후 유도한 회귀방정식을 보정식으로 사용하여 보정 후 데이터에서 분석법 간 차이가 없어지는지 평가하고, 둘째, 세 종류의 분석장비(분석법)로 실제 임상 검체를 검사한 결과를 이 보정식에 적용했을 때 보정 후에도 각 분석법의 결과 특성을 유지하면서도 분석법 간 차이가 없어지는지 검증하는 것이다.
2017년부터 2020년까지 4년간 대한진단검사정도관리협회에서 시행한 TSH, T3, FT4 신빙도조사사업 결과를 이용하였다. 4년 동안 매년 2회씩 각각 3개의 신빙도조사 검체가 제공되어 총 검체 수는 24개였고, 신빙도조사사업에 참여한 기관에서 가장 많이 사용된 3개 제조사의 자동진단면역장비의 결과를 분석대상으로 하였다. 사분위수 범위(interquartile range, IQR)의 1.5배를 초과하는 범위, 즉 하한 경계 Q1−(1.5×IQR), 상한경계 Q3+(1.5×IQR)를 초과하는 값을 이상치(outlier)로 간주하여 제외한 후 분위수 변환을 적용하였으며, 사용된 신빙도조사사업 데이터 수와 통계치 및 각 분석법의 참고구간은 Table 2와 같다.
Table 2 . Distribution of TSH, T3, and FT4 values measured using three automated immunoassay analyzers in EQA samples
Method | No. | Mean±SD | Median (IQR) | Min | Max |
---|---|---|---|---|---|
TSH (RI, unit μIL/mL) | |||||
A (0.35–4.94) | 3,924 | 9.11±9.94 | 4.70 (0.72–20.70) | 0.05 | 35.02 |
B (0.38–5.33) | 989 | 10.25±11.44 | 5.10 (0.71–22.10) | 0.05 | 35.07 |
C (0.27–4.20) | 6,605 | 11.68±13.08 | 6.03 (0.90–23.86) | 0.01 | 43.52 |
T3 (RI, unit ng/mL) | |||||
A (0.64–1.52) | 3,467 | 1.79±0.913 | 1.68 (0.9–2.52) | 0.04 | 4.46 |
B (0.87–1.78) | 946 | 2.00±1.01 | 1.87 (1–2.8) | 0.25 | 4.81 |
C (0.8–2.0) | 5,750 | 2.30±1.12 | 2.1 (1.21–3.13) | 0.45 | 9.7 |
FT4 (RI, unit ng/dL) | |||||
A (0.70–1.48) | 3,888 | 2.21±1.16 | 2.21 (0.95–3.09) | 0.62 | 9.40 |
B (0.61–1.12) | 930 | 2.30±1.26 | 2.40 (0.82–3.36) | 0.53 | 5.18 |
C (0.93–1.70) | 6,524 | 2.91±1.54 | 2.91 (1.28–4.07) | 0.69 | 7.77 |
Abbreviations: TSH, thyroid stimulating hormone; T3, triiodothyronine; FT4, free thyroxine; EQA, external quality assessment; SD, standard deviation; IQR, interquartile range (25th percentile–75th percentile); Min, minimum; Max, maximum; RI, reference interval.
분위수 변환(percentile transformation)을 통해 데이터를 변환한 후, 변환된 데이터와 원 데이터 간의 회귀분석을 이용해 보정식을 유도하고 보정식에 원 데이터를 대입하여 보정 데이터를 구한 후 보정 전후의 장비 간 차이를 비교하였다. 분위수 변환은 기준이 되는 분포(reference distribution)가 있는 경우 샘플들의 분포를 모두 기준분포와 동일하게 만들거나 기준분포 없이 비교하려는 샘플들의 분포를 완전히 동일하게 만들 때 사용하는 방법이다. 본 연구에서는 후자의 방법을 사용하였으며 간단히 설명하면 다음과 같다. 먼저 샘플 내 결과값을 오름차순으로 정렬한 후 각 샘플의 n번째 값들의 평균을 구하여 각 샘플의 n번째 값으로 대체한 후 정렬된 데이터를 원래 데이터의 순서대로 복구하여 변환된 데이터를 얻었다. 변환된 데이터를 종속변수로, 변환 전 데이터를 독립변수로 하여 회귀방정식을 구하였다. 이때 회귀방정식 유도에는 변환 전 데이터와 변환된 데이터의 상용로그값을 사용하였다. 각 분석법의 보정식으로 사용한 회귀방정식은 Fig. 1과 같으며, 이 보정식에 대입하여 보정 데이터를 구한 후 분석법 간 차이를 평가하기 위해 보정 전과 후 각각에 대해 Friedman test와 paired t-test를 시행하였다.
A사, B사, C사 3개 자동면역검사장비로 실제 임상 검체를 이용하여 TSH, T3, FT4를 각각 측정하였다. 항목별로 저농도, 중간농도, 고농도 임상 검체로 구성하였고, 실험에 사용된 임상 검체 수는 TSH 106개, T3 84개, FT4 79개였다. 각 검체를 동일한 시간에 세 장비로 동시 측정하였고, 각 장비에서 측정한 결과를 유도한 보정식에 대입하여 보정 데이터를 얻었다. 보정 전과 후의 분석법 간 차이를 보기 위해 Friedman test와 paired t-test를 시행하였다. 또한 각 분석법의 참고구간도 유도한 보정식에 대입하여 보정 참고구간을 구하고, 임상 검체 데이터가 보정 후에도 분석법별 참고구간 기준으로 동일한 결과분포를 유지하는지 확인하였다.
생명윤리 및 안전에 관한 법률 시행규칙 제13조, 제33조 및 KHNMCOH SOP 9조에 근거하여 대중에게 공개된 정보를 이용하는 연구 또는 개인식별정보를 수집•기록하지 않고 연구대상자 등에 대한 기존의 자료나 문서를 이용하지 않아 심의면제가 적용되었다(KHNMC 2021-01-025).
R ver. 4.0.2 (The R Foundation for Statistical Computing, Vienna, Austria) 및 MedCalc ver. 22.030 (MedCalc Software Ltd., Ostend, Belgium)을 이용하여 기술통계 및 분위수 변환, 회귀분석, Friedman test, paired t-test 등을 시행하였고 P값이 0.05 미만인 경우 통계적으로 유효한 것으로 간주하였다.
분석법별로 총 24개 신빙도조사 검체 결과의 통계치(before recalibration), 분위수 변환된 결과의 통계치(percentile transformation), 그리고 이 두 통계치 간의 회귀분석으로 유도된 보정식(Fig. 1)에 대입하여 구한 보정결과의 통계치(after recalibration)는 Table 3과 같다. TSH, T3, FT4 세 항목 모두에서 분위수 변환으로 세 가지 분석법 모두 평균값, 중앙값, 표준편차가 동일하게 변환되었음을 확인할 수 있고, 세 검사항목 모두에서 보정 전에는 분석법 간 차이를 보이나 보정 후 분석법 간 차이가 없어짐을 보여주고 있다(Table 3의 Friedman test 결과 참조). 이를 좀 더 자세히 살펴보고자 두 개의 분석법을 각각 짝지어 보정 전후 차이를 분석한 결과는 Table 4와 같다. 보정 전에는 세 가지 검사항목 모두에서 세 가지 분석법 간 차이를 보였고(FT4에서 A vs. B 제외), 분석법 간 평균 차이도 TSH 1.08−2.67 μIU/mL, T3 0.17−0.49 ng/mL, FT4 0.08−0.63 ng/dL을 나타냈으나 보정 후 결과들은 분석법 간 차이를 보이지 않고 분석법 간 평균 차이도 TSH 0.09−0.23 μIU/mL, T3 0.002−0.006 ng/mL, FT4 −0.01−0.02 ng/dL로 확연히 감소함을 볼 수 있다.
Table 3 . Descriptive statistics (means) obtained for EQA data after percentile transformation and then recalibration
Before recalibration | Percentile transformation | After recalibration | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | B | C | P-value* | A | B | C | P-value* | A | B | C | P-value* | |||
TSH | <0.00001 | 0.98 | 0.81 | |||||||||||
1 | 0.70 | 0.67 | 0.85 | 0.75 | 0.74 | 0.75 | 0.78 | 0.72 | 0.72 | |||||
2 | 4.77 | 4.74 | 5.26 | 5.32 | 4.83 | 4.83 | 5.34 | 4.94 | 4.60 | |||||
3 | 23.86 | 25.03 | 27.23 | 28.01 | 25.35 | 25.35 | 26.84 | 25.23 | 24.28 | |||||
4 | 0.73 | 0.71 | 0.83 | 0.79 | 0.79 | 0.71 | 0.81 | 0.77 | 0.71 | |||||
5 | 4.93 | 5.17 | 6.33 | 5.60 | 5.38 | 5.56 | 5.51 | 5.37 | 5.54 | |||||
6 | 25.03 | 27.59 | 34.02 | 29.52 | 28.01 | 29.52 | 28.17 | 27.76 | 30.42 | |||||
7 | 4.91 | 5.16 | 6.34 | 5.56 | 5.32 | 5.60 | 5.50 | 5.36 | 5.55 | |||||
8 | 24.70 | 28.26 | 33.86 | 29.16 | 28.56 | 29.16 | 27.79 | 28.41 | 30.28 | |||||
9 | 0.72 | 0.71 | 0.84 | 0.79 | 0.79 | 0.74 | 0.80 | 0.77 | 0.72 | |||||
10 | 0.70 | 0.70 | 0.93 | 0.75 | 0.75 | 0.79 | 0.78 | 0.76 | 0.79 | |||||
11 | 4.83 | 5.53 | 6.17 | 5.43 | 5.60 | 5.38 | 5.40 | 5.74 | 5.40 | |||||
12 | 23.80 | 29.09 | 32.59 | 25.35 | 29.28 | 28.01 | 26.78 | 29.24 | 29.13 | |||||
13 | 0.69 | 0.70 | 0.94 | 0.74 | 0.75 | 0.79 | 0.77 | 0.76 | 0.80 | |||||
14 | 4.81 | 5.42 | 6.21 | 5.38 | 5.56 | 5.43 | 5.39 | 5.63 | 5.44 | |||||
15 | 24.43 | 28.91 | 33.00 | 28.56 | 29.16 | 28.56 | 27.49 | 29.05 | 29.50 | |||||
16 | 24.78 | 29.50 | 33.98 | 29.28 | 29.52 | 29.28 | 27.88 | 29.64 | 30.39 | |||||
17 | 0.63 | 0.66 | 0.86 | 0.71 | 0.71 | 0.75 | 0.70 | 0.71 | 0.73 | |||||
18 | 4.49 | 5.26 | 6.03 | 4.83 | 5.43 | 5.32 | 5.02 | 5.46 | 5.28 | |||||
19 | 19.73 | 20.82 | 23.28 | 21.28 | 21.28 | 21.28 | 22.18 | 21.06 | 20.72 | |||||
20 | 2.26 | 2.38 | 2.79 | 2.47 | 2.47 | 2.47 | 2.52 | 2.51 | 2.41 | |||||
21 | 0.11 | 0.10 | 0.15 | 0.12 | 0.12 | 0.12 | 0.12 | 0.11 | 0.12 | |||||
22 | 1.93 | 2.06 | 2.41 | 2.13 | 2.13 | 2.13 | 2.15 | 2.18 | 2.08 | |||||
23 | 15.72 | 16.08 | 18.49 | 16.76 | 16.76 | 16.76 | 17.66 | 16.34 | 16.40 | |||||
24 | 0.08 | 0.09 | 0.12 | 0.10 | 0.10 | 0.10 | 0.10 | 0.10 | 0.10 | |||||
Mean±SD | 9.14±10.14 | 10.22±11.61 | 11.81±13.39 | 10.39±11.70 | 10.39±11.70 | 10.39±11.70 | 10.27±11.41 | 10.36±11.64 | 10.50±11.99 | |||||
Median | 4.79 | 5.17 | 6.1 | 5.35 | 5.35 | 5.35 | 5.37 | 5.37 | 5.34 | |||||
T3 | <0.00001 | 0.72 | 0.77 | |||||||||||
1 | 0.91 | 0.10 | 1.27 | 1.04 | 1.02 | 1.07 | 1.08 | 1.03 | 1.07 | |||||
2 | 1.61 | 1.68 | 2.00 | 1.83 | 1.74 | 1.74 | 1.84 | 1.72 | 1.74 | |||||
3 | 2.47 | 2.70 | 3.13 | 2.76 | 2.76 | 2.80 | 2.75 | 2.73 | 2.81 | |||||
4 | 0.91 | 1.01 | 1.20 | 1.05 | 1.07 | 1.02 | 1.08 | 1.04 | 1.01 | |||||
5 | 1.78 | 1.87 | 2.11 | 1.95 | 1.89 | 1.89 | 2.02 | 1.91 | 1.85 | |||||
6 | 2.54 | 2.77 | 3.15 | 2.80 | 2.82 | 2.82 | 2.82 | 2.79 | 2.83 | |||||
7 | 1.68 | 1.85 | 2.09 | 1.87 | 1.87 | 1.87 | 1.91 | 1.88 | 1.83 | |||||
8 | 2.56 | 2.75 | 3.11 | 2.92 | 2.80 | 2.76 | 2.84 | 2.77 | 2.79 | |||||
9 | 0.93 | 1.01 | 1.23 | 1.07 | 1.05 | 1.05 | 1.10 | 1.04 | 1.04 | |||||
10 | 0.86 | 0.97 | 1.21 | 1.02 | 0.98 | 1.04 | 1.02 | 1.00 | 1.02 | |||||
11 | 1.68 | 1.92 | 2.15 | 1.89 | 1.95 | 1.95 | 1.92 | 1.96 | 1.88 | |||||
12 | 2.56 | 2.96 | 3.24 | 2.82 | 2.92 | 2.92 | 2.84 | 2.98 | 2.92 | |||||
13 | 0.82 | 1.00 | 1.18 | 0.99 | 1.04 | 0.99 | 0.98 | 1.04 | 0.99 | |||||
14 | 1.53 | 1.82 | 2.01 | 1.74 | 1.80 | 1.80 | 1.76 | 1.85 | 1.75 | |||||
15 | 2.69 | 3.17 | 3.36 | 3.07 | 3.07 | 3.07 | 2.98 | 3.19 | 3.03 | |||||
16 | 2.59 | 3.13 | 3.28 | 3.00 | 3.00 | 3.00 | 2.88 | 3.15 | 2.96 | |||||
17 | 0.81 | 0.97 | 1.18 | 0.98 | 0.99 | 0.98 | 0.96 | 1.00 | 0.99 | |||||
18 | 1.56 | 1.84 | 2.04 | 1.80 | 1.83 | 1.83 | 1.79 | 1.87 | 1.78 | |||||
19 | 3.53 | 3.85 | 4.47 | 3.94 | 3.94 | 4.02 | 3.84 | 3.85 | 4.11 | |||||
20 | 2.08 | 2.12 | 2.63 | 2.28 | 2.28 | 2.28 | 2.34 | 2.15 | 2.34 | |||||
21 | 0.51 | 0.66 | 0.88 | 0.68 | 0.68 | 0.68 | 0.63 | 0.69 | 0.73 | |||||
22 | 2.30 | 2.38 | 2.82 | 2.50 | 2.50 | 2.50 | 2.57 | 2.41 | 2.52 | |||||
23 | 3.66 | 3.94 | 4.44 | 4.02 | 4.02 | 3.94 | 3.98 | 3.94 | 4.09 | |||||
24 | 0.41 | 0.48 | 0.64 | 0.51 | 0.51 | 0.51 | 0.51 | 0.50 | 0.51 | |||||
Mean±SD | 1.79±0.92 | 1.96±1.05 | 2.28±1.08 | 2.02±1.00 | 2.02±1.00 | 2.02±1.00 | 2.02±0.98 | 2.02±0.99 | 2.02±1.02 | |||||
Median | 1.68 | 1.86 | 2.10 | 1.88 | 1.88 | 1.88 | 1.92 | 1.90 | 1.84 | |||||
FT4 | <0.00001 | 0.93 | 0.81 | |||||||||||
1 | 1.18 | 0.95 | 1.49 | 1.21 | 1.21 | 1.21 | 1.29 | 1.12 | 1.23 | |||||
2 | 2.72 | 2.72 | 3.24 | 2.89 | 2.89 | 2.89 | 3.05 | 2.92 | 2.74 | |||||
3 | 4.87 | 4.34 | 5.68 | 5.05 | 5.05 | 4.68 | 5.58 | 4.47 | 4.92 | |||||
4 | 0.85 | 0.71 | 1.12 | 0.90 | 0.81 | 0.90 | 0.91 | 0.86 | 0.92 | |||||
5 | 2.15 | 2.35 | 2.89 | 2.37 | 2.47 | 2.47 | 2.39 | 2.56 | 2.44 | |||||
6 | 3.44 | 4.03 | 5.00 | 4.08 | 4.19 | 4.19 | 3.89 | 4.18 | 4.31 | |||||
7 | 2.17 | 2.34 | 2.77 | 2.43 | 2.43 | 2.43 | 2.41 | 2.55 | 2.33 | |||||
8 | 3.52 | 3.97 | 4.84 | 4.19 | 4.08 | 4.08 | 3.99 | 4.12 | 4.17 | |||||
9 | 0.85 | 0.71 | 1.17 | 0.93 | 0.78 | 0.93 | 0.92 | 0.86 | 0.96 | |||||
10 | 0.93 | 0.76 | 1.28 | 0.99 | 0.93 | 1.01 | 1.00 | 0.91 | 1.05 | |||||
11 | 2.39 | 2.52 | 3.13 | 2.72 | 2.65 | 2.72 | 2.67 | 2.72 | 2.65 | |||||
12 | 3.20 | 3.47 | 4.21 | 3.71 | 3.59 | 3.59 | 3.62 | 3.64 | 3.60 | |||||
13 | 0.93 | 0.80 | 1.26 | 0.99 | 1.01 | 0.99 | 1.01 | 0.95 | 1.03 | |||||
14 | 2.18 | 2.24 | 2.72 | 2.47 | 2.37 | 2.37 | 2.42 | 2.44 | 2.29 | |||||
15 | 3.09 | 3.32 | 4.01 | 3.48 | 3.48 | 3.48 | 3.49 | 3.50 | 3.43 | |||||
16 | 3.07 | 3.15 | 3.98 | 3.40 | 3.40 | 3.40 | 3.46 | 3.34 | 3.39 | |||||
17 | 0.96 | 0.78 | 1.25 | 1.01 | 0.99 | 0.99 | 1.04 | 0.93 | 1.03 | |||||
18 | 2.30 | 2.36 | 2.97 | 2.65 | 2.53 | 2.53 | 2.57 | 2.56 | 2.51 | |||||
19 | 4.04 | 4.32 | 5.95 | 4.68 | 4.68 | 5.05 | 4.60 | 4.46 | 5.15 | |||||
20 | 2.26 | 2.63 | 3.11 | 2.53 | 2.72 | 2.65 | 2.52 | 2.83 | 2.64 | |||||
21 | 0.71 | 0.73 | 0.93 | 0.78 | 0.90 | 0.78 | 0.76 | 0.88 | 0.75 | |||||
22 | 1.62 | 1.72 | 2.10 | 1.81 | 1.81 | 1.81 | 1.79 | 1.92 | 1.75 | |||||
23 | 3.11 | 3.60 | 4.32 | 3.59 | 3.71 | 3.71 | 3.51 | 3.77 | 3.70 | |||||
24 | 0.73 | 0.78 | 0.97 | 0.81 | 0.99 | 0.81 | 0.79 | 0.93 | 0.79 | |||||
Mean±SD | 2.22±0.24 | 2.30±1.29 | 2.93±1.56 | 2.49±1.34 | 2.49±1.34 | 2.49±1.34 | 2.49±1.35 | 2.48±1.29 | 2.49±1.37 | |||||
Median | 2.22 | 2.36 | 2.93 | 2.50 | 2.50 | 2.50 | 2.47 | 2.56 | 2.48 |
Abbreviations: EQA, external quality assessment; TSH, thyroid stimulating hormone; T3, triiodothyronine; FT4, free thyroxine; SD, standard deviation.
*P-value by Friedman test.
Table 4 . Differences between methods before and after recalibration of EQA data
A vs. B | A vs. C | B vs. C | ||||||
---|---|---|---|---|---|---|---|---|
Before recalibration | After recalibration | Before recalibration | After recalibration | Before recalibration | After recalibration | |||
TSH | ||||||||
Mean difference±SD | 1.08±1.69 | 0.09±0.89 | 2.67±3.43 | 0.23±1.26 | 1.59±1.90 | 0.15±0.73 | ||
P-value* | <0.05 | 0.63 | <0.05 | 0.37 | <0.05 | 0.34 | ||
T3 | ||||||||
Mean difference±SD | 0.17±0.25 | 0.002±0.11 | 0.49±0.17 | 0.006±0.09 | 0.33±0.22 | 0.004±0.10 | ||
P-value* | <0.05 | 0.93 | <0.05 | 0.73 | <0.05 | 0.85 | ||
FT4 | ||||||||
Mean difference±SD | 0.08±0.26 | −0.01±0.27 | 0.71±0.44 | 0.004±0.22 | 0.63±0.33 | 0.02±0.21 | ||
P-value* | 0.12 | 0.85 | <0.05 | 0.93 | <0.05 | 0.73 |
Abbreviations: EQA, external quality assessment; TSH, thyroid stimulating hormone; T3, triiodothyronine; FT4, free thyroxine; SD, standard deviation.
*P-value by paired t-test.
유도한 보정식에 실제 임상 검체 결과(보정 전)를 대입하여 보정 후 결과를 구한 후 보정 전과 후의 분석법 간 차이를 각각 분석한 결과는 Table 5와 Table 6에 정리하였다. 임상 검체 분석결과, 보정 후에도 여전히 분석법 간 차이를 보였다(Friedman test). Paired t-test를 시행했을 때 TSH의 경우 A사와 B사 간, T3의 경우 B사와 C사 간 보정 후 결과 차이가 없어진 것을 제외하고 나머지 모든 비교에서 보정 후에도 분석법 간 차이가 지속되었다.
Table 5 . Descriptive statistics obtained for clinical data before and after recalibration
Before recalibration | After recalibration | ||||||||
---|---|---|---|---|---|---|---|---|---|
A | B | C | P-value* | A | B | C | P-value* | ||
TSH (n=106) | <0.0001 | <0.00001 | |||||||
Lowest value | 0.0003 | 0.001 | 0.005 | 0.00 | 0.00 | 0.00 | |||
Highest value | 42.29 | 42.22 | 46.7 | 47.67 | 42.12 | 41.93 | |||
Mean±SD | 7.06±8.64 | 7.88±9.38 | 8.27±10.12 | 7.93±9.74 | 8.03±9.38 | 7.31±9.07 | |||
Median | 3.80 | 4.09 | 4.42 | 4.25 | 4.27 | 3.85 | |||
T3 (n=83) | <0.00001 | <0.00001 | |||||||
Lowest value | 0.22 | 0.28 | 0.30 | 0.28 | 0.30 | 0.23 | |||
Highest value | 5.20 | 5.77 | 6.51 | 5.53 | 5.72 | 6.15 | |||
Mean±SD | 1.79±1.11 | 1.64±0.95 | 1.93±1.23 | 2.01±1.17 | 1.67±0.94 | 1.71±1.16 | |||
Median | 1.47 | 1.41 | 1.54 | 1.69 | 1.45 | 1.32 | |||
FT4 (n=79) | <0.00001 | 0.0006 | |||||||
Lowest value | 0.73 | 0.60 | 0.95 | 0.78 | 0.73 | 0.77 | |||
Highest value | 3.26 | 4.57 | 7.69 | 3.68 | 4.69 | 6.73 | |||
Mean±SD | 1.68±0.72 | 1.93±1.23 | 2.65±1.63 | 1.86±0.83 | 2.10±1.23 | 2.25±1.44 | |||
Median | 1.44 | 1.34 | 2.02 | 1.58 | 1.53 | 1.68 |
Abbreviations: TSH, thyroid stimulating hormone; T3, triiodothyronine; FT4, free thyroxine; SD, standard deviation.
*P-value by Friedman test.
Table 6 . Differences between methods before and after recalibration of clinical data
Variable | A vs. B | A vs. C | B vs. C | |||||
---|---|---|---|---|---|---|---|---|
Before recalibration | After recalibration | Before recalibration | After recalibration | Before recalibration | After recalibration | |||
TSH | ||||||||
Mean difference±SD | 0.81±2.14 | 0.11±2.16 | 1.21±1.85 | −0.62±1.31 | 0.39±1.54 | −0.72±1.34 | ||
P-value* | 0.0002 | 0.61 | <0.0001 | <0.0001 | 0.01 | <0.0001 | ||
T3 | ||||||||
Mean difference±SD | −0.15±0.34 | −0.34±0.38 | 0.15±0.25 | −0.30±0.24 | 0.30±0.36 | 0.04±0.32 | ||
P-value* | 0.0001 | <0.0001 | <0.0001 | <0.0001 | <0.0001 | 0.28 | ||
FT4 | ||||||||
Mean difference±SD | 0.25±0.55 | 0.24±0.46 | 0.97±0.95 | 0.39±0.67 | 0.73±0.57 | 0.15±0.45 | ||
P-value* | 0.0001 | <0.0001 | <0.0001 | <0.0001 | <0.0001 | 0.004 |
Abbreviations: TSH, thyroid stimulating hormone; T3, triiodothyronine; FT4, free thyroxine; SD, standard deviation.
*P-value by paired t-test.
분석법별 참고구간을 보정식에 대입하여 얻은 보정 참고구간 결과와 임상 검체 결과 분포는 Table 7과 같다. 검증시험에 사용된 임상 검체의 결과 분포는 보정 후에도 참고구간 기준으로 보정 전과 동일한 분포를 유지하였다. 그러나 TSH의 경우 세 분석법의 참고구간의 하한값 차이는 0.11 (0.38−0.27), 상한값 차이는 1.13 (5.33−4.20)이었고, 보정 후에는 각각 0.19 (0.42−0.23), 1.88 (5.54−3.66)로 보정 후 분석법 간의 TSH 참고구간 차이가 더 벌어졌다. T3의 경우는 세 분석법의 참고구간의 하한값 차이는 0.23, 상한값 차이는 0.48이었고, 보정 후 각각 0.24, 0.07로 보정 후 분석법 간의 T3 참고구간 차이가 줄어드는 경향을 보였다. 마지막으로 FT4의 경우 세 분석법의 참고구간의 하한값 차이는 0.32, 상한값 차이는 0.58이었고, 보정 후 각각 0.01, 0.33으로 보정 후 분석법 간의 참고구간이 비슷해졌다(Table 7).
Table 7 . Distribution of clinical data and difference of RI between methods according to the change of RI before and after recalibration
Variable | Central percentiles for RI | Before recalibration | After recalibration | |||
---|---|---|---|---|---|---|
RI | Distribution (low, RI, high) | RI | Distribution (low, RI, high) | |||
TSH (μIL/mL) | ||||||
A | 99.0 | 0.35–4.94 | 4, 58, 44 | 0.39–5.53 | 4, 58, 44 | |
B | 97.5 | 0.38–5.33 | 4, 54, 48 | 0.42–5.54 | 4, 54, 48 | |
C | 95.0 | 0.27–4.20 | 4, 49, 53 | 0.23–3.66 | 4, 49, 53 | |
Difference (LL/UL)* | 0.11/1.13 | 0.19/1.88 | ||||
T3 (ng/mL) | ||||||
A | 95.0 | 0.64–1.52 | 4, 41, 38 | 0.77–1.74 | 4, 41, 38 | |
B | 95.0 | 0.87–1.78 | 12, 48, 23 | 0.90–1.81 | 12, 48, 23 | |
C | 95.0 | 0.80–2.00 | 5, 52, 26 | 0.66–1.75 | 5, 52, 26 | |
Difference (LL/UL)* | 0.23/0.48 | 0.24/0.07 | ||||
FT4 (ng/dL) | ||||||
A | 99.0 | 0.70–1.48 | 0, 42, 37 | 0.75–1.63 | 0, 42, 37 | |
B | 95.0 | 0.61–1.12 | 1, 33, 45 | 0.74–1.30 | 1, 33, 45 | |
C | 95.0 | 0.93–1.70 | 0, 34, 45 | 0.75–1.41 | 0, 34, 45 | |
Difference (LL/UL)* | 0.32/0.58 | 0.01/0.33 |
Abbreviations: RI, reference interval; TSH, thyroid stimulating hormone; T3, triiodothyronine; FT4, free thyroxine; LL, lower limit; UL, upper limit.
*Differences between the minimum and maximum values of the LL and UL of the RI.
본 연구는 신빙도조사사업 결과를 활용하여 국내 임상검사실에서 가장 많이 사용하는 TSH, T3, FT4 면역분석법 결과를 수학적으로 조화시키기 위한 연구이다. 원 데이터와 분위수 변환 데이터를 회귀분석하여 보정식을 유도하고, 원 데이터를 보정식에 대입하여 얻은 보정 데이터에서 분석법 간 차이를 줄이는 조화를 시도하였다. Clerico 등[6]이 시행한 TSH 조화 연구에서 이탈리아에서 시행한 4년간의 72개 신빙도조사 검체와 총 745개의 건강인 및 임상 검체를 주성분분석법을 이용하여 변환시킨 후 보정식을 유도 및 검증하여 조화를 달성하는 과정을 보고하였다. 또한 Padoan 등[7]은 이탈리아 7개 검사실의 검사정보시스템에서 확보한 125,419개의 TSH 결과를 분위수 변환시킨 후 부트스트랩분포를 사용한 로버스트 회귀분석으로 보정식을 유도하고 신빙도조사 데이터세트와 과거 연구에서 사용한 임상 검체 데이터세트로 보정식을 검증하였다. 그러나 본 연구는 단일기관 연구라는 한계를 극복하고자 신빙도조사사업 데이터를 분위수 변환시킨 후 보정식을 유도하고 임상 검체로 보정식을 검증하는 방식을 택하였다. 신빙도조사사업 데이터를 보정식에 적용했을 때는 분석법 간 차이가 사라지며 조화된 결과를 보였으나, 임상 검체 데이터에서는 분석법 각각의 분포 특성을 그대로 유지는 하나 분석법 간 차이가 여전히 존재하여, 본 연구의 신빙도조사사업 데이터에서 유도한 보정식을 임상 검체에 적용하는 검증과정은 실패한 것으로 판정하였다.
이는 신빙도조사사업에 참여한 약 400−500여 개의 검사실이 제출한 신빙도조사사업 결과가 항목별로 10,000−11,000개가 있었음에도 불구하고, 결국 신빙도조사 검체 수는 4년간 24개에 불과하고 검체의 결과값 수준도 매번 비슷한 수치를 갖는 세 수준(low, middle, high)으로 제한되어 분석법의 측정범위를 골고루 포함하지 못했다. 이러한 제한된 조건(검체 수 및 결과값 수준)에서 분위수 변환을 거쳐 회귀분석으로 유도한 보정식이 실제 임상 검체의 다양성을 반영하지 못한 것으로 판단되었다. 물론 신빙도조사 검체와 임상 검체 간의 매트릭스 차이와 각 분석법의 매트릭스에 대한 반응 차이도 영향을 미쳤을 것으로 생각한다. 비록 본 연구에서 신빙도조사사업 데이터로부터 유도한 보정식을 임상 검체에 적용하는 검증과정에 실패했지만, 향후 신빙도조사사업 결과와 함께 다기관연구로 다양한 분석법 및 다양한 시약 lot로 측정범위 전 범위를 포함하는 충분한 수의 임상 검체를 이용하여 보정식을 유도하여 적용할 경우 본 연구의 목적에 도달할 수 있을 것으로 판단한다.
Thienpont 등[3]의 연구에 의하면 항갑상선페록시다제 자가항체 음성이며 혈청 TSH 농도가 10 μIU/mL 미만(Tosoh AIA-2000으로 시행)인 미국인 120명을 대상으로 14개 제조사가 참여한 공통 참고구간 연구에서 재보정 전후의 14개 제조사 전체 참고구간 및 제조사별 참고구간의 중앙값과 백분위수의 범위를 크게 줄여 일관성을 개선했으며 측정의 변동계수도 11.39%에서 4.8%로 감소하여 분석의 변동성도 감소함을 보고하였다. 본 연구에서는 건강인 검체에서 측정한 데이터를 기반으로 설정한 참고구간이 아니라 각 제조사가 제공하는 참고구간을 보정식에 대입하여 보정 참고구간을 구하였다. 본 연구에서 사용한 세 가지 분석법은 각각 서로 다른 참고구간을 가지며, 이를 보정식에 대입하여 얻은 보정 참고구간은 T3와 FT4의 경우 그 차이가 어느 정도 줄어들기는 했으나 여전히 차이가 있었고, TSH의 경우는 보정 후 오히려 더 큰 차이를 보여주고 있다. 신빙도조사사업 결과로부터 분위수 변환을 거쳐 유도하긴 했지만 임상 검체 검증에는 실패한 보정식이기에 각 분석법의 참고구간의 차이를 줄이지 못한 것이 당연할 수도 있지만, 본래 세 가지 분석법의 참고구간 설정기준의 차이도 큰 영향을 주었으리라 본다. 참고구간 설정 기준을 보면(Table 7), 세 가지 분석법 모두 95분위수를 적용한 T3를 제외하고, TSH의 경우 분석법별로 99, 97.5, 95분위수로 서로 다른 기준을 사용하고 있었고, FT4의 경우 한 분석법은 99분위수를, 나머지 두 분석법은 95분위수 기준을 사용하고 있어 보정과정과 관계없이 이 사실만으로도 참고구간의 차이가 줄지 않거나 더 커지는 데 영향을 주었으리라 추측할 수 있다.
본 연구의 목적은 분석법 간 결과의 조화이고, 이를 달성하는 마지막 열쇠는 여러 분석법에 공통으로 적용할 수 있는 공통 참고구간의 설정이다. 분석법 간 서로 다른 결과를 보정하여 비슷한 크기의 숫자로 조화시켰다고 해도 분석법마다 적용하는 참고구간이 여전히 다르다면 결과값 자체의 조화는 사실 큰 의미가 없다. 따라서 향후 충분한 수의 건강인을 대상으로 다양한 분석법으로 검사한 결과를 분석법별 보정식에 대입하여 얻은 보정결과들을 분석법에 상관없이 한 그룹으로 모아 이들을 대상으로 참고구간을 설정하는 방법으로 공통의 참고구간을 설정할 수 있다. 이를 위해서는 상기 설명한 대로 신빙도조사사업 결과뿐만 아니라 다양한 수준의 결과값을 갖는 충분한 수의 임상 검체 및 여러 lot의 시약으로 다기관이 참여한 연구에서 분위수 변환을 거쳐 회귀분석을 통한 정확한 보정식 유도가 선행되어야 한다.
이 논문은 대한진단검사정도관리협회의 2021년 학술연구비 지원을 받아 시행한 결과를 바탕으로 작성되었다(과제번호: 2021-15).
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |