평가배경
총아밀라아제는 급성췌장염 등을 진단하기 위한 검사이며 신의료기술평가제도가 확립되기 이전에 급여로 등재된 기술로 내부모니터링을 통해 발굴되었다. 본 검사는 전문적·심층적 검토를 통해 임상적 안전성 및 효과성 등을 확인하고 의료기술의 적정 사용을 위한 정책적 의사결정에 지원하고자 2023년 제6차 의료기술재평가위원회(2023.6.2.)에서 의료기술재평가 안건으로 선정되어 재평가를 수행하였다.
평가방법
총아밀라아제의 안전성 및 효과성을 평가하기 위해 체계적 문헌고찰을 수행하였다. 모든 평가방법은 평가목적을 고려하여 “총아밀라아제와 췌장아밀라아제 소위원회(이하 ‘소위원회’라 한다)”의 논의를 거쳐 확정하였다. 소위원회 구성은 소화기내과 2인, 진단검사의학과 2인, 근거기반의학 1인의 전문가 5인으로 구성하였다.
본 평가는 급성췌장염 의심환자를 대상으로 급성췌장염 진단 목적에 초점을 맞추어 검체는 혈액으로 제한하였고, 특정 검사원리에 국한하지 않고 평가하였다. 이후 소위원회에서는 적응증과 검체를 안건명에 반영하여 “급성췌장염 의심환자에서 혈중 총아밀라아제”로 최종안건명을 변경하였다.
핵심질문은 “혈중 (총)아밀라아제는 급성췌장염 의심환자에서 급성췌장염 진단 및 예측 목적으로 사용시 임상적으로 안전하고 효과적인가?”이었으며, 안전성은 검사 관련 부작용 및 이상반응, 검사 관련 위해, 효과성은 급성췌장염 진단정확성, 내시경역행담췌관조영술(endoscopic retrograde cholangiopancreatography, ERCP) 후 췌장염(post-ERCP pancreatitis, PEP) 예측정확성, 병행검사로 인한 이득을 평가하였다.
체계적 문헌고찰은 핵심질문을 토대로 국외 3개, 국내 3개 데이터베이스에서 검색하였으며, 문헌 선정과정은 선택 및 배제기준에 따라 두 명의 평가자가 독립적으로 수행하고, 의견이 불일치한 경우 평가자간 합의를 통해 최종 선택문헌을 결정하였다. 비뚤림위험 평가는 QUADAS-2 (Quality Assessment of Diagnostic Accuracy Studies-2)를 사용하여 최종 선택문헌을 대상으로 두 명의 평가자가 독립적으로 평가하였고, 의견이 불일치한 경우 평가자간 합의를 통해 일치된 결과를 도출하였다. 사전에 정한 자료추출 서식을 활용해 자료를 추출하고, 양적 분석이 가능한 경우 메타분석을 하였다.
평가결과
최종 선택문헌은 진단적 코호트 연구 14편이었으며, 급성췌장염 진단 목적의 문헌은 5편, PEP 예측 목적의 문헌은 9편이었다. 비뚤림위험 평가결과 14편 중 6편이 후향적 코호트 연구로 환자선택 영역의 비뚤림위험을 높음(64.3%)으로 평가하였다. 중재검사는 참고표준검사 기준 중 일부 기준으로 포함되어 있어 서로의 결과로부터 독립적인 해석이 어렵다고 판단하였다. 또한, 동일 문헌에서 다양한 임계치의 결과값을 보고하고 있어 중재검사 영역의 비뚤림위험은 높음(43.9%), 불확실(42.9%), 참고표준검사 영역의 비뚤림위험은 불확실(57.1%)로 평가하였다.
안전성
혈중 총아밀라아제의 안전성 결과를 보고한 문헌은 없었다.
효과성
혈중 아밀라아제의 효과성은 급성췌장염의 진단정확성 및 PEP 예측정확성과 병행검사로 인한 이득에 대해 평가하였다.
급성췌장염 진단 목적에서 혈중 아밀라아제와 리파아제의 진단정확성은 총 5편에서 보고하였다. 정상상한치 3배 이상에서 혈중 아밀라아제의 진단정확성은 통합 민감도 0.69, 통합 특이도 0.95, 통합 곡선하면적(area under the curve, AUC) 0.71이었고, 혈중 리파아제는 통합 민감도 0.75, 통합 특이도 0.95, 통합 AUC 0.69였다.
PEP 예측 목적에서 혈중 아밀라아제와 리파아제의 예측정확성은 각 5편, 3편에서 보고하였다. ERCP 시행 후 3-4시간 시점에서 정상상한치 3배 이상의 혈중 아밀라아제의 예측정확성은 통합 민감도 0.71, 통합 특이도 0.91, 통합 AUC 0.77이었고, 혈중 리파아제는 통합 민감도 0.87, 통합 특이도 0.86, 통합 AUC 0.74이었다. 하위군 분석 결과, ERCP 시행 후 3-4시간 시점에서 정상상한치 4-5배 이상의 혈중 아밀라아제의 예측정확성은 5편에서 보고하였고, 통합 민감도 0.67, 통합 특이도 0.93, 통합 AUC 0.74이었다. 정상상한치 5-6배 이상에서 혈중 리파아제의 예측정확성은 3편에서 보고하였고, 통합 민감도 0.94, 통합 특이도 0.86, 통합 AUC 0.99이었다. 정상상한치 10배 이상에서 혈중 아밀라아제와 리파아제의 예측정확성은 각 1편, 2편에서 보고하였고, 혈중 아밀라아제는 민감도 0.21, 특이도 0.99이었고, 혈중 리파아제는 통합 민감도 0.95, 통합 특이도 0.88, 통합 AUC 0.92였다.
병행검사로 인한 이득은 PEP 예측 목적의 문헌 1편에서 보고하였다. ERCP 시행 후 24시점에서 정상상한치 3배 이상의 혈중 아밀라아제의 예측정확성 결과는 민감도 0.67, 특이도 0.80, 양성우도비 3.42, 음성우도비 0.41, 진단교차비는 8.3, Yuden index는 0.47이었다. 혈중 리파아제의 예측정확성은 민감도 0.86, 특이도 0.92, 양성우도비 11.1, 음성우도비 0.15, 진단교차비는 73.4, Yuden index는 0.78로 혈중 아밀라아제 대비 리파아제의 예측정확성이 높았다. 또한, 두 검사를 모두 시행했을 때 진단민감도는 0.86로 혈중 리파아제를 단독으로 시행했을 때보다 추가 이득을 확인할 수 없었다.
결론 및 제언
소위원회에서는 현재의 문헌적 근거를 바탕으로 다음과 같이 제언하였다.
혈중 총아밀라아제는 체외 진단검사로서 혈액 채취과정 이외 인체에 직접적인 위해를 가하지 않고, 급성췌장염을 진단하는 기준 중 생화학 기준의 일부 검사인 점을 고려했을 때, 위양성 또는 위음성으로 인한 위해 위험은 낮아 안전한 기술로 판단하였다. 효과성은 급성췌장염 진단 목적에서 비교검사 대비 민감도가 낮고, 특이도는 유사한 수준으로 병행검사 시 추가 이득을 확인할 수 없었다. 다만, 증상유무와 내원시기에 따라 각 검사(췌장효소)의 수치 상승 시점이 다르고, 다른 질환과 감별진단 시 각 검사 결과들을 종합하여 판단하는 점을 고려했을 때, 임상진단에 도움이 되는 기술로 판단하였다. 특히, ERCP 시행 후 췌장염을 조기예측하여 급성췌장염이 아닌 환자를 배제하는데 임상적으로 유용하다고 판단하였다.
2024년 제2차 의료기술재평가위원회(2024. 2. 16.)에서는 의료기술재평가사업 관리지침 제4조 제10항에 의거 “급성췌장염 의심환자에서 혈중 총아밀라아제”에 대해 다음과 같이 심의하였다.
의료기술재평가위원회는 임상적 안전성과 효과성의 근거 및 그 외 평가항목 등을 종합적으로 고려하였을 때, 국내 임상상황에서 급성췌장염 의심환자를 대상으로 다른 질환과 감별하여 종합적인 판단을 통해 급성췌장염을 진단하는 데 도움이 되며, 내시경역행성담췌관조영술 후 췌장염이 아닌 환자를 조기 예측하는데 유용하여 혈중 총아밀라아제 사용을 ‘권고함’으로 심의하였다.
주요어
급성췌장염, 내시경역행성담췌관조영술 후 췌장염, 혈청 (총)아밀라아제, 혈청 리파아제
Acute pancreatitis, Post-endoscopic retrograde cholangiopancreatography pancreatitis, Serum (total) amylase, Serum lipase
Serum Total Amylase Test for Acute Pancreatitis
Background
The serum total amylase test for diagnosing acute
pancreatitis was identified through relevant internal monitoring as a covered
technology before establishing the New Medical Technology Assessment System.
This test was selected as a medical technology reassessment agenda for the 6th
Medical Technology Reassessment Committee in 2023 (June 2, 2023) to confirm
clinical safety and effectiveness through expert and in-depth reviews and to
support policy decision-making for the appropriate use of medical technologies.
Methods
A systematic review was conducted to evaluate the
safety and effectiveness of the serum total amylase test. The “Subcommittee on
Total Amylase and Serum Pancreatic Amylase Tests” (“the Subcommittee”)
discussed and finalized all methods, taking into account the objectives of the
assessment. The subcommittee comprised five experts: two from gastroenterology,
two from diagnostic laboratory medicine, and one from evidence-based medicine.
This evaluation focused on diagnosing acute
pancreatitis in patients with suspected acute pancreatitis, with specimens
limited to blood, and was not limited to any specific test. The subcommittee revised
the final agenda title to “Serum Total Amylase Test in Patients with Suspected
Acute Pancreatitis” to reflect the indications and specimens.
The key question was: “Is the serum total amylase
test clinically safe and effective for diagnosing and predicting acute pancreatitis
in patients with suspected acute pancreatitis?” Safety was assessed based on
test-related adverse events and test-related harm; effectiveness was assessed
based on accuracy of acute pancreatitis diagnosis and accuracy of predicting post-endoscopic
retrograde cholangiopancreatography (ERCP) pancreatitis (post-ERCP
pancreatitis, PEP).
The systematic review was conducted using three
international and three domestic databases based on the key questions. The
literature selection process was conducted independently by two reviewers
according to the inclusion and exclusion criteria. In the event of
disagreement, the final articles were selected by consensus among the
reviewers. The risk of bias in the literature was assessed independently by two
reviewers using the Quality Assessment of Diagnostic Accuracy Studies-2; in the
event of disagreement, consensus was reached by inter-reviewer agreement. Data
were extracted using a predetermined data extraction format, and meta-analysis
was performed when quantitative analysis could be performed.
Results
The final selection included 14 diagnostic cohort
studies, with five studies for diagnosing acute pancreatitis and nine for
predicting PEP. The risk of bias assessment revealed that in six of the 14
retrospective cohort studies, the risk of bias in the patient selection area
was high (64.3%). Since the intervention test was included as part of the
reference standard test criteria, it was considered difficult to interpret the
results independently. Furthermore, the risk of bias for the intervention test
domain was assessed as high (43.9%) and uncertain (42.9%), while the risk of
bias for the reference standard test domain was assessed as uncertain (57.1%)
due to the different thresholds reported in the same literature.
Safety
No studies reported safety outcomes for the serum
total amylase test.
Effectiveness
The effectiveness of serum amylase was assessed in
terms of the accuracy of diagnosing acute pancreatitis and predicting PEP, as
well as the benefit of combined testing.
Five studies reported on the diagnostic accuracy of
serum amylase and lipase in diagnosing acute pancreatitis. The diagnostic
accuracy of serum amylase at three times the upper limit of normal was 0.69
with an integrated sensitivity, 0.95 with an integrated specificity, and 0.71
with an integrated area under the receiver operating characteristic curve (AUC)
of 0.75. Serum lipase had an integrated sensitivity of 0.75, an integrated
specificity of 0.95, and an integrated AUC of 0.69.
The predictive accuracy of serum amylase and lipase
for PEP prediction was reported in five and three studies, respectively. At 3–4 h post-ERCP, the predictive accuracy of the serum amylase above three
times the upper limit of normal was 0.71 with an overall sensitivity of 0.91,
overall specificity of 0.91, and overall AUC of 0.77; for serum lipase, the
overall sensitivity was 0.87, overall specificity was 0.86, and overall AUC was
0.74. A subgroup analysis showed that the predictive accuracy of serum amylase
above four to five times the upper limit of normal at 3–4 h post-ERCP
was reported by five studies, with an overall sensitivity of 0.67, overall
specificity of 0.93, and overall AUC of 0.74. The predictive accuracy of serum
lipase above five to six times the upper limit of normal was reported in three
studies, with an overall sensitivity of 0.94, overall specificity of 0.86, and
overall AUC of 0.99. The predictive accuracy of serum amylase and lipase above ten
times the upper limit of normal was reported in one and two studies,
respectively, with a sensitivity of 0.21 and specificity of 0.99 for serum
amylase and an overall sensitivity of 0.95, overall specificity of 0.88, and
overall AUC of 0.92 for serum lipase.
The benefit of combined testing was reported in one
study for PEP prediction. At 24 h post-ERCP, the predictive accuracy of serum
amylase above three times the upper limit of normal was 0.67 with a sensitivity
of 0.80, specificity of 0.80, positive likelihood ratio of 3.42, negative
likelihood ratio of 0.41, diagnostic cross-value of 8.3, and Yuden index of
0.47. The predictive accuracy of serum lipase was high compared to serum
amylase, with a sensitivity of 0.86, specificity of 0.92, positive likelihood
ratio of 11.1, negative likelihood ratio of 0.15, diagnostic cross-value of
73.4, and Yuden index of 0.78. Furthermore, the diagnostic sensitivity of both
tests was 0.86, indicating no additional gain over serum lipase alone.
Conclusion and Suggestions
Based on the current literature, the subcommittee
made the following recommendations.
Considering that blood total amylase is an in vitro
diagnostic test that does not directly harm humans other than the blood
collection process and is part of the biochemical criteria for diagnosing acute
pancreatitis, the risk of harm from false positives or false negatives is low; it
is considered a safe technology. Efficacy was lower in sensitivity and similar
in specificity compared to the control test for diagnosing acute pancreatitis,
and no additional benefit was achieved from combined testing. However,
considering that the time of elevation of each test (pancreatic enzyme) differs
depending on the presence of symptoms and the timing of the visit and that the
results of each test are judged in aggregate for differential diagnosis with
other diseases, it is considered a technology that aids clinical diagnosis. In
particular, it is clinically useful for early prediction of pancreatitis after
ERCP to exclude patients who do not have acute pancreatitis.
In 2024, the 2nd Medical Technology Reassessment
Committee (February 16, 2024) deliberated on “serum total amylase test for patients
with suspected acute pancreatitis” in accordance with Article 4, Paragraph 10
of the Guidelines for the Management of Medical Technology Reassessment
Projects.
Based on comprehensive consideration of the
evidence regarding clinical safety and effectiveness and other assessment
items, the Medical Technology Reassessment Committee “recommended” that blood
total amylase be used to help diagnose acute pancreatitis by differentiating it
from other diseases in patients with suspected acute pancreatitis in clinical
situations in Korea, and for early prediction of patients with PEP.
Keywords: Acute pancreatitis,
Post-endoscopic retrograde cholangiopancreatography pancreatitis, Serum (total)
amylase, Serum lipase