평가배경
아밀로이드베타[정밀면역검사]는 경도인지장애 환자 중 전구 알츠하이머병 치매 의심환자(prodromal Alzheimer's disease dementia), 알츠하이머병 치매 의심환자(preclinical Alzheimer's disease dementia)를 대상으로 알츠하이머병 치매(Alzheimer's disease dementia) 예측과 진단을 위해 뇌척수액 검체를 이용하여 아밀로이드베타(amyloid beta, Aβ) 42 를 정밀면역검사로 정량측정하는 기술이다.
동 기술은 2017년 제5차 신의료기술평가위원회(2017.5.26.)에서 안전성 및 유효성이 있는 기술로 고시된 후 2018년에 비급여로 등재된 기술이다(보건복지부 고시 제2018-103호, 2018.5.31.). 동 기술은 2020년 의료기술재평가사업의 내부모니터링을 통해 재평가 주제로 발굴되었으며, 2020년 제8차 의료기술재평가위원회 (2020.8.14.)에서 안전성 및 유효성에 대해 총 7인(신경과 2인, 정신건강의학과 2인, 진단검사의학과 2인, 근거기반의학 1인)으로 구성된 소위원회에서 체계적 문헌고찰을 통해 평가하도록 심의되었고 2021년 제7차 의료기술재평가위원회(2021.7.9.)에서 최종심의하였다.
평가 방법
해당 평가는 경도인지장애 환자 중 전구 알츠하이머병 치매 의심환자, 알츠하이머병 치매 의심환자를 대상으로 알츠하이머병 치매의 질환 예측 및 진단하는데 있어 보조검사로서 임상적으로 안전하고 유효한지 평가하기 위해 체계적 문헌고찰을 수행하였다.
모든 평가방법은 평가목적을 고려하여 “아밀로이드베타[정밀면역검사] 소위원회(이하 ‘소위원회’라 한다)”의 심의를 거쳐 확정하였다. 평가의 핵심질문은 “인지장애 환자 중 전구 알츠하이머병 치매 의심환자, 알츠하이머병 치매 의심환자를 대상으로 알츠하이머병 치매의 질환 예측 및 진단하는데 보조검사로서 임상적으로 안전하고 유효한가?”이었고, 안전성은 뇌척수액 채취에 따른 이상반응 또는 부작용을, 유효성은 진단정확성, 질환 예측 정확성, 의료결과에의 영향을 평가하였다.
체계적 문헌고찰은 위의 핵심질문을 토대로 국내 데이터베이스 5개(KoreaMed, 의학논문데이터베이스, 학술데이터베이스, 한국교육학술정보원, 과학기술정보통합서비스) 및 국외 데이터베이스 3개(Ovid MEDLINE, Ovid EMBASE, Cochrane Central Register of Controlled Trials)을 이용하여 문헌검색하였으며, 문헌 선정기준 및 배제기준 적용을 통한 문헌선택과 자료추출, 비뚤림위험평가는 모두 2명의 평가자가 독립적으로 수행하였고, 의견 불일치가 있을 경우 제3자와 함께 논의하여 합의하였다. 진단법평가 문헌의 비뚤림위험평가는 Quality assessment of diagnostic accuracy studies-2 (QUADAS-2)을 사용하였다. 소위원회의 검토의견을 고려하여 의료기술재평가위원회에서 최종심의 후 권고등급을 제시하였다.
평가 결과
아밀로이드베타[정밀면역검사]의 안전성과 유효성은 총 91편(국내 7편, 국외 84편)에 근거하여 평가하였다. 의료결과별로는 알츠하이머병 치매 진단 관련 진단정확성은 73편, 질환 예측 정확성은 18편에서 확인되었으며, 의료결과에의 영향을 보고한 문헌은 확인되지 않았다. 진단정확성은 알츠하이머병 치매 환자와 대조군이 포함된 연구대상에서 알츠하이머병 치매 진단에 대한 진단정확성으로 확인하였으며, 대조군은 연구별로 건강대조군, 다른 원인의 치매, 다른 신경학적 질환 등 다양하게 포함되었다. 질환 예측 정확성은 경도인지장애 환자를 대상으로 추적관찰하여 알츠하이머병 치매 발생을 진단정확성 및 위험비로 나타내었다. 연구 대부분 진단적 환자대조군 연구설계로 전체 문헌의 87.9%에서 환자선택 비뚤림이 ‘높음’으로 평가되었다.
안전성 결과는 다음과 같다.
뇌척수액 채취와 관련된 안전성 결과를 보고한 연구는 3편으로 이 중 2편에서는 심각한 이상반응은 발생되지 않은 것으로 제시하였으며, 1편에서는 자가혈액봉합술이 필요한 환자 1명을 제외하고는 요통 1%, 두통 0.8%, 어지럼증 0.7%으로 나머지 이상반응은 경미하고 일시적인 것으로 보고되었다.
이에 소위원회에서는 Blenno 등(1993)에서 노인인구에서 치매 진단 목적으로 뇌척수액 검사를 수행할 때 두통이 가장 흔한 부작용으로 2% 정도 관찰되며, 간단한 약물로 쉽게 치료한 것으로 보고한 연구결과를 참고하였을 때 이번 평가에서 확인된 뇌척수액 채취 관련 이상반응 수준은 기존의 뇌척수액검사와 유사한 수준으로 안전성은 수용가능한 것으로 판단하였다.
유효성 결과는 다음과 같다.
알츠하이머병 치매 질환 진단 관련 진단정확성 결과는 다음과 같다.
알츠하이머병 치매 환자군과 건강대조군 감별에 대한 진단정확성(28편)은 통합 민감도 0.82, 통합 특이도 0.84, 통합 곡선하면적(area under the curve, 이하 AUC) 0.90로 나타났으며, 이 중 1편은 18F 플루트메타몰 양전자방출단층촬영(positron emmition tomography, 이하 PET) 검사와 진단정확성을 비교시 PET검사가 약간 더 높게 나타났다.
알츠하이머병 치매 환자군과 다른 원인의 치매환자군 감별에 대한 진단정확성(16편)은 통합 민감도 0.81, 통합 특이도 0.67, 통합 AUC 0.81로 나타났다.
알츠하이머병 치매 환자군과 다른 신경학적 질환 환자군 감별에 대한 진단정확성(11편)은 통합 민감도 0.84, 통합 특이도 0.81, 통합 AUC 0.88로 나타났다.
알츠하이머병 치매 환자군과 여러 질환이 혼합된 환자군 감별에 대한 진단정확성(15편)은 통합 민감도 0.82, 통합 특이도 0.75, 통합 AUC 0.85로 나타났으며, 이 중 1편은 18F 플로르베타벤 PET 검사와 비교시 중재검사의 임계값에 상관없이 모두 PET 검사의 진단정확성이 더 높게 나타났다.
알츠하이머병 치매 환자군과 경도인지장애 환자(mild cognitive impairment, 이하 MCI)군 감별에 대한 진단정확성(5편)은 통합 민감도 0.83, 통합 특이도 0.86, 통합 AUC 0.91로 나타났다.
질환 예측 정확성에 대한 결과는 다음과 같다.
경도인지장애 환자(MCI)를 대상으로 알츠하이머병 치매 질환 발생 예측에 대한 진단정확성(14편)은 통합 민감도 0.82, 통합 특이도 0.79, 통합 AUC 0.85로 나타났다.
이 중 자기공명영상검사(magnetic resonance imaging, 이하 MRI)검사와 비교결과를 제시한 연구는 2편으로 1편은 중재검사의 민감도는 MRI 검사보다 낮았으나 특이도는 MRI 검사보다 높게 보고되었다. 다른 1편에서는 중재검사의 민감도는 MRI 검사보다 높고 특이도는 MRI 검사보다 낮게 나타났다.
뇌파검사와 비교결과를 제시한 1편에서 중재검사는 P300 latency와 비교시 민감도는 높았으나 특이도는 낮았고, P300 amplitude와 비교시 민감도는 유사하였으며, 특이도는 더 높았다. 뇌파검사에 중재검사를 추가했을 때 민감도, 특이도 모두 상승하였다.
MCI 환자 중 알츠하이머병 치매 발생 위험을 제시한 연구는 3편으로 1년~3년 추적관찰시 위험비(hazard ratio, 이하 HR)가 1.7~16.4로 유의하게 높게 나타났다.
이에 소위원회에서는 알츠하이머병 치매가 질병이 계속 진행되는 질환 특성을 가지고 있기 때문에 한 시점에서 하나의 검사결과만으로 질환을 정확히 진단내리기는 어려울 수 있다는 의견이었다. 하지만 여러 가지 원인의 치매가 의심될 경우 혹은 여러 원인이 같이 병발되어 있는 치매를 의심할 경우 알츠하이머병으로 인한 치매인지 확인하기 위해 아밀로이드베타, 총타우단백, 인산화타우단백에 대한 검사가 보조적으로 도움이 될 수 있고, 동 검사가 PET에 비해 상대적으로 저렴하면서 객관적인 수치를 제공하여 알츠하이머병으로 인한 치매 확인을 위한 여러가지 객관적인 자료가 필요할 경우 유용할 수 있다는 의견이 있었다.
특히 아밀로이드베타는 뇌에 플라크가 침착되는 정도를 의미하며 총타우단백 및 인산화타우단백은 신경손상정도를 의미하여 각각 임상적으로 의미하는 바가 다르기 때문에 각각 단독검사로서 임상에 적용하는 것 보다 세 가지 검사가 상호보완적으로 같이 활용되는 것이 임상적으로 질환 진단에 더 도움이 된다는 의견이 있었다. 다만 실제 치매가 의심되는 경우 임상에서는 정확한 원인에 대한 진단보다는 장기요양소견서나 약물 사용 등과 같은 요구가 더 많고 환자 대상군이 대부분 고령이면서 동 검사가 뇌척수액검사라는 침습적인 특징이 있음을 고려했을 때 원인 진단 목적으로 동 검사 수행에 대한 임상적 수요는 많지 않을 수 있다는 의견이 있었다.
소위원회에서는 현재 평가결과와 관련하여 기 신의료기술평가결과와 비교시 문헌 수가 상대적으로 많이 축적되어졌으나, 연구유형이나 진단정확성 결과에 크게 차이가 나지 않으며, 임계값 역시 표준화되어있지 않아 동 검사의 유용성을 충분히 입증하기에는 아직 문헌적 근거가 제한적이라는 의견이 있었다. 특히 대부분 선택문헌이 진단적 환자대조군 연구설계로 선택비뚤림위험의 잠재성으로 인해 진단정확성 결과가 과대평가되었을 가능성이 있으며, 연구대상자에서 대조군의 종류별로 진단정확성의 경향성을 전체적으로 파악하는 정도로만 이해할 수 있고, 현재 평가결과만으로 정확히 어떤 연구대상자에서 어떤 시점에서 더 유용하게 동 검사가 활용될 수 있다고 보기는 어렵다고 판단하였다. 또한 보조검사로서의 유용성을 입증하기 위해 추가검사로서의 이득을 확인할 수 있는 연구결과와 질환 예측에 대한 보조검사로서 유용성을 확인하기 위해서는 여러 관련 변수들을 포함해서 질환 발생 가능성에 대한 확률을 계산할 수 있는 공식들에 대한 연구들이 필요하며, 현재 가이드라인이나 진단기준에 Aβ42/40, t-tau/p-tau 비율 등의 계산식을 활용한 지표들의 활용내용도 포함되고 있어 이러한 지표에 대한 평가도 향후 같이 이루어질 필요가 있다는 의견이 있었다.
결론 및 제언
아밀로이드베타[정밀면역검사] 소위원회는 현재 평가 결과에 근거하여 다음과 같이 제언하였다.
아밀로이드베타[정밀면역검사]는 경도인지장애 환자 중 전구 알츠하이머병 치매 의심환자, 알츠하이머병 치매 의심환자를 대상으로 알츠하이머병 치매 예측과 진단을 위해 뇌척수액 검체를 이용하여 수행시 문헌에서 보고된 뇌척수액 채취 관련 이상반응 수준이 기존의 뇌척수액검사와 유사하므로 안전성은 수용가능하며, 유효성은 i) 유효한 기술로 판단된다는 의견, ii) 유효한 기술로 판단되나 그 근거가 아직 제한적이라는 의견, iii) 유효한 기술로 판단하기에 근거가 부족하다는 의견, iv) 세 가지 검사를 같이 종합해서 판단할 때 유효한 검사일 가능성이 더 높다고 판단되나 이에 대한 문헌적 근거는 제한적이라는 의견으로 전문가 간 이견이 있었다.
2021년 제7차 의료기술재평가위원회(2021.7.9.)에서는 소위원회 검토 결과에 근거하여 의료기술재평가사업 관리지침 제4조 제10항에 의거 “아밀로이드베타[정밀면역검사]”에 대해 다음과 같이 심의하였다.
아밀로이드베타[정밀면역검사]는 뇌척수액 채취 관련 이상반응 수준이 기존의 뇌척수액 검사와 유사한 수준으로 안전성은 수용가능한 것으로 판단하였으며, 경도인지장애 환자 중 전구 알츠하이머병 치매 의심환자, 알츠하이머병 치매 의심환자를 대상으로 알츠하이머병 치매 예측과 진단을 위한 검사로써 진단정확성은 수용가능한 수준으로 유효한 기술로 판단되나 임계값이 확립되어있지 않고 추가검사로서의 이득을 확인할 수 있는 근거가 부족하여 그 근거가 아직 제한적이라는 소위원회 의견에 동의하였다.
이에 따라 의료기술재평가위원회는 경도인지장애 환자 중 전구알츠하이머병 치매 의심환자, 알츠하이머병 치매 의심환자를 대상으로 알츠하이머병 치매 예측과 진단을 위한 검사로써 안전성은 수용가능하고 유효한 의료기술로 판단되나 그 근거가 아직 제한적이어서 아밀로이드베타[정밀면역검사]를 조건부 권고로 심의하였다.
주요어
알츠하이머병, 치매, 아밀로이드베타 42, 뇌척수액, 안전성, 유효성
Alzheimer's disease, Dementia, Amyloid beta 42, Cerebrofluid, Safety, Effectiveness
Amyloid beta [High quality immunoassay]
Background
The amyloid beta
(Aβ42) [High quality immunoassay] is a test to quantitatively measure the
levels of Aβ42 in the cerebrospinal fluid (CSF) with the purpose to predict or
diagnose Alzheimer's disease dementia (ADD) in suspected prodromal or
preclinical Alzheimer's disease dementia.
The technique
was determined to be safe and effective by the 5th New Health Technology
Assessment Committee in 2017 (May 26, 2017). This test has been
non-reimbursable coverage since 2018 (Ministry of Health and Welfare
Notification No. 2018-103; May 31, 2018). The technique was determined to
require reassessment during internal monitoring, and a reassessment plan was
approved by the 8th Health Technology Reassessment Committee of 2020 (August
14, 2020) and a relevant subcommittee was designated. The 7th Health Technology
Reassessment Committee of 2021(July 9, 2021) concluded the safety and
effectiveness of the technique.
Methods
To assess the
safety and effectiveness of the Aβ42 [High quality immunoassay], a systematic
review of the current literature was performed. All assessment methods were
designed, approved, and carried out by the Aβ42 [High quality immunoassay]
Reassessment Subcommittee (hereinafter referred to as the subcommittee) through
discussions about the purpose of the assessment. The subcommittee consisted of
seven experts: two neurologists, two mental health professionals, two
specialists in the field of laboratory medicine, and one specialist in the
field of evidence-based medicine.
The key question
of the assessment was the following: “is the Aβ42 [High quality immunoassay] a
clinically safe and effective adjunct test to predict and diagnose ADD in
suspected prodromal or preclinical ADD?” Safety was assessed by examining the
reported adverse events or complications deriving from CSF collection.
Effectiveness was assessed based on diagnostic accuracy, disease prediction
accuracy, and the impacts on clinical outcome.
Relevant
articles were sourced from three international database (Ovid MEDLINE, Ovid
EMBASE, and Cochrane Central Register of Controlled Trials) and five domestic
(KoreaMed, KMBASE, KISS, KERIS, and KISTI) databases.
Two reviewers
independently screened the available literature and selected relevant articles
based on the designated inclusion and exclusion criteria and assessed the risk
of bias for selected articles. After screening, the two reviewers converged on
a single conclusion, and in the case of disagreement, a third party was
appointed to help reach an agreement. The Quality Assessment of Diagnostic
Accuracy Studies-2 tool was employed to evaluate the risk of bias. Based on the
results of the systematic review, the Health Technology Reassessment Committee
determined the level of recommendation according to the Grading of
Recommendations.
Results
A total of 91
articles were selected and analyzed. Of these, seven were published in South
Korea and 84 were published overseas. The safety and effectiveness of the
technique were reported by 91 articles, while its diagnostic and prediction
accuracy were examined by 73 and 18 articles, respectively. No article reported
on the impact on clinical outcome. Diagnostic accuracy was identified the
diagnosis of ADD with subjects including the ADD and the control groups varying
from healthy controls and patients with non-Alzheimer's disease-related
dementia, to subjects with other neurological diseases. Disease prediction
accuracy of ADD was analyzed according to the diagnosis accuracy and risk ratio
for the occurrence of ADD after follow-up of patients with mild cognitive
impairment. Disease prediction accuracy of ADD was analyzed according to the
diagnosis accuracy and risk ratio for the occurrence of ADD after follow-up of
patients with mild cognitive impairment. Among the selected articles, 87.9%
showed a high level of risk of bias in patient selection.
Safety
Among the three
articles reporting on the safety of the technique, two studies reported no
severe adverse events related to CFS collection, while one study found mild and
transient reactions, including back pain (1%), headache (0.8%), and dizziness
(0.7%), with the exception of one case in which an epidural blood patch was
performed. In this regard, the subcommittee confirmed an existing study (Blenno
et al., 1993), and in that study, when performing a cerebrospinal fluid test
for the purpose of diagnosing dementia in the elderly population, headache was
observed as the most common side effect in about 2%, and simple drugs reported
to be easily treated with. The subcommittee judged that the safety of this
technique was acceptable because the level of adverse events related to
cerebrospinal fluid collection confirmed in this evaluation was judged to be
similar to that of the existing cerebrospinal fluid test.
Effectiveness
In studies aimed
at distinguishing patients with ADD from healthy individuals (n = 28), the
overall sensitivity and specificity of the technique were 0.82 and 0.84,
respectively, with an area under the curve (AUC) of 0.90. In one of these
studies, the 18F flutemetamol positron emission tomography (PET) test showed
slightly higher diagnostic accuracy compared to the Aβ42 [High quality
immunoassay]. In studies aiming at differentiating patients with ADD from those
with non-AD-related dementia (n = 16), the overall sensitivity, specificity,
and AUC were 0.81, 0.67, and 0.81, respectively. When distinguishing ADD from
other neurological diseases (n = 11), the overall sensitivity of the Aβ42 [High
quality immunoassay] was 0.84, the specificity was 0.81, and the AUC was 0.88.
In studies aiming at distinguishing patients with ADD from individuals with
several additional diseases (n = 15), the overall sensitivity, specificity, and
AUC were 0.82, 0.75, and 0.85, respectively. Studies examining the
effectiveness of this technique in differentiating patients with ADD from those
with MCI (n = 5), the overall sensitivity was 0.83 and specificity was 0.86,
with an AUC of 0.91.
Concerning
disease prediction accuracy, studies examining the accuracy of the Aβ42 [High
quality immunoassay] in predicting the development of ADD in patients with MCI
(n = 14) have reported an overall sensitivity, specificity, and AUC of 0.82,
0.79, and 0.85, respectively. Among these studies, two compared this technique
with magnetic resonance imaging (MRI). One reported that the sensitivity of the
the Aβ42 [High quality immunoassay] was lower than that of the MRI test, but
the specificity was reported to be higher than that of the MRI test. The other
study reported that the sensitivity of the the Aβ42 [High quality immunoassay]
was higher than that of the MRI test, but the specificity was reported to be
lower than that of the MRI test. When comparing the Aβ42 [High quality immunoassay]
with electroencephalography (EEG), one study reported that the sensitivity of
the assay was greater than that of P300 latency, but specificity was lower. In
addition, sensitivity was similar, and specificity was higher when comparing
the assay to P300 amplitude. Both sensitivity and specificity increased upon
combining this technique with EEG. Lastly, in studies assessing the risk of
developing ADD in patients with MCI (n = 3), hazard ratios were significantly
high at 1.7-16.4 during the 1–3-year follow-up period.
Accordingly, the
subcommittee suggested the opinion that it may be difficult to accurately
diagnose the disease with only one test result at a time because Alzheimer's
disease dementia has the characteristic of a disease in which the disease progresses
but in patients suspected of having mixed dementia or dementia with other
comorbidities, the Aβ42, total tau protein, and pTau protein immunoassays can
be helpful as adjunct tests to confirm the diagnosis of AD and moreover, as the
Aβ42 assay is less expensive and provides more objective results than PET, this
technique is likely to obtain more reliable data.
In particular,
the subcommittee presented the following opinions. As Aβ42 indicates the level
of plaque deposition in the brain, while total tau and pTau levels describe the
level of neurological damage, the concomitant testing of these three
parameters, rather than the examination of just one, could be more clinically
useful. However, in clinical practice, patients with suspected dementia are
more likely to request long-term care referral reports or drug treatment rather
than of an accurate diagnosis of the cause of dementia. In addition,
considering the invasiveness of these tests, which are generally performed in
older adults, their clinical application is suggested to be low.
Lastly, even
though a greater number of articles was available for this review than that
assessed in the previous New Health Technology Assessment, study designs and
results did not vary greatly. In addition, threshold values have yet to be
standardized. In fact, most of the selected articles reported a high risk of
patient selection bias, which could have led to the overestimation of the
diagnostic accuracy of the Aβ42 [High quality immunoassay]. Therefore, the subcommittee
has determined that, based on the current evidence, it is possible that only
overall trends in diagnostic accuracy can be identified and it is not possible
to define the level of usefulness of this technique for each relevant patient
population and at which specific points during disease course the Aβ42
immunoassay should be performed. In addition, the subcommitte suggests that to
determine the effectiveness of this assay, more research exploring its benefits
as an additional test should be conducted; specifically, studies should focus
on calculating the probability of developing disease by incorporating several
variables. And the current guidelines and diagnostic criteria also include the
use of indicators using formulas such as Aβ42/40 and t-tau/p-tau ratio, so the
subcommittee suggested that evaluation of these indicators is necessary in the
future.
Conclusions and recommendations
Based on the
level of evidence gathered from this systematic review, the subcommittee
suggests the following:
For the
prediction and diagnosis of ADD in suspected prodromal or preclinical ADD, the
Aβ42 [High quality immunoassay] was an acceptable level of safety as it leads
to similar adverse effects during CSF collection as other conventional CFS
tests. As regards effectiveness, the opinions of subcommittee members varied:
i) the technique is effective; ii) it is effective, but the current evidence is
insufficient; iii) the current evidence is insufficient to appropriately
determine efficacy; and iv) When the three tests(total tau, pTau, and amyloid
beta) are combined and judged together, it is judged that the possibility of
becoming a effective test is higher, but the current evidence is limited.
The 7th Health
Technology Reassessment Committee in 2021 (July 9, 2021) drew the following
conclusions regarding the Aβ42 [High quality immunoassay] based on the
subcommittee review and Article 4 Paragraph 10 of the Health Technology
Reassessment Guideline:
The Aβ42 [High
quality immunoassay] is a safe test as it leads to similar adverse events
during CSF collection as other conventional CFS tests. Concerning the
prediction and diagnosis of ADD in suspected prodromal or preclinical ADD, the
technique displays an acceptable level of diagnostic accuracy and thus can be
considered effective. However, it was judged that the evidence was still
limited because the threshold value was not established and the evidence to
confirm the benefit as an additional test was insufficient.
In conclusion,
the Health Technology Reassessment Committee decided that the safety of Aβ42
[High quality immunoassay] is acceptable and it is effective technology when
used for the purpose of predicting and diagnosing Alzheimer's disease dementia
for patients with suspected prodromal or preclinical ADD. However, the current
evidence is still limited, so it was deliberated on the conditional
recommendation.
Keywords: Alzheimer's disease, dementia, amyloid
beta 42, cerebrospinal fluid, mild cognitive impairment