평가배경
로봇 보조 수술은 컴퓨터가 제공하는 3차원 영상을 바탕으로 집도의가 로봇 팔을 원격조정하여 수술을 시행하는 기술이다. 2005년 식품의약품안전처에서 허가된 후 2006년 의료행위전문평가위원회에서 관혈적 수술 대비 재원기간을 단축시키고 수술부위 상처를 적게 하는 등의 장점은 있으나 비용-효과성 등 경제성이 불분명한 점을 들어 비급여로 결정된 바 있다. 이후 지속적으로 로봇 보조 수술의 급여화와 관련한 논의가 있었으며 2022년 건강보험심사평가원(이하 ‘심평원’) 예비 급여부에서는 로봇 보조 수술에 대한 급여 적용 타당성 판단 등 비급여의 급여 추진과 관련하여 의사결정에 필요한 근거자료를 도출하기 위하여 해당 행위의 재평가를 본원에 의뢰하였다(예비급여부-6, 2022.01.05.). 심평원에서는 관련 학회의견을 참조하여 기존수술(복강경 포함) 대비 임상적 유용성이 유사하거나 높은 로봇 보조 수술 및 관련 적응증 54건(11개 영역)에 대하여 평가를 의뢰하였으며 2022년 제2차 의료기술재평가위원회(2022.2.18.)에서 재평가계획서 및 소위원회 구성안에 대한 심의 후 재평가를 수행하였다.
본 평가의 목적은 로봇 보조 수술의 임상적 안전성 및 효과성에 대한 과학적 근거를 제공함으로써 관련 정책적 의사결정을 지원하는 것이며, 본 보고서는 ‘기관, 기관지 및 폐’ 영역의 양성 및 악성 종양 환자에서 로봇 보조 수술이 임상적으로 안전하고 효과적인지 평가하였다.
평가방법
로봇 보조 수술의 안전성 및 효과성 평가를 위해 체계적 문헌고찰을 수행하였다. 모든 평가방법은 평가목적을 고려하여 “로봇 보조 수술 평가 소위원회(이하 ‘소위원회’라 한다)”의 심의를 거쳐 확정하였다. 소위원회 구성은 비뇨의학과 3인, 산부인과 3인, 흉부외과 2인, 이비인후과 2인, 외과 1인, 내분비외과 1인, 근거기반의학 2인의 전문가 14인으로 구성하였다. 소위원회에서는 심평원에서 의뢰한 54건의 로봇 보조 수술에 대하여 질환에 따라 33개 항목으로 재분류하고 재평가를 수행하기로 하였다. 본 보고서는 기관, 기관지 및 폐 영역 중 종양 환자를 대상으로 로봇 보조 수술이 임상적으로 안전하고 효과적인지 평가하였다.
본 평가의 핵심질문은 “기관암, 기관지암 및 폐암 환자에서 로봇 보조 수술은 기존 수술 대비 임상적으로 안전하고 효과적인가?”였다. 안전성 지표는 수술 관련 합병증, 개흉수술 전환율, 효과성 결과는 수술 관련 지표(수술 시간, 출혈량, 수술 중 수혈률, 재원기간, 흉관 삽입기간, 흉관 배액량, 재수술률, 재입원율, 통증), 병리학적 지표(절제 림프절 수, 절제 림프절 구역 수, 병기 상승), 종양학적 지표(무질병 생존율, 전체 생존율)를 평가하였다. 또한, 본 평가의 목적을 고려하여 연구유형은 무작위배정비교임상시험(Randomized controlled trial, RCT)로 제한하였다.
체계적 문헌고찰은 핵심질문을 토대로 국외 3개, 국내 5개 데이터베이스에서 검색하였으며, 문헌 선정과정은 문헌선택 및 배제기준에 따라 6명의 평가자가 짝을 이루어 독립적으로 수행하고, 의견의 불일치가 있는 경우에는 평가자간 합의를 통해 최종 논문을 결정하였다. 문헌의 비뚤림위험 평가는 코크란의 Risk of Bias (RoB)를 사용하여 최종 선택된 문헌을 대상으로 2명의 평가자가 독립적으로 평가를 하였으며, 의견이 불일치한 경우 평가자간 합의를 통해 일치된 결과를 도출하였다. 자료 분석은 기본적으로 비교중재의 유형에 따라 구분하여 수행하였으며, 정량적 분석이 가능할 경우 메타분석을 수행하고 불가능한 경우 질적 검토를 수행하였다. 체계적 문헌고찰 결과는 Grading of Recommendations Assessment, Development and Evaluation (GRADE) 방법론을 이용하여 근거수준을 평가하였으며, 본 평가는 소위원회의 검토의견을 고려하여 의료기술재평가위원회에서 최종심의 후 권고등급을 제시하였다.
평가결과
1. 기관암
기관암 환자에서 로봇 보조 수술에 대한 안전성 및 효과성을 평가하는 체계적 문헌고찰을 수행하였으나 최종 선정된 RCT 문헌은 없었다.
2. 기관지암
기관지암 환자에서 로봇 보조 수술에 대한 안전성 및 효과성을 평가하는 체계적 문헌고찰을 수행하였으나 최종 선정된 RCT 문헌은 없었다.
3. 폐암
폐암 환자에서 로봇 보조 수술에 대한 안전성 및 효과성을 평가하는 체계적 문헌고찰을 수행한 결과, 핵심질문을 충족하는 4개 연구(문헌기준 5편)가 선정되었다. 문헌에서 보고된 연구대상자는 대부분 비소세포폐암(non-small cell lung cancer) 환자로, 주로 조기 폐암에 해당하는 것으로 확인되었다. 또한, 문헌에서 확인된 수술은 대부분 폐엽절제술(lobectomy)에 해당하였으며, 그 외 폐구역절제술(segmentectomy), 쌍폐엽절제술(bilobectomy), 소매폐엽절제술(sleeve lobectomy) 및 폐전적출술(pneumonectomy)이 일부 포함되었다. 비교중재별로는 비디오흉강경수술(video-assisted thoracic surgery)과 비교한 연구는 3개, 개흉수술(thoracotomy)과 비교한 연구는 1개(문헌기준 2편)였다. 평가에 포함된 연구대상자 수는 총 630명(중재군 311명, 비교군 319명)으로, 비디오흉강경수술과 비교한 연구는 총 473명(중재군 232명, 비교군 241명), 개흉수술과 비교한 연구는 총 157명(중재군 79명, 비교군 78명)이었다.
안전성
첫째, 로봇 보조 수술과 비디오흉강경수술을 비교한 연구 RCT 3개였다. 3개 연구에서 모두 시술 관련 합병증을 보고하였으며, 각 연구에서 보고한 개별 합병증들의 군 간 비교 결과, 대부분의 합병증 발생률은 군 간 유의한 차이가 없었다. 특히, 폐암 수술에서 중요한 합병증인 호흡기계 합병증(폐렴 등)에 있어 군 간 차이가 없는 것으로 확인하였다. 다만, 1개 연구(Veronesi et al., 2021)에서 Clavien-Dindo 분류 상, Ⅰ-Ⅱ 단계에 해당하는 합병증이 흉강경수술군(12%, 4명)에 비해 로봇 보조 수술군(32%, 11명)에서 통계적으로 유의하게 많이 발생한 것으로 보고되었다(p=0.04). 개흉수술 전환율은 3개 연구에서 보고하였으며, 메타분석 결과 군 간 차이가 유의하지 않았다.
둘째, 로봇 보조 수술과 개흉수술을 비교한 연구는 RCT 1개가 확인되었다. 해당 연구에서 보고된 모든 개별 합병증은 군 간 유의한 차이가 없었고 로봇 보조 수술에서 개흉수술로의 전환은 보고되지 않았다.
효과성
첫째, 로봇 보조 수술과 비디오흉강경수술을 비교한 연구는 RCT 3개가 확인되었다. 3개 연구에서 보고된 수술시간은 메타분석 결과 군 간 유의한 차이가 없었다. 수술 중 출혈량은 1개 연구에서 로봇 보조 수술군에서 비디오흉강경수술군에 비해 유의하게 적은 것으로 보고하였다. 수술 중 수혈률은 1개 연구에서 군 간 차이가 유의하지 않은 것으로 보고되었다. 재원기간과 흉관 삽입기간은 3개 연구에서 모두 군 간 유의한 차이가 없는 것으로 보고하였다. 흉관 배액량은 1개 연구에서 비디오흉강경수술군에 비해 로봇 보조 수술군에서 유의하게 많은 것으로 보고하였다. 재수술률은 1개 연구에서 군 간 유의한 차이가 없는 것으로 보고되었다. 2개 연구에서 보고한 재입원율은 메타분석 결과 군 간 유의한 차이가 없었다. 2개 연구에서 보고한 수술 직후 통증 결과는 군 간 유의한 차이가 없었다. 2개 연구에서 비디오흉강경수술군에 비해 로봇 보조 수술군에서 절제 림프절 수, 절제 림프절 구역 수가 유의하게 많은 것으로 보고하였다. 병기 상승은 2개 연구에서 군 간 차이가 유의하지 않은 것으로 보고하였다. 로봇 보조 수술과 비디오흉강경수술을 비교한 연구에서 생존 결과는 보고되지 않았다.
로봇 보조 수술과 비디오흉강경수술을 비교한 연구 3개에서 보고된 효과성 결과를 요약하면, 비디오흉강경수술군에 비해 로봇 보조 수술군에서 통계적으로 출혈량이 유의하게 적고, 흉관 배액량, 절제 림프절 수 및 절제 림프절 구역 수가 유의하게 많은 것으로 확인되었다. 반면에 수술시간, 수술 중 수혈률, 재원기간, 흉관 삽입기간, 재수술률, 재입원율, 통증, 병기 상승은 군 간 차이가 유의하지 않았으며, 생존 결과는 보고되지 않았다.
둘째, 로봇 보조 수술과 개흉수술을 비교한 연구는 RCT 1개가 확인되었다. 해당 연구에서 수술시간은 군 간 유의한 차이가 없는 것으로 보고하였다. 개흉수술군에 비해 로봇 보조 수술군에서 수술 중 출혈량이 많은 환자의 비율이 유의하게 적었다. 재원기간은 군 간 유의한 차이가 없었다. 개흉수술군에 비해 로봇 보조 수술군에서 흉관 삽입기간이 유의하게 더 짧았고, 흉관 배액량은 군 간 유의한 차이가 없는 것으로 보고되었다. 수술 중 수혈률, 재수술률, 재입원율은 보고되지 않았다. 수술 직후 통증이 개흉수술에 비해 로봇 보조 수술군에서 유의하게 낮은 것으로 보고되었다. 절제 림프절 수/절제 림프절 구역 수는 군 간 유의한 차이가 없었다. 무질병 생존율, 전체 생존율은 수술 후 3년까지 추적관찰한 결과 두 군 간 유의한 차이가 없는 것으로 보고되었다.
로봇 보조 수술과 개흉수술을 비교한 연구 1개에서 보고된 효과성 결과를 요약하면, 개흉수술군에 비해 로봇 보조 수술군에서 통계적으로 출혈량이 유의하게 적고, 흉관 삽입기간이 유의하게 짧고, 수술 후 통증은 유의하게 적은 것으로 확인되었다. 그러나, 수술시간, 재원기간, 흉관 배액량, 절제 림프절 수/절제 림프절 구역 수, 무질병 생존율, 전체 생존율은 군 간 차이가 유의하지 않았다.
결론 및 제언
소위원회에서는 현재 문헌적 근거를 바탕으로 다음과 같이 결과 및 의견을 제시하였다.
ⅰ) 기관암 환자에서 로봇 보조 수술에 대한 RCT 문헌은 확인되지 않아, 소위원회에서는 해당 질환에서 로봇 보조 수술이 기존 수술과 비교하여 안전하고 효과적인지 판단할 수 없다고 평가하였다. 또한, 향후 잘 설계된 임상연구를 기반으로 한 안전성과 효과성에 대한 근거가 필요하다고 제언하였다.
ⅱ) 기관지암 환자에서 로봇 보조 수술에 대한 RCT 문헌은 확인되지 않아, 소위원회에서는 해당 질환에서 로봇 보조 수술이 기존 수술과 비교하여 안전하고 효과적인지 판단할 수 없다고 평가하였다. 또한, 향후 잘 설계된 임상연구를 기반으로 한 안전성과 효과성에 대한 근거가 필요하다고 제언하였다.
ⅲ) 폐암 환자에서 로봇 보조 수술은 기존 치료법(비디오흉강경수술 및 개흉수술)과 유사한 수준의 합병증 발생률을 보여 안전하다고 판단하였다. 효과성 측면에서 비디오흉강경수술에 비해 출혈량이 유의하게 적고, 절제 림프절(구역) 수가 더 많았으며, 개흉수술에 비해서도 출혈량이 더 적고, 흉관 삽입기간은 짧고, 수술 후 통증은 더 적은 잇점을 확인하였다. 그 외 수술전후 결과(perioperative outcome)는 대부분 기존 치료법과 유사한 수준인 것으로 확인되었으며, 생존결과는 개흉수술과 비교 시 유의한 차이가 없는 것으로 확인되었다. 이에 소위원회에서는 폐의 악성 종양 환자에서 종양제거술 시 로봇 보조 수술은 안전하고, 비디오흉강경수술 및 개흉수술의 대안적 치료방법으로 적용 가능한 효과적인 치료법이라고 평가하였다(근거의 신뢰수준, Low~Moderate).
2022년 제12차 의료기술재평가위원회(2022.12.09.)에서는 의료기술재평가사업 관리지침 제4조 제10항에 의거 “로봇 보조 수술”에 대하여 로봇 보조 수술이 사용되는 전반적인 항목을 대상으로 문헌적 근거를 검토한 소위원회의 결론에 대하여 종합적으로 심의하였다.
ⅰ) 의료기술재평가위원회는 기관암 환자에서 로봇 보조 수술의 임상적 안전성과 효과성 등을 판단할 RCT 문헌을 확인하지 못하여 국내 임상상황에서 기관암 환자를 대상으로 수행하는 로봇 보조 수술의 권고등급을 결정할 수 없어 ‘불충분’으로 심의하였다(권고등급: 불충분).
ⅱ) 의료기술재평가위원회는 기관지암 환자에서 로봇 보조 수술의 임상적 안전성과 효과성 등을 판단할 RCT 문헌을 확인하지 못하여 국내 임상상황에서 기관지암 환자를 대상으로 수행하는 로봇 보조 수술의 권고등급을 결정할 수 없어 ‘불충분’으로 심의하였다(권고등급: 불충분).
ⅲ) 의료기술재평가위원회는 임상적 안전성과 효과성의 근거 및 그 외 평가항목 등을 종합적으로 고려하였을 때, 국내 임상상황에서 폐암 환자에서 로봇 보조 수술의 사용을 ‘조건부 권고함’으로 심의하였다(권고등급: 조건부 권고함).
주요어
로봇 보조 수술, 최소침습수술, 비디오흉강경수술, 개흉수술, 폐암
Robotic Surgical Procedure, Minimally Invasive Surgery, Video-Assisted Thoracic Surgery, Thoracotomy, Lung cancer
Background
The
sympathetic skin response test (SSRT) assesses autonomic nervous system
function in patients
with or suspected of having autonomic dysfunction by using an electromyograph to induce micro sweat secretion on
the hands and feet and measuring the resultant skin conductance.
SSRT
was listed as a registered non-benefit item in 2010, and subsequently, the
Preliminary Coverage Division of the Health Insurance Review and Assessment
Service (HIRA) commissioned the National Evidence-based Healthcare
Collaborating Agency to conduct a reassessment of seven autonomic neuropathy
test items, including this test—SSRT, autonomic neuropathy [orthostatic blood
pressure test, Valsalva maneuver, sustained handgrip test, heart rate
variability test, and skin conductance test], and quantitative sudomotor axon
reflex test—for expansion of insurance coverage to include non-benefit items
(January 2022). Accordingly, the reassessment of clinical safety and
effectiveness was conducted after a review of the reassessment plan and the
proposed integration subcommittee composition of the applicable technologies
during the 2nd session of the Committee of Health
Technology Reassessment in 2022 (February 18, 2022).
Methods
A
systematic review was performed to assess the clinical safety and effectiveness
of SSRT for assessing patients with or suspected of having autonomic
dysfunction. All assessment methods were finalized
through discussions with the “Integration subcommittee for autonomic neuropathy
tests” (hereinafter referred to as the “subcommittee”) with
consideration of the assessment’s purpose. The subcommittee consisted of 11 experts:
three from neurology and two each from endocrinology and metabolism,
cardiology, psychiatry, and evidence-based medicine.
The
key question of the assessment was, “Is SSRT clinically safe and effective for
assessing the autonomic nervous system function in
patients with or suspected of having autonomic dysfunction?” Safety was assessed based on test-related adverse events (AEs)
or complications, while effectiveness was assessed based on diagnostic
accuracy, association with the disease, and impact on health outcomes.
In
the systematic review, three international databases
(Ovid MEDLINE, Ovid EMBASE, and Cochrane Central
Register of Controlled Trials) and five domestic databases (KoreaMed, KMbase, KISS, KERIS, and ScienceON) were
searched based on the key question. Article selection
based on inclusion/exclusion criteria, data extraction, and risk of bias (RoB)
assessment were performed independently by two reviewers, and in cases of
disagreement, a consensus was reached after discussion with a third person.
RoB assessment was performed using Quality Assessment of Diagnostic Accuracy Studies-2
(QUADAS-2). In
the data analysis, the results for diagnostic accuracy were
qualitatively described since the patient populations and diagnostic criteria
varied and a 2 × 2 table of values for each article could not be extracted. Regarding
the disease association, trends in the results were identified based on a forest plot
using odds ratios (ORs) for the patient-control group (analysis of the patient
group and those without the disease), disease-control group (comparison between
different disease groups), presence/absence of autonomic neuropathy, disease
subtypes, and disease severity.
Results
A
total of 46 articles (12 diagnostic test evaluation studies and 34
patient-control studies) were selected from the systematic review, which
reported diagnostic accuracy and association with the disease as the safety and
effectiveness outcomes.
In
the RoB assessment, “high” RoB was observed in 93.5% of the patient selection
domain; “uncertain” in 28.3% of the index test domain; “uncertain” in 56.5% of
the reference standard domain; and “high” in 2.2% of the flow and timing
domain. Meanwhile, concerns about applicability were “uncertain” in 80.4% of
the patient selection domain; “uncertain” in 39.1% of the index test domain;
and “high” in 2.2% of the reference standard domain.
Safety
With
respect to the safety of SSRT, two articles reported no test-related AEs.
Accordingly, the subcommittee determined that SSRT is a safe technology.
Effectiveness
The effectiveness outcomes were classified into diagnostic
accuracy and association with the disease, with no articles reporting about their
impact on health outcomes.
The
diagnostic accuracy of SSRT was reported in 12 articles. In two articles that
reported on the diagnostic accuracy for autonomic neuropathy or cardiovascular
autonomic neuropathy in diabetic patients, sensitivity was 0.62–0.87 and specificity
was 0.66–0.88. In terms of diagnostic accuracy for cardiovascular autonomic
neuropathy, sensitivity was 0.40 and specificity was 1.00 for values measured
from the hands, and sensitivity was 0.75 and specificity was 0.96 for values
measured from the feet. In two articles that reported on the diagnostic
accuracy for small fiber neuropathy, sensitivity was 0.33–0.43 and specificity was
0.77, while the diagnostic accuracy for multiple system atrophy (MSA) and
progressive (primary) autonomic nervous system disorder had a sensitivity of 0.88
and specificity of 1.00. In addition, the diagnostic accuracy for carpal tunnel
syndrome had a sensitivity of 0.34 and specificity of 0.89. In two articles
that reported on the diagnostic accuracy for transthyretin familial amyloid
polyneuropathy, sensitivity was 0.53–0.94 and specificity was 0.57–0.96. In two
articles that reported on the diagnostic accuracy for complex regional pain
syndrome, sensitivity was 0.13–0.83 and specificity was 0.57–0.96. In one
article that reported on the diagnostic accuracy of Machado-Joseph disease, sensitivity
was 0.73 and specificity was 0.97.
In
the analysis of disease association, 36 articles reported the rates of abnormal
SSRT results by presence/absence of autonomic neuropathy in disease-control
groups, presence/absence of disease symptoms, disease severity, and
specific disease characteristics. The study populations varied and included
patients with diabetes, Parkinson’s disease, complex regional pain syndrome,
small fiber neuropathy, and MSA. Regarding the presence/absence of autonomic
neuropathy (n=11), the rates of abnormal SSRT results were significantly higher
in the group with autonomic neuropathy, while comparisons between
disease-control groups (n=9) showed no significant differences in the rates of
abnormal SSRT results. With respect to the presence/absence of disease symptoms
(n=6), the groups with symptoms generally showed higher abnormal rates, with a
significant difference in the rates of abnormal SSRT results between the
groups. Meanwhile, no significant differences were found in abnormal rates
between groups based on disease severity (n=5) or specific disease
characteristics (n=5).
According
to the subcommittee, SSRT lacks a standardized test method, is not widely used
in clinical practice, is not mentioned in any guidelines unlike other autonomic
nervous system tests, and is not included in the composite indicators for
assessing autonomic neuropathy. Nonetheless, SSRT has the advantage of being a
simple test based on sweat using a relatively low-cost device, which offers
high accessibility to clinical-level medical institutions. Additionally, the
subcommittee stated that although SSRT is a safe test, its low sensitivity
suggests that it may be used for screening rather than diagnosing specific
diseases.
Conclusions
Based
on the current assessment results, the subcommittee presented the following
recommendations.
SSRT
was determined to be a safe test for patients with or suspected of having
autonomic dysfunction since it involves the use of an electromyograph outside
the body.
Varying expert opinions on the effectiveness of SSRT included: i) Due to its limited usage in clinical practice
and low sensitivity, SSRT is a technology lacking sufficient evidence to
ascertain its effectiveness and clinical usefulness; ii) Although
it is considered a useful test, SSRT requires
more study results, including composite indicators, since it lacks evidence as
a stand-alone test; iii) this
technology can be helpful for clinical diagnosis, considering that assessment
of autonomic dysfunction is based on a combination of various autonomic nervous
system tests in clinical practice; and iv) despite being helpful for clinical
diagnosis, this technology has limited evidence.
In
the first session of the Committee of Health
Technology Reassessment in 2023 (January 13, 2023),
the following determinations and grades of recommendation were made on SSRT
based on a review of the subcommittee findings, including various expert
opinions.
SSRT
was determined to be a safe test that involves the use of an electromyograph
outside the body. Regarding its effectiveness, this technology can be helpful
for clinical diagnosis, considering that assessment of autonomic dysfunction is
based on a combination of various autonomic nervous system tests in clinical
practice.
Accordingly,
the Committee of Health Technology Reassessment “conditionally
recommends” the use of SSRT for the purpose
of assessing autonomic nervous system function in
patients with or suspected of having autonomic dysfunction according to the
clinical situation or value in Korea based on comprehensive
consideration of the evidence of its clinical safety and effectiveness and
other assessment items.
Keywords:
Autonomic neuropathy,
Sympathetic skin response (SSR), Safety, Effectiveness