평가배경
로봇 보조 수술은 컴퓨터가 제공하는 3차원 영상을 바탕으로 집도의가 로봇 팔을 원격조정하여 수술을 시행하는 기술이다. 2005년 식품의약품안전처에서 허가된 후 2006년 의료행위전문평가위원회에서 관혈적 수술 대비 재원기간을 단축시키고 수술부위 상처를 적게 하는 등의 장점은 있으나 비용-효과성 등 경제성이 불분명한 점을 들어 비급여로 결정된 바 있다. 이후 지속적으로 로봇 보조 수술의 급여화와 관련한 논의가 있었으며 2022년 건강보험심사평가원(이하 ‘심평원’) 예비 급여부에서는 로봇 보조 수술에 대한 급여 적용 타당성 판단 등 비급여의 급여 추진과 관련하여 의사결정에 필요한 근거자료를 도출하기 위하여 해당 행위의 재평가를 본원에 의뢰하였다(예비급여부-6, 2022.01.05.). 심평원에서는 관련 학회의견을 참조하여 기존수술(복강경 포함) 대비 임상적 유용성이 유사하거나 높은 로봇 보조 수술 및 관련 적응증 54건(11개 영역)에 대하여 평가를 의뢰하였으며 2022년 제2차 의료기술재평가위원회(2022.2.18.)에서 재평가계획서 및 소위원회 구성안에 대한 심의 후 재평가를 수행하였다.
본 평가의 목적은 로봇 보조 수술의 임상적 안전성 및 효과성에 대한 과학적 근거를 제공함으로써 관련 정책적 의사결정을 지원하는 것이며, 본 보고서는 ‘기관, 기관지 및 폐’ 영역의 양성 및 악성 종양 환자에서 로봇 보조 수술이 임상적으로 안전하고 효과적인지 평가하였다.
평가방법
로봇 보조 수술의 안전성 및 효과성 평가를 위해 체계적 문헌고찰을 수행하였다. 모든 평가방법은 평가목적을 고려하여 “로봇 보조 수술 평가 소위원회(이하 ‘소위원회’라 한다)”의 심의를 거쳐 확정하였다. 소위원회 구성은 비뇨의학과 3인, 산부인과 3인, 흉부외과 2인, 이비인후과 2인, 외과 1인, 내분비외과 1인, 근거기반의학 2인의 전문가 14인으로 구성하였다. 소위원회에서는 심평원에서 의뢰한 54건의 로봇 보조 수술에 대하여 질환에 따라 33개 항목으로 재분류하고 재평가를 수행하기로 하였다. 본 보고서는 기관, 기관지 및 폐 영역 중 종양 환자를 대상으로 로봇 보조 수술이 임상적으로 안전하고 효과적인지 평가하였다.
본 평가의 핵심질문은 “기관암, 기관지암 및 폐암 환자에서 로봇 보조 수술은 기존 수술 대비 임상적으로 안전하고 효과적인가?”였다. 안전성 지표는 수술 관련 합병증, 개흉수술 전환율, 효과성 결과는 수술 관련 지표(수술 시간, 출혈량, 수술 중 수혈률, 재원기간, 흉관 삽입기간, 흉관 배액량, 재수술률, 재입원율, 통증), 병리학적 지표(절제 림프절 수, 절제 림프절 구역 수, 병기 상승), 종양학적 지표(무질병 생존율, 전체 생존율)를 평가하였다. 또한, 본 평가의 목적을 고려하여 연구유형은 무작위배정비교임상시험(Randomized controlled trial, RCT)로 제한하였다.
체계적 문헌고찰은 핵심질문을 토대로 국외 3개, 국내 5개 데이터베이스에서 검색하였으며, 문헌 선정과정은 문헌선택 및 배제기준에 따라 6명의 평가자가 짝을 이루어 독립적으로 수행하고, 의견의 불일치가 있는 경우에는 평가자간 합의를 통해 최종 논문을 결정하였다. 문헌의 비뚤림위험 평가는 코크란의 Risk of Bias (RoB)를 사용하여 최종 선택된 문헌을 대상으로 2명의 평가자가 독립적으로 평가를 하였으며, 의견이 불일치한 경우 평가자간 합의를 통해 일치된 결과를 도출하였다. 자료 분석은 기본적으로 비교중재의 유형에 따라 구분하여 수행하였으며, 정량적 분석이 가능할 경우 메타분석을 수행하고 불가능한 경우 질적 검토를 수행하였다. 체계적 문헌고찰 결과는 Grading of Recommendations Assessment, Development and Evaluation (GRADE) 방법론을 이용하여 근거수준을 평가하였으며, 본 평가는 소위원회의 검토의견을 고려하여 의료기술재평가위원회에서 최종심의 후 권고등급을 제시하였다.
평가결과
1. 기관암
기관암 환자에서 로봇 보조 수술에 대한 안전성 및 효과성을 평가하는 체계적 문헌고찰을 수행하였으나 최종 선정된 RCT 문헌은 없었다.
2. 기관지암
기관지암 환자에서 로봇 보조 수술에 대한 안전성 및 효과성을 평가하는 체계적 문헌고찰을 수행하였으나 최종 선정된 RCT 문헌은 없었다.
3. 폐암
폐암 환자에서 로봇 보조 수술에 대한 안전성 및 효과성을 평가하는 체계적 문헌고찰을 수행한 결과, 핵심질문을 충족하는 4개 연구(문헌기준 5편)가 선정되었다. 문헌에서 보고된 연구대상자는 대부분 비소세포폐암(non-small cell lung cancer) 환자로, 주로 조기 폐암에 해당하는 것으로 확인되었다. 또한, 문헌에서 확인된 수술은 대부분 폐엽절제술(lobectomy)에 해당하였으며, 그 외 폐구역절제술(segmentectomy), 쌍폐엽절제술(bilobectomy), 소매폐엽절제술(sleeve lobectomy) 및 폐전적출술(pneumonectomy)이 일부 포함되었다. 비교중재별로는 비디오흉강경수술(video-assisted thoracic surgery)과 비교한 연구는 3개, 개흉수술(thoracotomy)과 비교한 연구는 1개(문헌기준 2편)였다. 평가에 포함된 연구대상자 수는 총 630명(중재군 311명, 비교군 319명)으로, 비디오흉강경수술과 비교한 연구는 총 473명(중재군 232명, 비교군 241명), 개흉수술과 비교한 연구는 총 157명(중재군 79명, 비교군 78명)이었다.
안전성
첫째, 로봇 보조 수술과 비디오흉강경수술을 비교한 연구 RCT 3개였다. 3개 연구에서 모두 시술 관련 합병증을 보고하였으며, 각 연구에서 보고한 개별 합병증들의 군 간 비교 결과, 대부분의 합병증 발생률은 군 간 유의한 차이가 없었다. 특히, 폐암 수술에서 중요한 합병증인 호흡기계 합병증(폐렴 등)에 있어 군 간 차이가 없는 것으로 확인하였다. 다만, 1개 연구(Veronesi et al., 2021)에서 Clavien-Dindo 분류 상, Ⅰ-Ⅱ 단계에 해당하는 합병증이 흉강경수술군(12%, 4명)에 비해 로봇 보조 수술군(32%, 11명)에서 통계적으로 유의하게 많이 발생한 것으로 보고되었다(p=0.04). 개흉수술 전환율은 3개 연구에서 보고하였으며, 메타분석 결과 군 간 차이가 유의하지 않았다.
둘째, 로봇 보조 수술과 개흉수술을 비교한 연구는 RCT 1개가 확인되었다. 해당 연구에서 보고된 모든 개별 합병증은 군 간 유의한 차이가 없었고 로봇 보조 수술에서 개흉수술로의 전환은 보고되지 않았다.
효과성
첫째, 로봇 보조 수술과 비디오흉강경수술을 비교한 연구는 RCT 3개가 확인되었다. 3개 연구에서 보고된 수술시간은 메타분석 결과 군 간 유의한 차이가 없었다. 수술 중 출혈량은 1개 연구에서 로봇 보조 수술군에서 비디오흉강경수술군에 비해 유의하게 적은 것으로 보고하였다. 수술 중 수혈률은 1개 연구에서 군 간 차이가 유의하지 않은 것으로 보고되었다. 재원기간과 흉관 삽입기간은 3개 연구에서 모두 군 간 유의한 차이가 없는 것으로 보고하였다. 흉관 배액량은 1개 연구에서 비디오흉강경수술군에 비해 로봇 보조 수술군에서 유의하게 많은 것으로 보고하였다. 재수술률은 1개 연구에서 군 간 유의한 차이가 없는 것으로 보고되었다. 2개 연구에서 보고한 재입원율은 메타분석 결과 군 간 유의한 차이가 없었다. 2개 연구에서 보고한 수술 직후 통증 결과는 군 간 유의한 차이가 없었다. 2개 연구에서 비디오흉강경수술군에 비해 로봇 보조 수술군에서 절제 림프절 수, 절제 림프절 구역 수가 유의하게 많은 것으로 보고하였다. 병기 상승은 2개 연구에서 군 간 차이가 유의하지 않은 것으로 보고하였다. 로봇 보조 수술과 비디오흉강경수술을 비교한 연구에서 생존 결과는 보고되지 않았다.
로봇 보조 수술과 비디오흉강경수술을 비교한 연구 3개에서 보고된 효과성 결과를 요약하면, 비디오흉강경수술군에 비해 로봇 보조 수술군에서 통계적으로 출혈량이 유의하게 적고, 흉관 배액량, 절제 림프절 수 및 절제 림프절 구역 수가 유의하게 많은 것으로 확인되었다. 반면에 수술시간, 수술 중 수혈률, 재원기간, 흉관 삽입기간, 재수술률, 재입원율, 통증, 병기 상승은 군 간 차이가 유의하지 않았으며, 생존 결과는 보고되지 않았다.
둘째, 로봇 보조 수술과 개흉수술을 비교한 연구는 RCT 1개가 확인되었다. 해당 연구에서 수술시간은 군 간 유의한 차이가 없는 것으로 보고하였다. 개흉수술군에 비해 로봇 보조 수술군에서 수술 중 출혈량이 많은 환자의 비율이 유의하게 적었다. 재원기간은 군 간 유의한 차이가 없었다. 개흉수술군에 비해 로봇 보조 수술군에서 흉관 삽입기간이 유의하게 더 짧았고, 흉관 배액량은 군 간 유의한 차이가 없는 것으로 보고되었다. 수술 중 수혈률, 재수술률, 재입원율은 보고되지 않았다. 수술 직후 통증이 개흉수술에 비해 로봇 보조 수술군에서 유의하게 낮은 것으로 보고되었다. 절제 림프절 수/절제 림프절 구역 수는 군 간 유의한 차이가 없었다. 무질병 생존율, 전체 생존율은 수술 후 3년까지 추적관찰한 결과 두 군 간 유의한 차이가 없는 것으로 보고되었다.
로봇 보조 수술과 개흉수술을 비교한 연구 1개에서 보고된 효과성 결과를 요약하면, 개흉수술군에 비해 로봇 보조 수술군에서 통계적으로 출혈량이 유의하게 적고, 흉관 삽입기간이 유의하게 짧고, 수술 후 통증은 유의하게 적은 것으로 확인되었다. 그러나, 수술시간, 재원기간, 흉관 배액량, 절제 림프절 수/절제 림프절 구역 수, 무질병 생존율, 전체 생존율은 군 간 차이가 유의하지 않았다.
결론 및 제언
소위원회에서는 현재 문헌적 근거를 바탕으로 다음과 같이 결과 및 의견을 제시하였다.
ⅰ) 기관암 환자에서 로봇 보조 수술에 대한 RCT 문헌은 확인되지 않아, 소위원회에서는 해당 질환에서 로봇 보조 수술이 기존 수술과 비교하여 안전하고 효과적인지 판단할 수 없다고 평가하였다. 또한, 향후 잘 설계된 임상연구를 기반으로 한 안전성과 효과성에 대한 근거가 필요하다고 제언하였다.
ⅱ) 기관지암 환자에서 로봇 보조 수술에 대한 RCT 문헌은 확인되지 않아, 소위원회에서는 해당 질환에서 로봇 보조 수술이 기존 수술과 비교하여 안전하고 효과적인지 판단할 수 없다고 평가하였다. 또한, 향후 잘 설계된 임상연구를 기반으로 한 안전성과 효과성에 대한 근거가 필요하다고 제언하였다.
ⅲ) 폐암 환자에서 로봇 보조 수술은 기존 치료법(비디오흉강경수술 및 개흉수술)과 유사한 수준의 합병증 발생률을 보여 안전하다고 판단하였다. 효과성 측면에서 비디오흉강경수술에 비해 출혈량이 유의하게 적고, 절제 림프절(구역) 수가 더 많았으며, 개흉수술에 비해서도 출혈량이 더 적고, 흉관 삽입기간은 짧고, 수술 후 통증은 더 적은 잇점을 확인하였다. 그 외 수술전후 결과(perioperative outcome)는 대부분 기존 치료법과 유사한 수준인 것으로 확인되었으며, 생존결과는 개흉수술과 비교 시 유의한 차이가 없는 것으로 확인되었다. 이에 소위원회에서는 폐의 악성 종양 환자에서 종양제거술 시 로봇 보조 수술은 안전하고, 비디오흉강경수술 및 개흉수술의 대안적 치료방법으로 적용 가능한 효과적인 치료법이라고 평가하였다(근거의 신뢰수준, Low~Moderate).
2022년 제12차 의료기술재평가위원회(2022.12.09.)에서는 의료기술재평가사업 관리지침 제4조 제10항에 의거 “로봇 보조 수술”에 대하여 로봇 보조 수술이 사용되는 전반적인 항목을 대상으로 문헌적 근거를 검토한 소위원회의 결론에 대하여 종합적으로 심의하였다.
ⅰ) 의료기술재평가위원회는 기관암 환자에서 로봇 보조 수술의 임상적 안전성과 효과성 등을 판단할 RCT 문헌을 확인하지 못하여 국내 임상상황에서 기관암 환자를 대상으로 수행하는 로봇 보조 수술의 권고등급을 결정할 수 없어 ‘불충분’으로 심의하였다(권고등급: 불충분).
ⅱ) 의료기술재평가위원회는 기관지암 환자에서 로봇 보조 수술의 임상적 안전성과 효과성 등을 판단할 RCT 문헌을 확인하지 못하여 국내 임상상황에서 기관지암 환자를 대상으로 수행하는 로봇 보조 수술의 권고등급을 결정할 수 없어 ‘불충분’으로 심의하였다(권고등급: 불충분).
ⅲ) 의료기술재평가위원회는 임상적 안전성과 효과성의 근거 및 그 외 평가항목 등을 종합적으로 고려하였을 때, 국내 임상상황에서 폐암 환자에서 로봇 보조 수술의 사용을 ‘조건부 권고함’으로 심의하였다(권고등급: 조건부 권고함).
주요어
로봇 보조 수술, 최소침습수술, 비디오흉강경수술, 개흉수술, 폐암
Robotic Surgical Procedure, Minimally Invasive Surgery, Video-Assisted Thoracic Surgery, Thoracotomy, Lung cancer
Background
The sympathetic
skin response test (SSRT) assesses autonomic nervous system function
in patients with or suspected of having autonomic dysfunction by
using an electromyograph to induce micro sweat secretion on the hands and feet
and measuring the resultant skin conductance.
SSRT was listed
as a registered non-benefit item in 2010, and subsequently, the Preliminary
Coverage Division of the Health Insurance Review and Assessment Service (HIRA)
commissioned the National Evidence-based Healthcare Collaborating Agency to
conduct a reassessment of seven autonomic neuropathy test items, including this
test—SSRT, autonomic neuropathy [orthostatic blood pressure test, Valsalva
maneuver, sustained handgrip test, heart rate variability test, and skin
conductance test], and quantitative sudomotor axon reflex test—for expansion of
insurance coverage to include non-benefit items (January 2022). Accordingly,
the reassessment of clinical safety and effectiveness was conducted after a
review of the reassessment plan and the proposed integration subcommittee
composition of the applicable technologies during the 2nd session
of the Committee of
Health Technology Reassessment in 2022 (February 18, 2022).
Methods
A systematic
review was performed to assess the clinical safety and effectiveness of SSRT
for assessing patients with or suspected of having autonomic dysfunction. All assessment
methods were finalized through discussions with the “Integration subcommittee
for autonomic neuropathy tests” (hereinafter referred to as the
“subcommittee”) with consideration of the assessment’s purpose. The subcommittee consisted of 11 experts:
three from neurology and two each from endocrinology and metabolism,
cardiology, psychiatry, and evidence-based medicine.
The key question of the assessment was, “Is
SSRT clinically safe and effective for assessing the autonomic nervous system function in patients with or
suspected of having autonomic dysfunction?” Safety was assessed based on
test-related adverse events (AEs) or complications, while effectiveness was
assessed based on diagnostic accuracy, association with the disease, and impact
on health outcomes.
In the
systematic review, three international databases (Ovid MEDLINE, Ovid
EMBASE, and Cochrane Central Register of Controlled Trials) and five
domestic databases (KoreaMed, KMbase, KISS, KERIS, and ScienceON) were
searched based on the key question. Article
selection based on inclusion/exclusion criteria, data extraction, and risk of
bias (RoB) assessment were performed independently by two reviewers, and in
cases of disagreement, a consensus was reached after discussion with a third
person. RoB assessment
was performed using Quality
Assessment of Diagnostic Accuracy Studies-2 (QUADAS-2). In the data
analysis, the results for diagnostic accuracy were qualitatively described since the
patient populations and diagnostic criteria varied and a 2 × 2 table of values
for each article could not be extracted. Regarding the disease association, trends in the
results were identified based on a forest plot using odds ratios (ORs) for the
patient-control group (analysis of the patient group and those without the
disease), disease-control group (comparison between different disease groups),
presence/absence of autonomic neuropathy, disease subtypes, and disease
severity.
Results
A total of 46
articles (12 diagnostic test evaluation studies and 34 patient-control studies)
were selected from the systematic review, which reported diagnostic accuracy
and association with the disease as the safety and effectiveness outcomes.
In the RoB
assessment, “high” RoB was observed in 93.5% of the patient selection domain;
“uncertain” in 28.3% of the index test domain; “uncertain” in 56.5% of the
reference standard domain; and “high” in 2.2% of the flow and timing domain.
Meanwhile, concerns about applicability were “uncertain” in 80.4% of the
patient selection domain; “uncertain” in 39.1% of the index test domain; and
“high” in 2.2% of the reference standard domain.
Safety
With respect to
the safety of SSRT, two articles reported no test-related AEs. Accordingly, the
subcommittee determined that SSRT is a safe technology.
Effectiveness
The effectiveness outcomes were classified
into diagnostic accuracy and association with the disease, with no articles
reporting about their impact on health outcomes.
The diagnostic
accuracy of SSRT was reported in 12 articles. In two articles that reported on
the diagnostic accuracy for autonomic neuropathy or cardiovascular autonomic
neuropathy in diabetic patients, sensitivity was 0.62–0.87 and specificity was
0.66–0.88. In terms of diagnostic accuracy for cardiovascular autonomic
neuropathy, sensitivity was 0.40 and specificity was 1.00 for values measured
from the hands, and sensitivity was 0.75 and specificity was 0.96 for values
measured from the feet. In two articles that reported on the diagnostic
accuracy for small fiber neuropathy, sensitivity was 0.33–0.43 and specificity
was 0.77, while the diagnostic accuracy for multiple system atrophy (MSA) and
progressive (primary) autonomic nervous system disorder had a sensitivity of
0.88 and specificity of 1.00. In addition, the diagnostic accuracy for carpal
tunnel syndrome had a sensitivity of 0.34 and specificity of 0.89. In two
articles that reported on the diagnostic accuracy for transthyretin familial amyloid
polyneuropathy, sensitivity was 0.53–0.94 and specificity was 0.57–0.96. In two
articles that reported on the diagnostic accuracy for complex regional pain
syndrome, sensitivity was 0.13–0.83 and specificity was 0.57–0.96. In one
article that reported on the diagnostic accuracy of Machado-Joseph disease,
sensitivity was 0.73 and specificity was 0.97.
In the analysis
of disease association, 36 articles reported the rates of abnormal SSRT results
by presence/absence of autonomic neuropathy in disease-control
groups, presence/absence of disease symptoms, disease severity, and
specific disease characteristics. The study populations varied and included
patients with diabetes, Parkinson’s disease, complex regional pain syndrome,
small fiber neuropathy, and MSA. Regarding the presence/absence of autonomic
neuropathy (n=11), the rates of abnormal SSRT results were significantly higher
in the group with autonomic neuropathy, while comparisons between
disease-control groups (n=9) showed no significant differences in the rates of
abnormal SSRT results. With respect to the presence/absence of disease symptoms
(n=6), the groups with symptoms generally showed higher abnormal rates, with a
significant difference in the rates of abnormal SSRT results between the groups.
Meanwhile, no significant differences were found in abnormal rates between
groups based on disease severity (n=5) or specific disease characteristics
(n=5).
According to the
subcommittee, SSRT lacks a standardized test method, is not widely used in clinical
practice, is not mentioned in any guidelines unlike other autonomic nervous
system tests, and is not included in the composite indicators for assessing
autonomic neuropathy. Nonetheless, SSRT has the advantage of being a simple
test based on sweat using a relatively low-cost device, which offers high
accessibility to clinical-level medical institutions. Additionally, the
subcommittee stated that although SSRT is a safe test, its low sensitivity
suggests that it may be used for screening rather than diagnosing specific
diseases.
Conclusions
Based on the
current assessment results, the subcommittee presented the following
recommendations.
SSRT was
determined to be a safe test for patients with or suspected of having autonomic
dysfunction since it involves the use of an electromyograph outside the body.
Varying expert opinions on the
effectiveness of SSRT included: i) Due to its limited usage in clinical practice and
low sensitivity, SSRT is a technology lacking sufficient evidence to ascertain
its effectiveness and clinical usefulness; ii) Although it is
considered a useful test, SSRT requires
more study results, including composite indicators, since it lacks evidence as
a stand-alone test; iii) this technology can be helpful for clinical diagnosis,
considering that assessment of autonomic dysfunction is based on a combination
of various autonomic nervous system tests in clinical practice; and iv) despite
being helpful for clinical diagnosis, this technology has limited evidence.
In the first
session of the Committee of Health Technology Reassessment in 2023
(January 13, 2023), the following determinations and grades of recommendation
were made on SSRT based on a review of the subcommittee findings, including
various expert opinions.
SSRT was determined
to be a safe test that involves the use of an electromyograph outside the body.
Regarding its effectiveness, this technology can be helpful for clinical
diagnosis, considering that assessment of autonomic dysfunction is based on a
combination of various autonomic nervous system tests in clinical practice.
Accordingly,
the Committee of Health Technology Reassessment “conditionally recommends”
the use of SSRT for the purpose of assessing autonomic nervous
system function in patients with or suspected of having autonomic dysfunction
according to the clinical situation or value in Korea based
on comprehensive consideration of the evidence of its clinical safety and
effectiveness and other assessment items.
Keywords: Autonomic neuropathy, Sympathetic skin
response (SSR), Safety, Effectiveness