▢ 연구 배경
최근 인공지능(AI : artificial intelligence) 의료기술의 발전으로 건강보험 적용을 위한 의료기술평가가 필요하게 되었다. 우리나라에 현행 제도 및 방법들이 있으나, 이들은 여러 제한점을 가지고 있으며 특히 현재 알려진 의료 AI의 독특한 특성을 충분히 반영하고 있지 않다.
▢ 연구 목적
본 연구에서는 AI기반 소프트웨어 의료기기의 적절한 의료현장 적용을 위한 평가방법을 개선하기 위한 구체적 방안 제시 및 최신의 이론적 근거를 마련하고자 하였다.
▢ 연구 방법
1. 국내·외 현황 파악
AI 의료기술과 관련된 국내·외 현황을 파악하기 위하여 AI 의료기기의 국내·외 허가 현황, AI 의료기술의 국내 평가 현황, AI 의료기술의 국내·외 건강보험 적용 현황 등을 조사하였다. 국내 의료기기 허가 현황은 식품의약품안전처 자료를 활용하였고, 미국의 의료기기 허가 현황은 FDA 데이터베이스를 중심으로 조사하였다. AI 의료기술의 국내 평가 현황은 한국보건의료연구원의 신의료기술평가사업본부 홈페이지를 통해 확인하였으며, 국외 AI 의료기술의 건강보험 적용 현황은 미국, 일본, 독일, 영국, 프랑스, 벨기에를 조사하였다.
2. 국내 적용 방안 마련
AI 소프트웨어 의료기기의 평가방법 개선안과 최신의 이론적 근거를 마련하기 위하여, 관련 문헌을 토대로 하여 AI 의료기술의 특성을 고려한 다면적 가치 평가방안을 개발하였다. 또한 개발한 방안에 대한 의견을 수렴하기 위하여 국내의 다양한 이해관계자를 대상으로 설문조사를 수행하였다. 마지막으로 관련 분야의 주요 학회에서 공론화를 통한 이해관계자의 의견 청취를 통하여 적절한 방안을 도출하였다.
3. 대표 예시 개발
AI 의료기술의 유형에 대한 대표 예시는 동료평가를 거쳐 학술지에 게재된 논문들을 토대로 제시하였다. AI가 제공하는 가치는 5가지 측면(의학적 효과 – 진단정확도, 의학적 효과 – 진료/환자 결과, 거시적 의료비용, 의료기관/의료인 효율, 비임상 환자중심결과)을 평가하였다.
▢ 연구 결과
1. 국내·외 현황
국내 허가·인증된 AI기반 의료기기 동향은 2018년 이후 건수가 급격히 증가하여 2022년 기준 48건이었으며, 미국 FDA의 승인을 받은 AI 의료기기 건수 역시 증가하는 추세로 2022년 기준 91건이었다.
2023년 12월 14일 기준, 국내 혁신의료기술 평가 신청된 AI 의료기술 36건(중복 포함) 중 혁신의료기술로 평가된 기술은 7건이었고 이 중에서 혁신의료기술로 의료현장에 선진입하여 사용되는 기술은 2건(인공지능 기반 12 유도 심전도 데이터 활용 좌심실수축기능부전 선별 검사; 자기공명영상을 활용한 인공지능 기반 허혈성 뇌졸중 유형 판별)이었다. 또한, 평가유예 신의료기술로 의료현장에 선진입하여 사용되는 의료기술은 총 7건(인공지능 기반 전립선 생검 디지털 이미지 분석; 망막 영상을 활용한 인공지능 기반 심혈관 사건 발생 위험 예측; 4시간 이내 패혈증 발생 위험 예측; 6시간 이내 급성 중증이벤트 발생 위험 예측; 6시간 이내 급성 상태악화 발생 위험 예측; 24시간 이내 심정지 발생 위험 감시; 뇌파 기계학습 알고리즘을 통한 기억상실형 경도인지장애 선별 보조 검사)이었다.
국내에서 의료기술을 건강보험에 등재하기 위해서는 식품의약품안전처, 한국보건의료연구원, 건강보험심사평가원에서 수행되는 일련의 인허가/평가/심사 과정을 통과해야 한다. AI 의료기기의 시장 진출을 가속하기 위하여 혁신의료기술평가, 혁신의료기기 통합·심사평가 제도, 의료현장에 선진입 후 평가와 같은 효율성을 높이는 정책도 도입되었다. 2023년 8월에는 인공지능 기반 혁신의료기술을 위한 건강보험 임시등재 가이드라인이 발표되었으며, 2023년 10월에 AI 뇌경색 유형 분류 솔루션이 국내 첫 건강보험 수가 적용 사례로 선정되었다.
국외 건강보험 적용 현황은 미국, 일본, 독일을 중심으로 조사하였다. 미국은 입원환자 전향적 지불 시스템, 외래환자 전향적 지불 시스템, 메디케어 의사 수가로 의료서비스의 보장 범위 및 지급액이 결정된다. 또한, 근거 축적을 위한 건강보험 임시등재 형태인 신기술의 과도기적 보험급여(TECT : transitional coverage for emerging technologies) 제도가 있다. 일본은 C1(신기능 의료재료), C2(신기능·신기술 의료재료) 제도를 이용하여 신의료기술에 대한 진료비를 지불하며, AI 기술을 이용한 영상진단보조 소프트웨어의 경우 기존 가산에 추가되기도 한다. 독일에서 신의료기술에 대한 보상은 입원환경과 외래환경에 따라 나누어지며, 디지털 혁신의료기술에 대한 보상을 위한 DiGA 신속 트랙이 도입된 바 있다.
2. 국내 적용 방안
AI는 블랙박스 특성, 제한된 일반화, 인간과 다른 장점, 확장성, 인간의 행동 수정이라는 고유한 특성이 있다. 또한, AI에 대한 임상 문헌 평가 시에는 연구 목적, AI의 기능 및 임상적 맥락, 훈련 데이터, 데이터 전처리, AI 모델화 기법, 시험 데이터, AI 성능, AI의 도움 및 가치, AI의 해석 가능성, 코드 공유에 대하여 고려해야 한다. AI의 성숙도가 높은 의료영상 분야의 AI 가치 평가 모델인 MAS-AI (Model for ASsessing the value of Artificial Intelligence in medical imaging)(Fasterholdt 등, 2022)에서는 건강 문제 및 기술의 적용, 기술, 윤리 측면, 법 측면, 안전성, 임상 측면(임상적 효과성), 경제 측면, 조직 측면, 환자 측면을 평가해야 한다고 제시하였다. 그 외에도 최근 관심을 받는 환자중심결과(PCO : patient-centered outcome)를 조사한 결과, 영상 검사에서 PCO는 알게 된 정보 또는 지식, 신체에 미치는 영향, 정서에 미치는 영향, 검사로 인한 부담으로 분류하기도 한다.
전술한 선행 연구를 참고하여 본 연구에서는 AI 의료기술이 제공하는 임상 결과(예: 진단정확성, 치료 결과), 경제적 측면, 조직 측면, 비임상 환자 결과(예: PCO)를 포함한 다면적 가치를 고려한 평가 도구를 개발하였다. 또한, 임상 연구에서 진단 방법이 환자 의료결과에 미치는 영향의 평가에 사용하던 기존 평가 도구의 제한점을 보완한 순이득(net benefit) 지표에 대한 새로운 방정식과 이를 시각화할 수 있는 웹 기반 그래픽 프로그램도 개발하였다.
의견 수렴을 위한 설문조사의 응답자 총 200명 중 의료AI의 PCO에 대하여 직접 또는 간접 경험이 있는 사람은 10%로 적었다. 의료AI가 제공하는 가치의 건강보험 적용 필요성에 대한 의견을 묻는 문항에서 PCO 관점의 이익에 대한 보상이 필요하다는 응답자는 74%로 임상 결과, 경제적 측면 등 다른 가치 요소(82.5%~93.5%)보다 유의하게 적은 것으로 나타났다. PCO 이득의 보상 필요성(평균 5.1점: 최대 10점, 높은 점수가 필요성이 큼을 의미함) 역시 다른 가치 요소(평균 7.2~5.8점)보다 유의하게 낮았다. 이 결과를 통해 PCO 측면에서 혜택을 입증하는 AI의 보험 적용에 대해서 긍정적인 의견이 충분하지 않은 것을 알 수 있었다.
3. 대표 예시 개발
AI 의료기술의 유형에 대한 대표 예시 개발에 활용할 후보 문헌 81편 중 12편의 문헌을 선택하여, AI가 제공하는 가치에 따른 총 11건의 예시 유형을 제시하였다. 예시에 소개된 AI 모델에 대한 설명과 임상 시험/검증 결과에 대한 상세한 정리 내용은 예시집으로 제작하였다.
▢ 결론
최근 의료 분야에서도 AI 기술 개발 속도가 가속화되어, 건강보험 적용을 위한 의료기술평가가 필요하게 되었다. 본 연구에서는 의료 AI의 독특한 특성을 반영한 개선된 평가방안과 최신의 이론적 근거를 제시하고자 하였다. 이를 위하여 AI 의료기술의 평가를 위해 임상연구 논문을 분석·평가할 때 확인해야 하는 10가지 중요 점을 정립하였고, AI를 통한 진단이 환자 의료결과에 미치는 영향을 확인하기 위한 순이득 지표를 제안하고 프로그램을 개발하였다. 또한, 의료 AI가 제공하는 다면적 가치를 종합적으로 고려하기 위한 평가 방법 및 예시를 개발하였고, PCO의 가치에 대한 현재의 전문가/사회적 의견을 파악하였다.
향후 AI에 대한 임상 프로토콜 개발에 있어서는 현재 강조되고 있는 의학적 효과(특히, 진료/환자 결과) 향상 여부 평가뿐만 아니라, 비임상 PCO에 대한 보다 구체적이고 체계적인 평가가 강조되어야 할 것이다. 본 연구 결과를 활용하여 의료 AI의 적절한 가치를 입증할 수 있는 근거 창출을 지원하고, 안전성 및 효과성이 입증된 AI 의료기술의 활성화에 기여할 수 있기를 기대한다.
주요어 디지털 헬스케어, 인공지능, 소프트웨어, 의료기술평가
▢ Background
Recent advancements in artificial intelligence (AI) healthcare technology have necessitated health technology assessments for health insurance application. While systems and methods for such assessment currently exist in South Korea, they have several limitations and do not adequately address the unique characteristics currently known for medical AI.
▢ Objective
In this study, we attempted to develop specific measures to enhance the assessment of AI-based software medical devices for their suitable adoption in clinical practices and to establish the latest theoretical foundation for these improvements.
▢ Methods
1. Domestic and international status related to AI medical devices/ technology
In order to understand the domestic and international status related to AI software medical devices/medical technology, the domestic and foreign medical device approval status of AI medical devices, domestic evaluation status of AI medical technology, domestic and foreign health insurance application status of AI medical technology, etc. investigated. The Ministry of Food and Drug Safety data was used to determine the status of domestic medical device approvals, and the FDA database was used to determine the status of medical device approvals in the United States. The domestic evaluation status of AI medical technology was confirmed through the website of the New Medical Technology Evaluation Division of the Korea Institute of Health and Medical Research, and the status of health insurance coverage of overseas AI medical technology was investigated in the United States, Japan, Germany, the United Kingdom, France, and Belgium.
2. Domestic application plan
In order to prepare the measures to improve the assessment of AI-based software medical devices and the latest theoretical foundation for these improvements, a multifaceted value assessment method considering the characteristics of AI medical technology was developed based on related literature. In addition, a survey was conducted targeting various domestic experts to collect opinions on the developed plan. Lastly, an appropriate plan was derived by listening to the opinions of stakeholders through public discussion at major academic societies in the related field.
3. Develop representative examples
The representative examples of AI healthcare technologies were based on peer-reviewed papers published in academic journals. The evaluation of the value provided by AI was conducted from five perspectives: medical effectiveness in terms of diagnostic accuracy, medical effectiveness in terms of treatment/patient outcomes, macro-level healthcare costs, efficiency in healthcare institutions/healthcare professionals, and non-clinical patient-centered outcomes (PCO).
▢ Results
1. Domestic and international status related to AI medical devices/ technology
The number of AI-based medical devices approved and certified in Korea has increased rapidly since 2018, reaching 48 cases as of 2022, and the number of AI medical devices approved by the U.S. FDA is also increasing, reaching 91 cases as of 2022.
As of December 14, 2023, among 36 AI medical technologies (including duplicates) applied for domestic innovative medical technology evaluation, 7 were evaluated as innovative medical technologies, and among these, 2 were advanced and used as innovative medical technologies. The case was (artificial intelligence-based 12-lead electrocardiogram data-based left ventricular systolic dysfunction screening test; artificial intelligence-based ischemic stroke type determination using magnetic resonance imaging). In addition, there are a total of 7 medical technologies that have been advanced and used as new medical technologies with deferred evaluation (AI-based prostate biopsy digital image analysis; AI-based cardiovascular event risk prediction using retinal images; sepsis risk prediction within 4 hours) ; Prediction of risk of acute serious event within 6 hours; Prediction of risk of acute condition worsening within 6 hours; Monitoring of risk of cardiac arrest within 24 hours; Assistive test for screening amnestic mild cognitive impairment through EEG machine learning algorithm).
In order to register medical technology in health insurance in Korea, it must pass a series of licensing/evaluation/examination processes conducted by the Ministry of Food and Drug Safety, Korea Institute of Health and Medical Research, and Health Insurance Review and Assessment Service. In order to accelerate the entry of AI medical devices into the market, policies to increase efficiency, such as innovative medical technology evaluation, innovative medical device integration/review system, and evaluation after pre-entry into the market, were also introduced. In August 2023, health insurance temporary registration guidelines for artificial intelligence-based innovative medical technology were announced, and in October 2023, the AI cerebral infarction type classification solution was selected as the first health insurance application case in Korea.
The status of overseas health insurance application was investigated focusing on the United States, Japan, and Germany. In the United States, service coverage and payment amounts are determined by the inpatient prospective payment system, the outpatient prospective payment system, and Medicare physician fees. Additionally, there is a Transitional Coverage for Emerging Technologies (TCET) program in the form of temporary inclusion in health insurance for evidence accumulation. Japan uses the C1 (New Functional Medical Materials) and C2 (New Function/New Technology Medical Materials) systems to pay medical expenses for new medical technologies, and in the case of imaging diagnosis assistance software using AI technology, it is also added to the existing addition. In Germany, compensation for new medical technologies is divided according to inpatient and outpatient settings, and the DiGA fast track has been introduced to compensate for digitally innovative medical technologies.
2. Domestic application plan
AI has unique characteristics such as black box characteristics, limited generalization, advantages over humans, scalability, and modification of human behavior. Additionally, when evaluating clinical literature on AI, research objectives, AI capabilities and clinical context, training data, data preprocessing, AI modeling techniques, test data, AI performance, help and value of AI, interpretability of AI, and code sharing are included. must be considered. MAS-AI (Model for ASsessing the value of Artificial Intelligence in medical imaging) (Fasterholdt et al., 2022), an AI value assessment model in the field of medical imaging where AI is highly mature, focuses on health issues and application of technology, technology, ethical aspects, and law. It was suggested that evaluation should be conducted on safety, clinical, economic, organizational, and patient aspects. In addition, as a result of a survey on PCO, which has recently received attention, PCO in imaging tests can be classified into information or knowledge learned, impact on the body, impact on emotions, and burden due to the test.
Referring to the above-mentioned prior research, this study provides an evaluation tool for AI medical technology that considers multifaceted values, including clinical outcomes (e.g., diagnostic accuracy, treatment results), economic aspects, organizational aspects, and non-clinical patient outcomes (e.g., PCO). was developed. In addition, we developed a new equation for the net benefit index that complemented the limitations of existing evaluation tools used to determine the impact of diagnostic methods on patient outcomes in clinical research, and a web-based graphic program that can visualize it.
Among a total of 200 respondents to the survey conducted for opinion gathering, only 10% reported direct or indirect experience with the PCO of medical AI. When asked about the necessity of health insurance coverage for the value provided by medical AI, respondents expressing the need for compensation for PCO benefits, from a PCO perspective, accounted for 74%. This proportion was significantly lower compared to other value factors such as clinical outcomes and economic aspects, which ranged from 82.5% to 93.5%. The perceived necessity for compensating PCO benefits (average score of 5.1 out of 10, where higher scores indicate greater necessity) was also notably lower than for other value factors (average scores ranging from 7.2 to 5.8). These findings suggest insufficient positive opinions regarding the insurance coverage of AI that demonstrates benefits from a PCO standpoint.
3. Develop representative examples
Out of 81 candidate documents considered for the development of representative examples of AI healthcare technology types, 12 documents were selected. Based on the value provided by AI, a total of 11 example types were presented. Detailed information on the description of the AI models introduced in the examples and the results of clinical trials/validations was compiled into an example compendium.
▢ Conclusions
In recent years, the rapid development of AI technology in the medical field has necessitated medical technology assessments for health insurance coverage. This study aims to propose improved evaluation methods tailored to the unique characteristics of medical AI and to present the latest theoretical foundations. To achieve this, we established ten key considerations for analyzing and evaluating clinical research papers for the assessment of AI medical technology, and developed a program to propose a net benefit indicator to assess the impact of AI-based diagnostics on patient outcomes. Furthermore, we have developed an evaluation method and examples for comprehensively assessing the multifaceted value offered by medical AI. We have also gained insight into the current expert and societal opinions regarding the value of PCO.
In the future development of clinical protocols for AI, emphasis should not only be placed on evaluating clinical effectiveness, particularly in terms of clinical outcomes and patient outcomes, but also on emphasizing a more specific and systematic evaluation of non-clinical PCO. It is expected that leveraging the findings of this study will support the generation of evidence to demonstrate the appropriate value of medical AI, contributing to the activation of AI medical technologies with proven safety and effectiveness.
▢ Acknowledgement
This study was supported by the National Evidence-based Healthcare Collaborating Agency (NECA) funded by the Korean Ministry of Health and Welfare (No. NECA-A-23-002).
Key words
Digital healthcare, Artificial intelligence (AI), Software as a medical device, (SaMD), Health technology assessment (HTA)