2006년 신규 의약품의 보험 급여 선별등재방식(positive listing)이 도입된 것을 계기로 보건의료분야에서 비용효과성(cost-effectiveness)을 의사 결정기준으로 사용하는 것이 본격화되었다. 이후 보건의료분야에서 우선순위 설정기준으로서 경제성분석의 역할이 늘어났으며 그 활용도 또한 증가하고 있다. 그러나 분명한 유용성에도 불구하고 비용효과분석(cost effectiveness analysis) 결과에 대한 판단을 둘러싼 기준이 부재하다는 문제가 지적되어 왔다. 투명한 기준점(threshold)을 제시하는 것이 갈등을 줄일 수 있는 방법이지만 보건의료의 특성상 모든 질병들과 이질적인 치료법들에 통용될 수 있는 하나의 기준점이 존재하는지에 대해서는 많은 연구자들이 의문을 제기하고 있다. 또한 해당 질환, 치료법, 접근 가능한 자료원 등으로 인해 상이한 경제성평가방법론이 적용된 경우 과연 단일의 기준점이 적용가능한지에 대해서도 의문을 제기할 수 있다.
본 연구는 문헌고찰을 통하여 비용-효과성(cost-effectiveness) 여부를 판단하는 기준을 둘러싼 논의들을 검토하였다. 점증적 비용-효과비(incremental cost effectiveness ratio, icer)에 근거한 의사 결정의 필요성, 명시 여부에 대한 논란, 윤리적인 문제, 비용-효과성을 판단하는 임계값 결정 및 조정 등 관련 논의들을 정리하였다.
주요 쟁점이 되는 부분에 대해서는 별도의 장을 마련하여 심도 있는 고찰을 진행하였는데 먼저 비용-효과성 판단기준에서 사용할 효과 산출지표를 검토하였다. 경제성평가에서 효과 단위에 대한 산출 방법과 형평성 함의, 활용 상황, 최근 이슈 등을 확인하여 국내 비용-효과성 판단기준을 제시할 때 가장 적합한 효과지표로 qaly(quality adjusted life years)를 선정하였다. qaly는 사망과 건강관련 삶의 질(health-related quality of life)을 모두 반영하는 건강편익의 일반적 측정 단위로 보건의료 분야의 경제성분석에서 널리 사용되고 있는 최종 결과지표이다. 아울러 많은 국가에서 경제성평가를 위한 가이드라인의 성과지표로 qaly의 사용을 권고하고 있다. daly(disability adjusted life years) 또한 널리 쓰이는 지표이나 국가 보건사업의 우선순위 선정이나 국제기구의 보건사업 우선순위 설정, 총질병부담 추정과 같은 거시 목표에 보다 적합하고 경제성평가에서는 널리 쓰이지 않는 관계로 qaly를 선정하였다.
한편 본 연구에서는 비용-효과성 판단기준 조사에 기초 자료로 활용하고자 국내에서 시행된 경제성평가에 대한 선행연구들을 검토하였다. 그 결과 국내 경제성평가에서 효과지표로 사용된 연장된 수명의 차이(incremental life years gained)와 질보정생존년의 차이(incremental qaly)는 각각 중앙값이 0.195와 0.320인 것으로 나타났다.
선행 연구에서 보고된 비용-효과성 판단기준 산출방법에 대한 광범위한 고찰에 근거하여 한국의 상황에 맞는 qaly 개선에 대한 최대 지불의사금액(willingness to pay, wtp) 산출 방법을 도출하고 설문지를 개발하였다. qaly 개선 측정방법으로 eq-5d와 같이 일반적 도구(generic instrument)를 이용하는 방법, time trade-off(tto), standard gamble(sg) 등을 이용하여 직접 측정하는 방법이 있으나 본 연구에서는 eq-5d의 시나리오를 이용한 방법을 사용하였다. eq-5d 시나리오 조합은 euro-qol에서 eq-5d의 tariff를 산출하기 위해 사용했던 42개의 시나리오에 기반을 두었다. wtp가 qaly 개선에 비례적으로 증가하지 않는다는 선행 연구들에 근거하여 qaly 개선 수준이 0.2 미만, 0.2-0.4, 0.4-0.6, 0.6-0.8, 0.8 이상을 각각 구분하여 5개 군으로 분류하여 한 응답자가 5개 수준의 qaly 개선에 대해 응답하도록 하였다.
또한 본인의 건강상태 개선과 가족의 건강상태 개선에 대한 wtp가 다르다는 선행 연구 결과에 근거하여 본인의 건강상태 개선에 대한 wtp를 묻고 같은 건강수준 개선이 가족에서 있게 되는 경우의 wtp를 추가 설문하도록 구성하였다. 이렇게 선행연구 결과를 참고하여 설문지 안을 만들고 두 번의 자문회의와 두 번의 포커스 그룹 인터뷰(focus group interview, fgi)를 실시하여 설문지를 확정하였다.
2010년 대규모 설문조사 시행에 앞서 사전조사로 2009년 10월 14일부터 22일까지 8일간 서울시내 일반인 100명을 대상으로 면접조사를 실시하였다. 사전조사는 개방형 wtp 측정방법을 사용하였다. 분석 결과 1 qaly를 개선하기 위해 응답자들이 제시한 wtp는 1,000-2,800만원 수준이었다. 일관성 있게 응답한 참여자들만 분석한 경우 1 qaly에 대해 1,200-3,200만원을 최대 지불할 의사가 있는 것으로 나타났다.
이러한 사전조사 결과를 토대로 본 조사에서 추가된 이중경계양분선택형(double- bounded dichotomous) 설문에서 제시할 금액(bid) 규모를 결정하였으며 설문지와 설문방법을 수정하였다. 사전조사에서는 qaly 개선 수준을 0.2 미만, 0.2-0.4, 0.4-0.6, 0.6-0.8, 0.8 이상으로 구분하여 한 응답자에게 5개 수준의 qaly 개선 상황에 대해 wtp를 응답하도록 하였으나 건강개선 수준이 0.8 이상인 경우(건강 수준 0.2 미만에서 완전한 건강상태로 개선) 상상하기 어려운 시나리오가 많다는 지적을 받아 본 조사에서는 이를 제외하고 대신 생사의 문제가 반영된 1개의 시나리오를 추가하였다.
표본은 전국 단위로 wtp에 영향을 미칠 것으로 판단되는 성별, 연령, 거주 지역에 따라 표본을 비례 할당하여 임의표본추출하여 조사하였다. 훈련받은 면접원이 대면조사를 시행하였으며 조사는 2010년 4월 26일~6월 3일까지 진행되었다.
조사된 지불의사금액을 이에 해당하는 건강개선 수준(△qaly)으로 나누어 1 qaly당 지불의사 금액을 산출하였다. 건강개선 수준은 응답자가 건강상태 시나리오를 보고 직접 체크한 vas와 한국에서 그동안 보고된 eq-5d 환산수식(lee 등, 2009; jo 등, 2008; 강은정 등, 2006)을 이용하였다. 이를 기준으로 완전한 건강상태(1)와 비교한 건강개선 수준을 산출하였다.
일관성의 정의는 lee 등(2009)의 환산수식에 근거하여 건강수준 순서에 일치하는 wtp를 밝혔거나 vas로 산출된 건강개선 순서에 일치하는 wtp를 응답한 경우로 보고 이들을 대상으로 분석을 수행하였다. 본 조사에서는 이중경계양분형으로 구간을 추정한 설문과 이를 근거로 개방형으로 점추정을 한 두 부분이 있으며 본 연구에서는 이들 설문을 모두 활용하여 결과를 각각 제시하였다.
건강개선 순서에 일치하는 wtp를 응답한 사람들(n=933명)을 대상으로 개방형으로 응답한 설문에 대한 1 qaly당 wtp를 분석한 결과 강은정 등(2006) 연구의 환산수식에 근거하여 eq-5d 시나리오의 qaly를 산출한 결과에서 가장 낮은 wtp(1,115만원)가 산출되었고 jo 등(2008)의 연구에 근거한 결과에서 가장 높은 wtp(2,127만원)가 산출되었다. vas를 기준으로 한 wtp와 환산수식 도출을 위해 대규모 연구를 수행한 lee 등(2009)을 기준으로 한 1 qaly당 wtp는 1,900만원선으로 비슷하게 나타났다. 이는 2010년 우리나라 1인당 gdp 수준인 2,400만원보다 다소 낮은 값이다. 가족의 건강개선에 대해서는 50% 정도 더 높은 wtp를 보였다.
이중경계양분선택형 분석의 도입은 개방형 설문의 응답을 보다 정교하게 만드는 긍정적인 효과가 있는 동시에 개방형 설문결과를 배제하고 분석할 경우 분석방법에 따라 많은 차이가 발생하는 것으로 판단된다. 특히 비모수적 방법인지 모수적 방법인지에 따라 1 qaly 당 wtp의 추정치가 크게 달라지는데 비모수적 turnbull 방법의 경우 개방형 지불의사 추정 결과보다 다소 낮은 금액이 추정되었고 모수적 추정방법들은 개방형 결과에 비하여 상당히 높게 추정되었다. 이 결과는 향후 이중경계양분형 분석에 있어 신중한 고려가 필요하다는 것과 다른 추정방법을 사용할 경우 결과비교가 힘들 수 있음을 보여준다.
또한 본 연구에서는 보건의료 관련 이해당사자를 대상으로 하여 인터넷 조사를 추가로 수행하였다. 대상자는 제약회사, 임상현장에서 환자를 보고 있는 의사간호사/약사, 국민건강보험공단/건강보험심사평가원/보건복지부 등 정책 결정관련기관, 그 외 학계/방법론 전문가 등 보건의료 관련 전문가들이다. 분석 결과 정책결정자, 보건관련전문가들의 지불의사는 일반인들과 비슷한 수준이었으며 제약회사 임직원의 지불의사금액은 이에 비해 매우 높았다. 이를 통해 이해당사자들 간 정책적 임계값 수준에 대한 입장이 다른 것을 확인할 수 있었다.
With the introduction of the Positive Listing System of new pharmaceuticals in 2006, economic evaluation emerged as a standard methodology for decision-making in healthcare. Since then, economic evaluation is used as a more popular criterion for setting priorities in the healthcare sector. There is a clear standard in the conventional
economic evaluations (cost-benefit analysis: CBA) used in other areas, i.e. it worth when benefit is greater than cost. On the other hand, economic evaluations in healthcare is mostly cost-effectiveness analysis (CEA) or cost-utility analysis (CUA), in which the results are drawn by the Incremental Cost Effectiveness Ratio (ICER), which
needs an external threshold to judge its worth. The ICER reports how much additional cost is needed for the increment of one unit of effectiveness (or utility) between a higher-cost but more effective treatment and the conventional treatment. There is no universal standard for cost-effectiveness ratio mainly due to different healthcare systems and economic environments of each country, but a certain threshold has been applied in the decision of health insurance reimbursement of new health technology. In the literature, other countries seem to have a predictable standard: $50,000 in the USA or £20,000-30,000 in the UK. In case of Korea, economic evaluation becomes more popular than ever, but there are uncertainties which seem to evoke conflicts among the interested groups. Even though transparency is much needed to reduce unnecessary conflicts among the concerned parties, many researchers have questioned the existence of unique standard applicable to all diseases and treatments, given the heterogeneous nature of healthcare. In addition
to the heterogeneous characteristics of diseases and treatments, the limited source of data is another major obstacle in comparisons of various economic evaluations in Korea.
In this study, the related literature was extensively examined before calculating a threshold for judging the cost-effectiveness in Korea. In-depth discussions on major issues were included in separate sections: calculation of effectiveness measures, implication of equity, a summary of current utilizations, and the recent issues related to economic evaluations of healthcare technology. After review, Quality Adjusted Life Years (QALYs) was selected as the most suitable effectiveness measure to interpret cost-effectiveness in Korea. QALY combines the quantitative aspect (mortality) and the qualitative aspect of life (morbidity), and it is a widely-used indicator in the economic evaluation of healthcare sector. Many countries recommend a use of QALY for effectiveness measure in the guidelines for economic evaluations.
The results of literature reviews on the economic analyses in the Korean healthcare sector showed that the median Life Years Gained (LYG) reported was 0.195, and the median of effectiveness calculated on the basis of QALY was 0.320.
A survey questionnaire was developed to measure the willingness to pay (WTP) for a QALY in Korea. This questionnaire utilized EQ-5D to measure the QALY improvement in hypothetical scenarios. Specifically, a subset of the 42 hypothetical health states used in the calculation of EQ-5D weights (tariffs) in Euro-Qol was used. Furthermore, the level of QALY improvements were classified into five categories: ranges of less than 0.2, 0.2-0.4, 0.4-0.6, 0.6-0.8, and greater than 0.8. It was based on the previous study results showing WTP is not proportionally increased by QALY improvement. Each respondent answered WTP for five scenarios, each one from the five categories. In addition, each WTP was repeated for the case of self and for that of a family member (total 10 WTP answers), based on a previous study result reported WTP for a QALY of the family is higher than that of the self in the Far Eastern countries. The questionnaire was modified and completed after two advisory meetings and two focus group interviews.
A pilot survey was performed in 100 citizens in Seoul for 8 days from October 14 to 22, 2009 to confirm feasibility of the questionnaire and to prepare for the large-scale main survey in 2010. An open-ended WTP questions were used in the pilot survey to decide the initial bid values for the main survey double-bounded
dichotomous choices. The results of the pilot survey showed that the WTP for an additional QALY was around 12-32 million won.
Based on the pilot survey results, initial bids for main survey were determined and survey questions were fine tuned. Double bounded dichotomous questions along with an open question were used in WTP solicitations. The main survey sample were drawn by quota sampling to represent Korean national population. The main survey was conducted between April 26, 2010 to June 3, 2010 and total 1,017 persons were interviewed face to face.
Of the total 1,017 persons surveyed, 933 persons passed a consistency test. For those who passed consistency, values for a QALY calculated from the final open questions (after double bounded dichotomous questions) showed 11-21 million won. The lower bound is from a result using tariff values by KEJ and the upper bound is by
Jo et al.(2008) tariff values. The results by Visual Analog Scale (VAS) and KCDC tariff values (Lee et al. 2009) were similar around 19 million won. For WTP for family member were consistently higher than self: 16-31 million won whereas medical aid group showed 20-30% WTP values of health insurance group.
Using double bounded dichotomous choice questions seems to have additional benefit of refining open ended questions though the values for a QALY tends to be higher especially in parametric estimation models using only double bounded dichotomous questions. This observation cautions us selecting a specific analytic method may drive a result.
This study also included a separate survey on healthcare interest groups in Korea: industry, healthcare providers, decision makers, and related academia. Decision makers, and related academia showed a similar WTPs with WTPs of general population, but WTPs of industry staff were much higher than WTPs of other groups.
There were a couple of studies on cost-effectiveness threshold in Korea: a 2007 HIRA report by Bae et al. and Shiroiwa et al. (2010). Bae et al. reported 29 million won for a threshold (51.5 million won for severe diseases) and Shiroiwa et al. reported 68 million won as a threshold value. Since Bae et al was based on a survey on 67 professionals and Shiroiwa et al. used an extreme survey question (die now or live one more year in perfect health), their results were significantly different from this study results on general public. In addition, this study used more continuous increments of health improvements (<0.2, 0.2-0.4, 0.4-0.6, 0.6-0.8, and death), therefore, less extreme WTPs may have been observed.
A long-term goal of this study is gradually narrowing the gap of uncertainty through the accumulation of this kind of studies in Korea. Finally, we expect this study to contribute in the resolution of controversies over the economic judgment in the healthcare sector.
Executive summary
요약문
1. 서론
1.1. 연구목적
1.2. 연구내용
2. 비용-효과성 판단기준에 관한 고찰
2.1. 외국의 보건의료정책에서 경제성평가 활용 사례
2.2. 비용-효과성 판단기준과 관련된 논의
2.2.1. 왜 ICER에 근거한 의사 결정이 필요한가?
2.2.2. 비용-효과성을 판단하는 임계값을 명시해야 하는가?
2.2.3. 비용-효과성을 판단하는 단일한 임계값이 존재하는가?
2.2.4. 보건의료에서 다른 분야의 경제성평가 결과가 비교 가능한가?
2.2.5. 비용-효과성에 대한 임계값은 어떤 윤리적인 문제를 갖고 있는가?
2.2.6. 비용-효과성을 판단하는 임계값은 어떻게 결정되는가?
2.2.7. 비용-효과성은 어떻게 활용되는가?
3. 효과 산출지표에 대한 고찰 및 효과 지표 도출
3.1. 효과 산출지표 고찰 이유
3.2. 대리결과 지표와 최종결과 지표에 대한 논의
3.2.1. 대리결과 지표와 최종결과 지표의 개념
3.2.2. 이상적인 대리결과 지표
3.2.3. 대리결과의 예시
3.2.4. 대리결과의 문제점
3.2.5. 논의, 최근경향
3.3. 효과 산출 지표에 대한 이론적 고찰
3.3.1. DALY
3.3.2. QALY
3.3.3. QALY와 DALY의 차이점
3.4. LYG, QALY, DALY의 경제성평가에서의 활용
3.4.1. 국내외 경제성평가 가이드라인 고찰
3.4.2. DALY를 사용한 국내외 경제성평가 논문 검토
3.5. 국내 비용-효과성 판단기준을 제시할 때 가장 적합한 효과지표 도출
4. 국내 경제성평가의 점증적 효과에 대한 고찰
4.1. 방법
4.1.1. 문헌검색
4.1.2. 문헌선정
4.1.3. 데이터추출 및 분석
4.1.4. 비판적 평가(Critical appraisal)
4.2. 결과
4.2.1. 문헌검색 및 선정 결과
4.2.2. 국내 경제성평가의 Incremental LYG와 QALY
4.2.3. 비판적 평가(Critical appraisal) 결과
5. 비용-효과성 판단기준 산출 방법 고찰
5.1. 비용-효과성 판단기준 산출방법에 대한 고찰
5.1.1. 표본 추출 방법
5.1.2. 비용-효과성(cost-effectiveness)에 대한 임계값(threshold) 추정방법
5.2. 비용-효과성 판단기준 산출에서 사용된 WTP 산출 방법
5.2.1. WTP에 영향을 주는 응답자의 특성
5.2.2. WTP 산출방법
5.2.3. WTP 산출시 고려해야 하는 기타요인
5.2.4. WTP 산출시 영향을 주는 건강 특성
5.3. 비용-효과성 판단기준 산출에서 사용된 효과지표( QALY)
5.3.1. 가상의 시나리오를 이용하는 방법
5.3.2. 응답자 본인의 건강상태 측정
5.3.3. 기타
5.3.4. 소결
6. 한국에서 적절한 비용-효과성 판단기준 방법 도출
6.1. 조사 방법
6.2. 조사 집단 선정 및 표본 추출 방법
6.3. 설문지 개발(안)
7. 한국에서의 비용-효과성 판단기준 도출을 위한 사전조사(2009년)
7.1. 사전조사 개요
7.1.1. 사전조사 목적
7.1.2. 사전조사 방법
7.1.3. 건강개선 시나리오 구성
7.2. 사전조사 결과
7.2.1. 조사 대상자의 특성
7.2.2. 건강개선 수준에 따른 지불제시 금액
7.2.3. 지불제시 금액에 영향을 미치는 요인 분석
7.2.4. 순서 효과
8. 한국에서 비용-효과성 판단기준 도출을 위한 본 조사(2010년)
8.1. 본 조사 개요
8.1.1. 일반인 조사
8.1.2. 보건의료관련 이해당사자 설문조사
8.2. 본 조사 결과
8.2.1. 조사 대상자 특성
8.2.2. 지불제시 금액
9. 토론회 결과
9.1. 토론회 개요
9.2. 토론회 주요 이슈 및 연구진 의견
9.2.1. 연구 결과의 활용
9.2.2. QALY 개념에 대한 문제 제기
9.2.3. 기타
10. 고찰
10.1. 연구 결과 요약
10.2. 연구의 의의
10.3. 연구의 한계
10.4. 후속 연구 제안
11. 참고문헌
12. 부록
|