격차 해소: 고급분석기능을 활용해 RWD의 허점을 찾아 매우기

장님과 코끼리의 비유를 보면, 사람들은 자신이 만진 제한된 경험에 바탕해 코끼리를 묘사합니다. 기원전 500년이상 된 인도 아대륙에서 전래되어 오는 본 이야기는 개인 경험의 한계를 설명하며, 서로 다른 관점을 결합해 우리 자신의 인식의 한계를 인정하고 이해함으로써 주변 세계에 대한 포괄적인 이해를 얻을 수 있음을 시사합니다.

이 시사점을 임상 생태계의 Real World Data(RWD)에 적용하면 제한된 데이터와 이해를 바탕으로 의사결정을 내리는 것이 어려움을 알 수 있습니다. RWD는 생명과학 상업팀이 시장 및 환자의 여정상에서 마주하는 도전 과제를 이해하는 데 사용되는 심층적이고 광범위한 정보의 원천입니다. RWD가 커버하고 있는 의료 및 약국의 창구, 전자 건강 기록(EHR)및 특수약국 데이터세트 등은 수억명의 환자, 약국, 지불자, HCP 및 치료 현장을 살펴볼 수 있도록 도와줍니다. 이 데이터를 결합하면 시장의 경쟁력있는 기회들을 생성하고 장애물을 식별할 수도 있습니다.

그러나, 실제로는 몇몇 주요 정보들이 누락되기도 합니다.최근  클래리베이트에서 발간한 RWD와 관련된 과제 및 이를 극복하기 위한 주요 방법 보고서 미국의 청구 및 EHR기반 RWD는 클레임을 생성하는 인구의 일부분을 포착하는- 전체 인구의 데이터가 아닌 표준 샘플치고는 큰 표본이라고 지적합니다. 따라서, 클레임을 생성한 인구 데이터를 얻는 방법에 따라 샘플이 전체 환자 모집단을 대표하지 않을 수도 있으며 특정 모집단 세그먼트의 경우 초과되거나 적게 반영될 수도 있습니다.

이런 이유로 허점을 메우고 정확하게 시장을 파악하기 위해 고급 분석 툴이 필요하게 됩니다.

고급 분석 기능 적용하기

클래리베이트의 Real World Data Analytics사업부 Hemanth Nair 수석 이사는 몇몇의 고급 분석 툴을 데이터 과학자가 사용할 수 있고, 정기적으로 사용하고 있다고 말합니다. 예를 들어 부트스트랩은 표본을 사용해 모집단에 대한 추론을 수행합니다. 부트스트랩은 통계량이나 모델 파라미터의 불확실성 또는 변동성을 추정하는 데 사용되는 리샘플링 기법입니다. 특히,청구 데이터와 같이 데이터의 기반이 되는 분포가 알려지지 않은 경우 매우 유용합니다.

시계열은 데이터가 누락된 상황에서 정보를 보완하는 또 다른 분석법입니다. 이는 연속된 시간 간격동안 수집된 데이터 포인트의 시퀀스를 의미합니다. 시계열 데이터는 일반적으로 시간적 순서대로 기록되며, 보통 시간 간격(시간, 일, 월, 년)에 맞춰 규칙적으로 수집됩니다. 이 방법을 활용한 분석은 시간에 걸쳐 존재할 수 있는 패턴, 추세, 관계를 발견할 수 있습니다. 이는 질병 유행에 대한 적시성있는 데이터를 제공하기 어려운 CMS(Centers for Medicare & Medicaid Services)데이터를 살펴볼 때 특히 유용하다고 Nair이사는 말합니다. CMS는 6개월의 데이터 지연이 있어 시계열 분석을 통해 시간에 따른 질병 유병률 등을 파악하는 데 도움이 됩니다.

클래리베이트는 이런 기술을 활용해 15개 이상의  심장 시술/기기에 대한 월별 시설 수준 볼륨이 필요한 상위 25개 의료 기술 회사에 내부 판매 데이터를 총 예상 사용량과 비교할 수 있도록 지원했습니다. 클래리베이트가 보유한 내부 데이터 세트를 활용하는 것 외에도 Nair 팀은 이런 고급 분석 기술을 활용해 빠르고 유연하게 데이터 세부 사항을 처리할 수 있는 배포 파이프라인을 구축해 누락된 부분을 보완했습니다.

코끼리에 대해 더 알아보기

클래리베이트는 약물 청구 데이터로 미국 환자 인구의 90%이상의 핵심 건강 정보를 수집합니다. 이런 양에도 불구하고 Nair는 클래리베이트 팀이 자신들이 보유한 데이터의 양에만 신경쓰지 않으며 데이터의 격차를 메우는 일이 매우 중요하다고 말했습니다.

Nair는 “데이터 과학자로서 클래리베이트의 데이터와 분석에 대한 많은 신뢰도를 가지고 있다고 말합니다.” 면서 “하지만, 어떤 데이터 과학자도 대용량 데이터가 모든 것이 깔끔하고 명확하지는 않다고 말하지는 않습니다. 만일, 데이터 과학자들이 이렇게 말한다면 의심해봐야 할 것입니다.”고 말합니다.

고급 분석 기술의 도입으로 RWD는 이전보다 더 나아갈 수 있게 되었습니다. 이를 통해 특정 의약품 시장을 설명하는 보완적이고 견고한 데이터를 생성할 수도 있습니다. 환자들이 어디에 있는지, 처방 의사가 누구이고 어디에 있는지 등에 대한 질문에 대한 정확한 답을 이제는 얻을 수 있게 되었습니다.

고급 분석기술을 활용해 제약 및 의료기기 회사들은 시장 역학의 포괄적인 그림과 그 진화 가능성을 파악할 수 있습니다.

Nair 는 “우리는 코끼리의 큰 부분을 가지고 있습니다. 그리고 고급 통계를 적용해 전체 코끼리에 대해 보다 나은 그림을 그릴 수 있게 되었습니다.”고 말합니다.

RWD와 관련된 과제 및 이를 극복하기 위한 주요 방법 보고서에 대한 자세한 내용을 알고싶은 분들은 이곳을 통해 다운로드 해주시기 바랍니다.

클래리베이트 RWD의 제품 및 솔루션에 대한 자세한 사항은 여기를 통해 알아보시기 바랍니다.