의학 연구에서는 머신러닝이 인기를 끌고 있지만 진료실에서는 그렇지 않은 이유는 무엇입니까?
과학 기술
머신 러닝(ML)은 데이터에 대한 지속적인 평가와 과거 결과를 기반으로 한 패턴 식별을 통해 컴퓨터가 우리가 하는 방식을 학습하도록 프로그래밍합니다. ML은 대규모 데이터 세트에서 추세를 신속하게 파악하고, 사람의 상호 작용이 거의 또는 전혀 없이 작동하며, 시간이 지남에 따라 예측을 개선할 수 있습니다. 이러한 능력으로 인해 의학 연구에 빠르게 진출하고 있습니다.
유방암 환자는 곧 생검보다 ML을 통해 더 빠르게 진단될 수 있습니다. ML은 또한 뇌 스캔 데이터에서 식별된 패턴으로 제어되는 보철물을 사용하여 마비된 사람들이 자율성을 회복하는 데 도움이 될 수 있습니다. ML 연구는 사람들이 더 건강한 삶을 영위하는 데 도움이 되는 이러한 가능성과 기타 많은 가능성을 약속합니다. 그러나 ML 연구의 수가 증가하는 동안 진료실에서의 실제 사용은 확대되지 않았습니다.
한계는 의학 연구의 작은 표본 크기와 고유한 데이터 세트에 있습니다. 이 작은 데이터로 인해 기계가 의미 있는 패턴을 식별하기가 어렵습니다. 데이터가 많을수록 ML 진단 및 예측의 정확도가 높아집니다. 많은 진단 용도의 경우 수천 명에 달하는 엄청난 수의 피험자가 필요하지만 대부분의 연구에서는 수십 명의 피험자 중에서 더 적은 수를 사용합니다.
하지만 숫자를 조작하는 방법을 안다면 작은 데이터세트에서도 중요한 결과를 찾을 수 있는 방법이 있습니다. 데이터의 다양한 하위 집합을 사용하여 통계 테스트를 반복해서 실행하면 실제로는 임의의 이상값일 수 있는 데이터 집합의 중요성을 나타낼 수 있습니다.
P-해킹 또는 ML의 기능 해킹으로 알려진 이 전술은 현실 세계에서 유용하기에는 너무 제한적인 예측 모델을 생성합니다. 종이에 좋아 보이는 것이 우리를 진단하거나 치료하는 의사의 능력으로 해석되지는 않습니다. 종종 무의식적으로 발생하는 이러한 통계적 실수는 위험한 결론을 초래할 수 있습니다.
과학자들이 이러한 실수를 방지하고 ML 애플리케이션을 추진할 수 있도록 Penn Integrates Knowledge University 교수인 Konrad Kording은 Perelman 의과대학의 신경과학부와 의과대학의 생명공학, 컴퓨터 및 정보과학과에 임명되어 있습니다. Engineering and Applied Science는 NIH가 자금을 지원하는 CENTER라는 대규모 프로그램의 측면을 주도하고 있습니다. 즉, 실험적 엄격함 교육을 위한 교육적 연계 구축을 주도하고 있습니다. Kording은 건전한 과학 수행에 대한 공개 액세스 리소스를 제공할 Community for Rigor를 만들어 Penn의 집단을 이끌 것입니다. 이 포괄적인 과학 커뮤니티의 구성원은 ML 시뮬레이션 및 토론 기반 과정에 참여할 수 있습니다.
"실제 시나리오에서 ML이 부족한 이유는 도구 자체의 한계보다는 통계적 오용 때문입니다."라고 Kording은 말합니다. "연구에서 사실이라고 믿기에는 너무 좋아 보이는 주장을 발표하면 일반적으로 사실이며 통계를 사용하여 이를 추적할 수 있는 경우가 많습니다."
생의학 연구에서 ML 분야에서 의미 있는 발전을 이루려면 이러한 문제에 대한 인식을 높이고, 연구자가 문제를 식별하고 제한하는 방법을 이해하도록 돕고, 연구 커뮤니티에서 과학적 엄격함에 대한 강력한 문화를 조성해야 합니다.
Kording은 기계 학습을 생물 의학 연구에 통합하면 편견의 여지가 생길 수 있다고 해서 과학자들이 이를 피해야 한다는 의미는 아니라는 점을 전달하는 것을 목표로 합니다. 그들은 단지 그것을 의미 있는 방식으로 사용하는 방법을 이해하면 됩니다.
Community for Rigor는 데이터 세트와 통계 테스트를 통해 참가자를 안내하고 편견이 일반적으로 도입되는 정확한 위치를 찾아내는 생물의학 연구에서 기계 학습에 대한 모듈을 만들기 위한 구체적인 계획을 통해 현장의 과제를 해결하는 것을 목표로 합니다.
이 이야기는 멜리사 파파스(Melissa Pappas)가 쓴 것입니다. Penn Engineering Today에서 자세한 내용을 읽어보세요.