AI로 아동 희귀 유전병 진단 혁신

배경

유전체 시퀀싱이 발전했음에도 불구하고, 희귀 질환을 가진 많은 사람들은 명확한 유전적 진단을 받지 못하고 있습니다. 대략 절반은 광범위한 검사와 전문가의 검토 후에도 진단되지 않은 상태로 남아 있습니다. 이들의 의료 데이터에는 단서가 있을 수 있지만, 이를 찾기 위해서는 수천에서 수백만 개의 가능한 유전적 변이, 단편화된 임상 기록, 빠르게 변화하는 과학 문헌을 조사해야 합니다. 새로운 유전자-질병 관계, 사례 보고서, 분류 증거가 축적됨에 따라 해결되지 않은 사례가 새롭게 해석될 수 있습니다.

연구 개요

보스턴 어린이 병원의 Manton Center for Orphan Disease Research, 하버드 대학교, OpenAI의 연구자들은 OpenAI o3 Deep Research 추론 모델을 사용하여 이전에 분석된 376개의 해결되지 않은 사례의 비식별화된 임상 및 유전체 정보를 분석했습니다. 이 모델은 연구자와 임상의가 검토할 수 있는 증거 기반의 후보 설명을 제시했습니다. 전문가 검토, 추가 테스트 및 임상 확인 후, 의사들은 18건의 사례에서 진단을 확립했습니다. 이는 전문가의 초기 분석 후 4.8%의 추가 진단 수익률을 나타냅니다. 이 연구는 2026년 6월 18일 NEJM AI에 발표되었으며, AI 지원 연구 워크플로가 전문가들이 가장 어려운 사례를 재검토할 때 단서를 생성하는 데 어떻게 도움이 될 수 있는지를 보여줍니다.

오래된 사례가 새로운 답을 포함할 수 있는 이유

결론이 나지 않은 유전적 검사는 항상 영구적인 결과가 아닙니다. 환자의 표현형 설명, 검사 결과 및 가족력이 서로 다른 식별자, 형식 및 어휘를 사용하는 데이터베이스에 분산되어 있을 수 있습니다. 이러한 기록을 연결하는 것은 어렵기 때문에 전문가조차도 진단을 놓칠 수 있습니다. 과학적 지식이 발전함에 따라 동일한 데이터가 이전에는 불가능했던 답을 제공할 수 있습니다.

희귀 질환 재분석은 과학적 문제이자 유지 관리 문제입니다. 환자의 유전체는 변하지 않지만, 그 주변의 증거는 계속 변화합니다. 연구자들은 새로운 유전자와 변이를 질병과 연결하고, 실험실은 오래된 변이를 재분류하며, 사례 데이터베이스와 논문은 새로운 관찰을 축적합니다. 각 업데이트는 오래된 결론 없는 사례를 재검토할 가치가 있게 만들 수 있으며, 많은 기관은 변화하는 지식 기반과 동기화해야 하는 유전체 백로그를 상속받습니다.

재분석의 작동 방식

각 사례에 대해 팀은 환자의 임상 표현을 설명하기 위해 표준화된 인간 표현형 온톨로지 용어, 간헐적인 임상의 메모 및 설명적 임상 진단, 연령 및 성별과 같은 메타데이터, 필터링된 변이 테이블을 포함하는 비식별화된 패킷을 구성했습니다. 테이블은 각 변이의 희귀성, 인코딩된 단백질에 대한 예측 효과, ClinVar 분류 및 가용한 가족 구성원 간의 신호 품질을 포착했습니다. 대부분의 사례에는 아동과 양쪽 생물학적 부모의 데이터가 포함되었습니다.

팀은 모델에게 가장 그럴듯한 분자적 설명을 제안하고 그 작업을 보여달라고 요청했습니다. 연구자들은 임상 실험실이 유전적 변이를 분류하는 데 사용하는 ACMG/AMP 프레임워크를 사용하여 출력을 검토했습니다. 최소 두 명의 팀원이 각 후보를 검토했고, 의견 차이는 합의로 해결되었으며, 모델 출력은 결코 진단으로 간주되지 않았습니다. 발견은 자격을 갖춘 전문가가 증거를 검토하고, 변이가 병원성 또는 가능성 있는 병원성으로 분류되고, CLIA 인증 실험실이 이를 확인하고, 임상 팀이 결과를 가족에게 반환한 후에만 진단으로 간주되었습니다.

연구 결과

연구팀은 이전에 해결되지 않은 사례의 네 그룹에 워크플로를 적용했습니다: 신경발달 장애가 있는 아동, 희귀 신경근육 질환을 가진 사람들, 조기 정신병이 있는 아동 및 청소년, 소아에서의 갑작스러운 예기치 않은 사망 사례. 이러한 사례들은 첫 번째 검토를 기다리는 새로운 사례가 아니었습니다. 많은 사례가 이미 여러 상업적 또는 기관 파이프라인에 의해 검토되었고 다학제 팀에 의해 논의되었습니다.

코호트별 결과

신경발달 장애: 100건 중 10건 진단, 10.0% 수익률
신경근육 질환: 61건 중 4건 진단, 6.6% 수익률
소아에서의 갑작스러운 예기치 않은 사망: 200건 중 2건 진단, 1.0% 수익률
조기 정신병: 15건 중 2건 진단, 13.3% 수익률

모델이 후보를 제시하고 전문가들이 검토 및 임상 확인을 완료한 후, 의사들은 사례의 4.8%에서 진단을 확립했습니다. 이 비율은 이 인구에서 의미 있는 수치입니다. 이전 전문가 검토가 사례를 해결하지 못했기 때문입니다. 유사한 재분석 연구는 철저히 검토된 사례에서 한 자릿수의 수익률을 보고하며, 더 높은 수익률은 일반적으로 새로운 사례나 유전적 확인을 기다리는 잘 알려진 장애를 포함하는 연구에서 나옵니다.

18건의 진단 중 7건은 지역 연구 워크플로 외부에서 확립된 진단이었지만 팀이 검토한 기록에는 없었습니다. 여러 사례에서 변이는 이미 공공 데이터베이스에 병원성 또는 가능성 있는 병원성으로 나열되어 있어 데이터 소스 전반에 걸쳐 정보를 통합하는 운영상의 도전을 강조했습니다.

변이 식별에서의 유연성

한 조기 정신병 사례에서 모델은 입력 데이터에 나열되지 않은 유전체의 구조적 사건을 추론했습니다. 이는 염색체 22의 저품질 호출 연속을 아동의 심장, 면역, 신경발달 및 정신과적 특징과 연결한 후, DiGeorge 증후군과 관련된 22q11.2 결실을 가설로 제시했습니다. 이 가설적 변이는 후속 유전체 시퀀싱으로 확인되었습니다.

한계와 전망

이 연구는 일반 목적의 추론 모델이 표현형, 유전, 변이 주석, 데이터 품질 패턴 및 과학 문헌을 결합하여 검토 가능한 가설을 생성함으로써 회고적 유전체 재분석에 기여할 수 있음을 보여줍니다. 그러나 이 연구는 환자, 임상의 또는 고객이 OpenAI 모델을 사용하여 질병을 진단하거나 의학적 결정을 내려야 한다는 증거가 아닙니다. 모델은 어떤 참가자도 진단하지 않았으며, 모든 진단은 확립된 검토, 테스트 및 임상 확인 과정을 통해 의사와 다른 자격을 갖춘 임상 전문가에 의해 이루어졌습니다.

향후 연구는 LLM 지원 재분석을 표준 관행과 비교하여 진단 수익률, 후보까지의 시간, 임상의 노력, 오탐지 부담, 비용 및 치료에 미치는 영향을 평가해야 합니다. 이러한 연구는 여전히 자격을 갖춘 임상의가 증거를 평가하고 적절한 검사를 주문하며 진단 또는 치료 결정을 내려야 합니다. OpenAI는 이 초기 연구를 지원했지만, Manton Center는 OpenAI Foundation의 지원을 받아 이 작업의 다음 단계를 이끌 것입니다. 이 연구는 AI가 의사의 진단을 대체하는 것이 아니라, 신중하게 평가된 연구 도구가 전문가들이 조사할 가치가 있는 증거를 식별하는 데 도움을 줄 수 있음을 보여줍니다.

파이랩 정리