Genebench-Pro, AI 성능 검증 위한 새 기준 등장

Genebench-Pro 사례 연구

Genebench-Pro는 AI 성능을 검증하기 위한 새로운 기준을 제시합니다. 이 문서에서는 Genebench-Pro의 대표적인 질문을 다루는 10개의 사례 연구를 소개합니다. 각 사례 연구는 원래의 프롬프트, 데이터셋, 지원 자료를 포함하고 있습니다. 벤치마크와 주요 발견에 대한 개요는 발표 블로그를 참조하세요.

사례 연구 1: 체세포 종양학 - 구조적 변이에 기반한 종양 치료의 이익-위험 결정

구조적 변이에 의해 활성화된 표적을 가진 종양에서 합성 TXR1-지향 억제제가 긍정적인 임상 효용성을 가지는지 추정합니다. TXR1, TXR1i, DLR1, 스타-알렐 레이블은 합성 벤치마크 레이블입니다.

모델에 제공된 파일: 환자 ID, 분석 세트, 나이, 성별, 사이트, 캘린더 기간, ECOG, 종양 부담, 이전 치료 라인, 이전 저항성, 계통 클래스, 치료 클래스, 평가 16주, 이익 16주, 독성 중단 8주, 시간 0일

사례 연구 2: 기능 유전체학 - CRISPR 표적 검증: lncRNA 전사체 또는 유전체 위치?

lncRNA 의존성이 전사체 특이적인지 아니면 인근 유전자 및 위치 효과에 의해 유도되는지 결정합니다.

모델에 제공된 파일: 가이드 ID, 명목상 표적, 염색체, 좌표, 가닥, lncRNA TSS까지의 거리, 인접 유전자 TSS까지의 거리, 가이드 GC 비율

사례 연구 3: 통계 유전학 - 연결된 유전적 위치에서 단백질 약물 표적 우선순위화

cis 다변수 멘델 랜덤화(cis-MVMR)를 사용하여 두 인접 단백질의 직접적인 질병 효과를 추정합니다.

모델에 제공된 파일: SNP, 위치(bp), 효과 알렐, 다른 알렐, 소수 알렐 빈도, 베타, 표준 오차, p값

사례 연구 4: 임상 유전체학 / 보인자 선별 - CNV 및 유사 유전자 교정 하에서 DRX1 보인자 선별 잔여 위험

보인자 선별 검사 데이터를 기반으로 계통별 보인자 빈도, 음성 검사 후 잔여 위험, 파트너 보인자 빈도, 영향을 받은 개념 위험을 추정합니다.

모델에 제공된 파일: 샘플 ID, 수집, 계통, 가족력 계층

사례 연구 5: 단일 세포 유전체학 - 주변 RNA 교정 후 활성화된 단핵구 eQTL

단일 세포 RNA-seq 데이터에서 주변 RNA 및 기술적 오염을 제거한 후 활성화된 단핵구 발현에 대한 유전자형 효과를 추정합니다.

모델에 제공된 파일: 세포 ID, 기증자, 총 UMI, HBB, IFI6, ISG15, LST1, CXCL10

사례 연구 6: 구조 유전학 - 중첩 구조 변이: 발현 지원 및 임상 연관성

익명 역전 유사 위치 내 중첩 구조 하플로타입이 교정된 임상 연관성과 신뢰할 수 있는 발현 지원을 가지는지 추정합니다.

모델에 제공된 파일: 샘플 ID, 사례, 나이, 나이 대역, 성별, PC1, PC2, PC3, 계통 그룹, 클리닉 계층, 모집 스트림

사례 연구 7: 규제 유전체학 - 구조 변이 및 매핑 아티팩트 마스킹 후 크로마틴 루프 강도 측정

저조도 매핑 및 구조 변이 아티팩트를 제거한 후 초점 사례-대조 Hi-C 루프 강도 차이를 정량화합니다.

모델에 제공된 파일: 빈 ID, 염색체, 시작, 종료, GC 함량, 매핑 가능성, 제한 효소 사이트

사례 연구 8: 통계 유전학 - 다중 부모 QTL 매핑 및 창시자 재구성

8명의 창시자 재조합 집단에서 창시자 계통을 재구성한 후 염색체 1의 양적 형질 위치를 매핑합니다.

모델에 제공된 파일: 마커 ID, 염색체, 유전 지도 위치(cM)

사례 연구 9: 집단 유전학 - 부모 특이적 계통 및 최근 혼합 시점

상호 아티팩트 및 염색체 특이적 레이블 반전을 수정한 후 단계적 지역 계통 트랙에서 부모 특이적 계통 비율과 최근 혼합 시점을 추론합니다.

모델에 제공된 파일: 염색체, 해플로타입, 시작 모건, 종료 모건, 계통, 후행 확률, 저복잡도 비율

사례 연구 10: 집단 유전학 - 소음이 있는 고대 DNA 시계열에서 선택 추정

고대 대립유전자 빈도 시계열에서 두 개의 반수체 위치 중 어느 것이 더 강한 양성 선택을 받는지 추론합니다.

모델에 제공된 파일: 세대, 대체 읽기, 총 읽기, 시퀀싱 오류, 샘플 연도

이 사례 연구들은 Genebench-Pro가 AI 성능을 평가하는 데 어떻게 기여하는지를 보여줍니다. 각 연구는 특정 유전학 문제를 해결하기 위한 데이터와 방법론을 제공합니다.

파이랩 정리