2026년 6월 26일 · 4² AI 뉴스레터
OpenAI, AI 표준을 위한 글로벌 협력 강화
OpenAI
파이랩 정리
OpenAI의 AI 표준을 위한 글로벌 협력 강화
점점 더 강력해지는 AI 모델은 사이버 방어를 강화하고, 과학적 발견을 가속화하며, 전문 지식에 대한 접근을 확대할 수 있습니다. 그러나 이러한 모델의 능력이 오해되거나, 안전 장치가 불충분하거나, 정부가 대응에 필요한 정보를 얻지 못하면 안전 및 보안 위험을 초래할 수 있습니다. 이러한 이점을 안전하고 확신 있게 실현하기 위해서는 점점 더 강력해지는 시스템을 평가하고, 보호하며, 관리할 수 있는 기술 및 관리 역량을 갖춘 기관이 필요합니다.
이러한 이유로 OpenAI는 Linux Foundation이 주최하는 Appia Foundation 설립을 도왔습니다. Appia는 국제 표준과 기존 프레임워크를 AI 가치 사슬 전반에 걸쳐 실용적인 평가 기준으로 번역하는 개방형 모듈식 사양을 개발할 예정입니다. 이 작업은 제3자가 표준 준수를 확인할 수 있는 중요한 신뢰 계층을 개발하는 데 도움을 줄 수 있으며, 모델, 인프라 및 애플리케이션이 서로 다른 조직에 의해 개발될 때 더 명확하고 재사용 가능한 증거를 생성할 수 있습니다. 이를 통해 Appia는 국가 및 국제 기관이 서로의 작업을 신뢰할 수 있는 공유 기술 언어를 만드는 데 기여할 것입니다.
이러한 노력은 고급 AI 시스템에 필요한 기관, 표준 및 평가 관행을 강화하기 위한 더 넓은 작업의 중요한 다음 단계로 보고 있습니다.
최근 발표한 선도적인 AI의 민주적 거버넌스를 위한 청사진은 이러한 작업을 위한 로드맵을 제공합니다. 이 청사진은 지속 가능한 미국의 프레임워크, 강화된 AI 표준 및 혁신 센터(CAISI), 정부 전반에 걸친 더 넓은 회복력 전략을 요구합니다. 또한, 선도적인 위험이 국제적인 범위에 있음을 인식하고, 국가들이 안전 프레임워크를 개발하고, 위험 발견을 공유할 수 있는 신뢰할 수 있는 채널을 마련하며, 사건에 대한 조정된 대응을 개발하기 위해 협력해야 한다고 강조합니다.
국가 역량과 국제 협력은 서로를 강화해야 합니다. CAISI와 같은 강력한 기관은 기술 전문성을 개발하고, 선도적인 시스템을 평가하며, 독립적인 평가 생태계를 지원할 수 있습니다. 능력 있는 국가 기관의 네트워크는 공유 방법을 확립하고, 신뢰할 수 있는 증거를 인식하며, 정부가 함께 행동하는 데 필요한 공통 기술 이해를 제공할 수 있습니다.
표준은 이러한 노력의 중심에 있으며, 신뢰할 수 있는 평가 관행과 기술적 엄격함에 기반해야 합니다. 우리의 신뢰할 수 있는 제3자 평가를 위한 공유 플레이북에서는 선도적인 평가가 점점 더 많이 공개해야 하는 내용을 제시합니다: 테스트된 시스템, 도구 접근 및 평가 도구, 능력을 이끌어내는 데 사용된 방법, 사용 가능한 자원, 결과를 검증하기 위해 수행된 검사 등이 포함됩니다. 우리는 또한 미국 CAISI 및 영국 AISI와의 테스트 파트너십을 통해 이러한 원칙을 실천에 옮겼으며, 이들의 선도적인 능력 평가 및 생물학적 오용 방지 작업은 시스템의 구체적인 개선으로 이어졌습니다. 이 작업은 성능을 비교 가능한 방식으로 확인할 수 있는 관행의 기초를 만드는 중요한 기능을 수행합니다.
이러한 관행은 OpenAI의 더 넓은 안전 인프라를 보완합니다. 우리의 준비 프레임워크는 고급 AI 시스템의 가장 심각한 위험을 관리하는 접근 방식을 정의하고 운영하는 기초입니다. 우리의 선도적 거버넌스 프레임워크는 위험 평가, 모델 보고, 보안 통제, 사건 대응 및 외부 전문가 입력 통합 등 특정 규제 의무에 초점을 맞춘 공공 거버넌스 문서에 해당 접근 방식의 관련 부분을 적용합니다. 이러한 아티팩트는 광범위한 약속을 검증하고 개선할 수 있는 운영 관행으로 번역하는 데 도움을 줍니다.
Appia의 작업은 이러한 관행을 조직, 관할권 및 공급망 전반에 걸쳐 상호 운용 가능하게 만드는 다음 과제를 목표로 합니다.
이러한 포럼, 특히 Appia를 통해, 우리의 목표는 선도적인 개발에서 얻은 교훈을 정부, 기업 및 독립 평가자가 관할권 전반에서 사용할 수 있는 개방적이고 기술적으로 기반이 있는 관행으로 번역하는 것입니다.