OpenAI-Broadcom, LLM 최적화 추론 칩 공개

OpenAI와 Broadcom의 LLM 최적화 추론 칩 공개

OpenAI와 Broadcom(NASDAQ: AVGO)은 오늘 OpenAI의 첫 번째 인공지능 프로세서인 Jalapeño를 공개했습니다. 이 칩은 OpenAI의 LLM 추론에 대한 미래 비전을 중심으로 설계된 가속기로, 두 회사가 함께 구축하는 다세대 컴퓨팅 플랫폼의 첫 번째 AI 가속기입니다. 이 플랫폼은 고급 AI를 더 빠르고, 더 신뢰할 수 있으며, 더 많은 사람들이 접근할 수 있도록 만드는 것을 목표로 합니다.

Image 1: OpenAI와 Broadcom 리더들이 Jalapeño 추론 칩을 선보이고 있습니다.

Jalapeño는 OpenAI의 CEO인 Sam Altman과 사장 Greg Brockman에게 Broadcom의 사장 겸 CEO인 Hock Tan과 사장 Charlie Kawwas에 의해 전달되었습니다. 이는 OpenAI가 모델과 제품의 백엔드를 구축하는 전략에서 중요한 단계입니다.

LLM을 위한 최적의 추론 플랫폼 설계

Jalapeño는 현대 LLM 추론을 위해 처음부터 설계된 플랫폼으로, 이전 AI 워크로드에서 적응된 범용 가속기가 아닙니다. ChatGPT, Codex, API 및 미래의 에이전트 제품을 포함한 OpenAI의 시스템에서 매일 사용되는 경험을 바탕으로 설계되었으며, 현재 및 미래의 LLM을 위한 것입니다. 목표는 오늘날의 선도적인 AI 가속기의 성능과 처리량을 결합하고, 가장 빠른 특수 추론 시스템에 가까운 지연 시간을 제공하는 것입니다. 이를 통해 Jalapeño는 대규모 상호작용 LLM 제품에 적합합니다.

OpenAI는 최첨단 모델을 개발하거나 그 위에 제품을 구축하는 것뿐만 아니라, 그 아래의 인프라를 설계하고 있습니다. 칩 아키텍처, 커널, 메모리 시스템, 네트워킹, 스케줄링, 배포 시스템 및 제품 경험을 포함한 모든 계층을 동일한 목표에 맞춰 최적화할 수 있습니다. 이는 모델을 더 빠르고, 더 신뢰할 수 있으며, 사용자에게 더 저렴하게 만드는 것입니다.

OpenAI 모델로 가속화된 9개월의 테이프아웃

Jalapeño는 설계 초기 단계부터 제조 테이프아웃까지 단 9개월 만에 공동 개발되었습니다. 이 맞춤형 AI 가속기 프로그램은 고성능 첨단 반도체에서 가장 빠른 ASIC 개발 주기를 달성한 것으로 평가됩니다. 이 속도는 OpenAI의 엔지니어링 팀과 Broadcom의 실리콘 구현 전문성, 그리고 OpenAI 모델을 사용한 설계 및 최적화 과정의 가속화를 반영합니다.

AI가 엔지니어들이 더 나은 칩을 더 빠르게 설계하도록 도울 수 있다면, 이는 산업 전반의 컴퓨팅 비용을 낮추고, 고급 AI에 대한 접근을 민주화하는 데 기여할 수 있습니다.

파트너와 함께하는 다세대 플랫폼 구축

Jalapeño는 2026년 말까지 초기 배포를 목표로 하는 다세대 컴퓨팅 플랫폼의 첫 단계입니다. 이 플랫폼은 OpenAI가 설계한 가속기와 Broadcom의 실리콘 구현, 네트워킹 및 연결 기술, 그리고 Celestica의 보드, 랙 및 시스템 전문성을 결합합니다.

고급 AI의 더 넓은 접근성 제공

이 작업의 목적은 간단합니다: 추론은 AI가 사람들에게 도달하는 지점입니다. 비용, 속도 및 신뢰성의 모든 개선은 더 빠른 ChatGPT 응답, 더 많은 단계로 작업할 수 있는 Codex 작업, 더 저렴하게 구축할 수 있는 API 제품, 또는 수요가 높을 때 더 안정적인 접근성으로 나타날 수 있습니다.

AI의 민주화는 고급 모델을 더 많은 사람들이 매일 사용할 수 있을 만큼 충분히 신뢰할 수 있고, 저렴하게 만드는 것을 의미합니다. Jalapeño는 OpenAI가 더 많은 인프라를 유용한 지능으로 전환하여 학생, 개발자, 소규모 기업, 연구자, 기업 및 학습, 창작, 어려운 문제 해결을 시도하는 모든 사람들에게 제공하는 데 도움을 줍니다.

파이랩 정리

OpenAI와 Broadcom의 LLM 최적화 추론 칩 공개

LLM을 위한 최적의 추론 플랫폼 설계

OpenAI 모델로 가속화된 9개월의 테이프아웃

파트너와 함께하는 다세대 플랫폼 구축

고급 AI의 더 넓은 접근성 제공