llama.cpp로컬LLMGemma4macOS코딩에이전트MTP오프라인AI로컬 코딩 에이전트 직접 만들기 🥸솔직히 저도 '로컬 모델은 느려서 못 쓴다'고 생각했는데, MTP 드래프트 헤드 하나 붙이고 나서 생각이 바꼈어요. 58 tok/s에서 72 tok/s, 수치가 찍히는 순간 꽤 묘하게 기분 좋습니다. 🖥️2026년 6월 14일 AM 11:03·27분 읽기