Fable5 막히자 단 10일 만에… 일본이 던진 승부수 'Fugu'
일본의 대표적인 AI 유니콘 스타트업인 사카나AI가 오늘 멀티 에이전트 오케스트레이션 시스템 '후구(Fugu)'를 정식 출시했습니다. 이번 출시는 앤트로픽이 미국 정부 지침에 따라 '페이블 5' 서비스를 중단한 지 열흘 만에 나온 발 빠른 대안으로 볼 만한 여지가 큽니다.
일본의 대표적인 AI 유니콘 스타트업인 사카나AI가 오늘 멀티 에이전트 오케스트레이션 시스템 ‘후구(Fugu)’를 정식 출시했습니다. 이번 출시는 앤트로픽이 미국 정부 지침에 따라 ‘페이블 5’ 서비스를 중단한 지 열흘 만에 나온 발 빠른 대안으로 볼 만한 여지가 큽니다.
또한, 최근 본지가 취재한 ‘비바 테크놀로지’ 행사의 여러 세션에서 ‘소버린 AI’가 주요 화두로 떠오른 흐름 속에서 제시된 의미 있는 결과물이기도 합니다.
사카나AI 측은
후구는 특정 업체에 종속되지 않고,
단일 API만으로도 높은 수준의 AI 성능을 발휘하는 것을 목표로 한다고 설명했습니다
.
본지는 오늘 사카나AI의 주요 발표 내용을 아래와 같이 정리했습니다.
단일 모델 아닌 ‘팀’으로 응답한다 — 사카나 AI ‘후구’의 작동 원리
작업 성격에 맞춰 고른다 — 사카나 AI 후구·후구 울트라 차이는
익명 처리한 ‘A · B · C’ 모델과 비교했더니 — 후구 울트라가 다 이겼다
구독이냐 종량제냐 — 사카나 AI 후구, 가격 정책 공개
이 내용을 중심으로 오늘 기사를 시작하겠습니다.
1. 단일 모델 아닌 ‘팀’으로 응답한다 — 사카나 AI ‘후구’의 작동 원리
‘후구(Fugu)’는 단일 AI 모델이 아닙니다.
주어진 작업에 맞춰 여러 전문 AI 모델을 선택하고 조율하는 ‘멀티 에이전트 시스템’입니다.
쉽게 말해 여러 전문가로 구성된 팀이 마치 한 사람처럼 사용자에게 응답하는 구조입니다.
후구를 사용하려면 단일 API만 연결하면 된다고 사카나 AI 측은 밝혔습니다.
어떤 모델을 사용하고 언제 전환할지는 후구가 모두 자동으로 처리한다는 것이 사카나AI 측의 설명입니다.
후구가 이렇게 작동할 수 있는 이유는
매 작업에 가장 적합한 에이전트 조합을 스스로 학습해 찾아내도록 설계되었기 때문입니다.
이는 사전에 정해진 역할이나 순서에 따라 팀을 구성하던
기존 멀티 에이전트 시스템과 명확히 차별화되는 지점이기도 합니다.
후구를 운용하는 근본 기술의 경우 국제 학술대회 ‘ICLR 2026’에 채택된 논문 두 편과 함께 공개된 기술 리포트에 잘 담겨 있었습니다.
첫 번째 핵심 기술은 가벼운 진화형 코디네이터를 활용하는 ‘트리니티(TRINITY)’입니다.
이 코디네이터는 상황에 맞춰 여러 대형 언어 모델(LLM)에 사고, 실행, 검증 역할을 분배하고,
이 과정을 반복하며 전체 시스템을 조율하는 것이 특징인데요.
코딩, 수학, 추론 등 다양한 지식 기반 과제를 수행하도록 설계되었습니다.
두 번째 기술은 ‘컨덕터(Conductor)’입니다.
AI가 강화 학습을 통해 에이전트 간의 소통 및 지시 전략을 자연어로 직접 찾아내는 방식입니다.
이를 통해 여러 모델의 협업이 필요한 고난도 추론 과제에서 탁월한 성과를 낸다는 설명입니다.
사카나AI는 이러한 학습 방식에 대해
“ 사전에 특정 전문 지식을 주입하는 대신, 겉보기엔 직관적이지 않더라도
실제로는 가장 효율적인 협업 패턴을 AI가 스스로 학습한다 “
라고 설명했습니다.
사카나AI에 따르면 이 방식은
API 연동의 복잡성을 줄이면서도 비용 대비 성능은 크게 향상시키는 것으로 나타났습니다.
다만, 후구가 개별 요청마다 어떤 모델을 선택하고
어떻게 조율했는지에 대한 구체적인 과정은 사용자가 확인할 수 없었습니다.
모델 선택과 조율 메커니즘 자체가 사카나 AI의 핵심 기술이므로, 내부 라우팅 정보는 비공개로 설계했다는 것이 사카나 AI 측의 설명이었습니다.
2. 작업 성격에 맞춰 고른다 — 사카나 AI 후구·후구 울트라 차이는
후구는 사용 목적에 따라 ‘후구(Fugu)’와 ‘후구 울트라(Fugu Ultra)’ 두 가지 버전으로 제공됩니다.
두 버전 모두 OpenAI 호환 API를 지원하므로,
버전을 변경하더라도 기존 연동 방식을 그대로 유지할 수 있다고 사카나 AI는 밝혔습니다.
사카나AI는 두 버전을 분리한 이유로 작업에 따른 우선순위가 다른 점을 꼽았습니다.
후구는 성능과 응답 속도의 균형에 초점을 맞춘 버전입니다.
일상적인 코딩, 코드 리뷰, 대화형 챗봇처럼 빠른 피드백이 중요한 작업에 적합하다고 소개했습니다.
OpenAI Codex 등 기존 도구와 함께 사용할 수 있으며,
데이터 보안이나 규정 준수 요건에 따라 에이전트 풀에서 특정 에이전트나 제공 업체를 제외할 수도 있습니다.
반면, 후구 울트라는 속도보다 답변의 품질을 최우선으로 삼아 더 많은 전문 에이전트를 동원하는 버전입니다. Kaggle 대회 참가, 연구 논문 재현, 사이버 보안 분석, 문헌 및 특허 조사처럼
복잡하고 정밀한 작업에 주로 쓰일 수 있다는 것이 사카나 AI의 설명이었습니다.
다만 후구 울트라는 에이전트 풀이 고정되어 있어 사용자가 임의로 에이전트를 추가하거나 변경할 수 없었습니다.
결과적으로 사용자는 빠른 응답이 필요할 때는 후구를,
높은 정확도가 필요할 때는 후구 울트라를 선택하는 등 작업의 성격에 맞춰 유연하게 활용할 수 있습니다.
이처럼 작업 성격에 맞춰 버전을 선택하는 구조가 실질적인 의미를 가지려면,
두 버전 모두 확실한 성능이 뒷받침되어야 합니다. 그렇다면 후구는 실제로 어느 정도의 성능을 보여줄까요?
3. 익명 처리한 ‘A · B · C’ 모델과 비교했더니 — 후구 울트라가 다 이겼다
사카나AI는 ‘후구’가 벤치마크에서






