젠슨 황 CES 2026 기조 연설 전문: 차세대 칩 베라 루빈·자율주행 AlphaMayo 동시 발표
본지는 늘 젠슨 황의 기조연설 전문은 전해왔습니다. 기사를 쓰는 과정에서 누군가는 중요한 정보가 누락될 우려가 있고, 늘 느끼는 것이지만 젠슨 황의 기조연설은 “벤허”같은 장편의 고전 영화를 보는 느낌도 들기 때문입니다.
본지는 늘 젠슨 황의 기조연설 전문은 전해왔습니다. 기사를 쓰는 과정에서 누군가는 중요한 정보가 누락될 우려가 있고, 늘 느끼는 것이지만 젠슨 황의 기조연설은 “벤허”같은 장편의 고전 영화를 보는 느낌도 들기 때문입니다.
피지컬AI가 화두로 떠오른 이번 CES에서 엔비디아 CEO 젠슨 황은 1시간 30분 동안 다양한 이야기를 쏟아냈습니다. 15개의 기조연설을 하나에 담았다고 할만큼 말이죠.
저희는 이날 기조연설 전문을 아래와 같이 구분했는데요.
1부 AI 소프트웨어와 에이전트 혁명
두 개의 플랫폼 전환: 5계층 스택의 재발명
2025년의 교훈: 스케일링 법칙과 ‘추론(Reasoning)’의 시대
오픈 모델의 폭발적 성장: 엔비디아의 기여와 생태계
에이전틱 AI(Agentic AI): 스스로 도구를 쓰고 계획하는 개인 비서
엔터프라이즈의 미래: 엑셀과 명령어가 사라진 인터페이스
2부 물리적 AI, 로보틱스, 그리고 ‘베라 루빈’
물리적 AI(Physical AI): 세상의 법칙을 배우는 ‘월드 파운데이션 모델’
자율주행의 완성 ‘AlphaMayo’: 벤츠와 함께 여는 레벨4 시대
로보틱스와 산업의 융합: AI로 설계하고 생산하는 미래 공장
차세대 슈퍼칩 ‘베라 루빈(Vera Rubin)’: 극한의 공동 설계
인프라의 혁신: 100% 수냉식 랙과 AI 전용 이더넷
메모리 병목 해소: 랙 내부의 초고속 스토리지와 BlueField-4
압도적 성능과 비용 절감: 무어의 법칙을 넘어선 경제성
그럼 전문을 시작하겠습니다.
<엔비디아 젠슨 황 CES 2026 기조연설 전문>
새해 복 많이 받으십시오. CES에 오신 것을 환영합니다.
오늘 저는 무려 15번의 기조연설에 달하는 방대한 내용을 이 자리에서 말씀드리고자 합니다.
여러분 모두를 뵙게 되어 정말 기쁩니다. 지금 이 강당에만 3천 분이 계시고, 오버플로우 홀(중정)에서 지켜보고 계신 2천 분, 그리고 엔비디아 전시장이 위치한 4층에서 시청 중인 1천 분도 계십니다. 물론 전 세계 수백만 명의 시청자 여러분도 새해를 시작하며 함께하고 계십니다.
<1부 AI 소프트웨어와 에이전트 혁명>
1. 두 개의 플랫폼 전환: 5계층 스택의 재발명
컴퓨터 산업은 약 10년에서 15년마다 재편됩니다. 새로운 플랫폼으로의 전환이 일어나는 것입니다. 메인프레임에서 PC로, PC에서 인터넷으로, 인터넷에서 클라우드로, 그리고 클라우드에서 모바일로 전환되었습니다. 매번 전 세계의 애플리케이션들은 새로운 플랫폼을 목표로 삼게 됩니다. 이것이 바로 ‘플랫폼 전환’입니다. 새로운 컴퓨터를 위해 새로운 애플리케이션을 만들게 되는 것이죠. 하지만 이번에는 두 개의 플랫폼 전환이 동시에 일어나고 있습니다.
우리는 이제 인공지능(AI) 시대로 진입하고 있으며, 애플리케이션은 이제 AI를 기반으로 구축될 것입니다. 처음에는 사람들이 AI 그 자체가 애플리케이션이라고 생각했습니다. 물론 AI는 애플리케이션이기도 하지만, 앞으로 여러분은 AI 위에 애플리케이션을 구축하게 될 것입니다. 더 나아가 소프트웨어를 실행하고 개발하는 방식 자체가 근본적으로 변화했습니다. 컴퓨터 산업의 5계층 스택 전체가 새롭게 태어나고 있습니다.
이제는 소프트웨어를 코딩하는 것이 아니라, 학습시킵니다. CPU가 아닌 GPU에서 실행합니다. 미리 녹화되어 컴파일된 후 기기에서 실행되던 기존 방식과 달리, 이제 애플리케이션은 문맥을 이해하고 매번 픽셀 하나, 토큰 하나까지 완전히 새롭게 생성해냅니다. 가속 컴퓨팅과 인공지능의 결과로 컴퓨팅은 근본적으로 재편되었습니다. 5계층 스택의 모든 단계가 지금 재발명되고 있는 것입니다.
이는 곧 지난 10년간 구축된 약 10조 달러 규모의 컴퓨팅 인프라가 이 새로운 방식에 맞춰 현대화되고 있음을 의미합니다. 또한 매년 수천억 달러의 벤처 자금이 이 새로운 세상을 만들고 고도화하는 데 투입되고 있다는 뜻이기도 합니다. 100조 달러 규모의 산업이 R&D 예산의 상당 부분을 인공지능으로 전환하고 있다는 의미이기도 합니다.
사람들은 묻습니다. “그 자금이 다 어디서 나오는가?” 바로 그 지점에서 나옵니다. AI로의 현대화, 기존 방식에서 인공지능 방식으로의 R&D 예산 전환, 그리고 이 산업으로 유입되는 막대한 투자가 우리가 왜 이렇게 바쁜지를 설명해 줍니다.
지난해도 다르지 않았습니다. 정말 놀라운 한 해였습니다. 슬라이드가 나와야 하는데... 리허설을 안 하면 꼭 이런 일이 생기더군요. 올해 첫 기조연설입니다. 여러분에게도 올해 첫 기조연설이기를 바랍니다. 그렇지 않다면 여러분은 꽤 바쁘셨을 겁니다. 저희에게는 올해 첫 기조연설이라, 이제 막 몸을 푸는 단계입니다.
2. 2025년의 교훈: 스케일링 법칙과 ‘추론(Reasoning)’의 시대
2025년은 놀라운 해였습니다. 모든 변화가 동시다발적으로 일어나는 듯했고, 실제로도 그랬습니다
첫 번째는 당연히 스케일링 법칙(scaling laws)입니다. 2015년에 제가 정말로 판도를 바꿀 것이라 확신했던 첫 번째 언어 모델이 등장했습니다. 그리고 실제로 큰 변화를 만들어냈습니다. 바로 BERT입니다.
2017년에는 트랜스포머(Transformers)가 등장했습니다. 그로부터 5년이 지난 2022년에야 비로소 ‘ChatGPT 모멘트’가 찾아왔고, 세상에 인공지능의 가능성을 일깨웠습니다.
그로부터 1년 후 매우 중요한 사건이 있었습니다. ChatGPT의 첫 번째 o1 모델, 즉 최초의 추론 모델이 나온 것입니다. 이는 완전히 혁명적이었습니다. 여기서 ‘테스트 타임 스케일링(test time scaling)’이라는 개념이 고안되었는데, 이는 매우 논리적인 접근입니다. 모델을 단순히 학습시켜 지식을 쌓게 하는 데 그치지 않고, 강화학습을 통해 사후 훈련을 시켜 기술을 숙달하게 하는 것입니다. 그리고 이제는 테스트 타임 스케일링, 즉 ‘사고(thinking)’의 단계로 넘어왔습니다. 실시간으로 생각하는 것입니다.
인공지능의 이러한 각 단계는 막대한 양의 컴퓨팅 파워를 필요로 하며, 컴퓨팅의 법칙은 계속해서 확장되고 있습니다. 대규모 언어 모델(LLM)은 끊임없이 진화하고 있습니다.
한편, 또 다른 혁신이 일어났습니다. 2024년에 시작된 이 혁신은 바로 ‘에이전틱 시스템(agentic systems)’의 등장입니다. 2025년이 되자 이 시스템은 거의 모든 곳으로 확산되기 시작했습니다. 추론하고, 정보를 찾고, 연구하고, 도구를 사용하며, 미래를 계획하고, 결과를 시뮬레이션할 수 있는 능력을 갖춘 에이전트 모델들이 갑자기 매우 중요한 난제들을 해결하기 시작한 것입니다.
제가 가장 좋아하는 에이전트 모델 중 하나는 커서(Cursor)인데, 이는 엔비디아의 소프트웨어 프로그래밍 방식을 혁신적으로 바꿔놓았습니다. 에이전틱 시스템은 바로 이 지점에서 진정한 도약을 이루어낼 것입니다.
물론 다른 유형의 AI도 존재합니다. 대규모 언어 모델만이 정보의 유일한 형태가 아니라는 것을 우리는 잘 알고 있습니다. 우주에 정보가 존재하고 구조가 있는 곳이라면 어디든, 우리는 대규모 언어 모델과 같은 형태의 모델을 학습시켜 그 정보를 이해하고, 표현 방식을 습득하여 AI로 구현해 낼 수 있습니다.
가장 거대하고 중요한 분야 중 하나는 물리적 AI(Physical AI)입니다. 자연의 법칙을 이해하는 AI죠. 물리적 AI는 세상과 상호작용하는 AI를 의미하지만, 세상 그 자체에도 암호화된 정보가 내재되어 있습니다. 우리는 이를 ‘AI 물리학’이라 부릅니다. 즉, 물리적 세계와 상호작용하는 ‘물리적 AI’가 있고, 물리 법칙 그 자체를 이해하는 ‘AI 물리학’이 있는 것입니다.
3. 오픈 모델의 폭발적 성장과 엔비디아의 기여
마지막으로, 작년에 있었던 가장 중요한 사건 중 하나는 ‘오픈 모델(open models)’의 발전입니다. 이제 우리는 AI가 모든 곳으로 퍼져나갈 것임을 확신합니다. 오픈소스와 오픈 이노베이션이 전 세계 모든 기업과 산업에서 동시에 활성화되고 있기 때문입니다. 작년은 오픈 모델이 진정으로 도약한 해였습니다.
실제로 작년에 우리는 딥시크(DeepSeek)의 약진을 목격했습니다. 추론 시스템인 R1은 최초의 오픈 모델로서 세상을 놀라게 했고, 말 그대로 이 거대한 흐름을 촉발시켰습니다. 정말 흥미로운 성과이며, 우리는 이러한 현상을 매우 긍정적으로 보고 있습니다. 이제 전 세계적으로 다양한 종류의 오픈 모델 시스템이 존재하며, 오픈 모델 또한 최전선(frontier) 수준에 도달했습니다.
여전히 최전선 모델보다 6개월 정도 뒤처져 있지만, 6개월마다 새로운 모델이 쏟아져 나오며 점점 더 똑똑해지고 있습니다. 그 결과 다운로드 수가 폭발적으로 증가하고 있습니다. 스타트업들이 AI 혁명에 동참하길 원하기 때문에 그 속도는 더욱 빨라지고 있습니다. 대기업도, 연구자도, 학생도, 그리고 거의 모든 국가가 이를 원하고 있습니다.
디지털 지능이 이렇게 보편화된 세상에서 누가 뒤처지기를 원하겠습니까? 오픈 모델은 작년에 인공지능을 진정으로 혁명적으로 바꿔놓았습니다. 그 결과 산업 전체가 재편될 것입니다.
우리는 꽤 오래전부터 이런 흐름을 예감했습니다. 여러분은 몇 년 전 우리가 자체 AI 슈퍼컴퓨터를 구축하고 운영하기 시작했다는 소식을 들으셨을 겁니다. 우리는 그것을 DGX 클라우드라고 부릅니다. 많은 분이 “클라우드 사업에 진출하는 겁니까?”라고 물으셨죠. 대답은 “아니요”입니다. 우리는 내부적인 연구 개발을 위해 이 DGX 슈퍼컴퓨터를 구축하고 있습니다.
결국 우리는 자체적인 오픈 모델을 개발할 수 있도록 수십억 달러 규모의 슈퍼컴퓨터를 운영하게 된 셈입니다. 우리가 해오고 있는 이 작업들에 매우 만족합니다. 전 세계 모든 산업 분야가 주목하기 시작했는데, 이는 우리가 매우 다양한 도메인에서 최전선 수준의 AI 모델을 연구하고 있기 때문입니다.
디지털 생물학, 특히 단백질 분야에서 우리가 이룬 성과로는 ‘La Proteina’가 있습니다. 단백질을 합성하고 생성할 수 있죠. ‘OpenFold3’는 단백질의 구조를 이해합니다. ‘Evo2’는 다양한 단백질을 이해하고 생성하는 방법, 즉 세포 표현의 기원을 이해합니다.
‘Earth-2’는 물리 법칙을 이해하는 AI입니다. ‘ForecastNet’과 ‘CorDiff’를 통해 이뤄낸 성과들은 사람들이 기상 예측을 하는 방식을 완전히 혁신했습니다.
‘Nemotron’과 관련해서도 획기적인 작업을 진행 중입니다. 이는 믿을 수 없을 정도로 빠른 최초의 하이브리드 트랜스포머 SSM 모델입니다. 덕분에 긴 호흡으로 깊이 사고하거나, 짧은 시간 안에 빠르게 사고할 수 있으며, 매우 스마트하고 지능적인 답변을 생성해 냅니다.
‘Nemotron-3’는 획기적인 역작이며, 조만간 여러분은 Nemotron-3의 다양한 버전을 만나보실 수 있을 겁니다. ‘Cosmos’는 세상이 어떻게 작동하는지를 이해하는 최전선의 오픈 월드 파운데이션 모델입니다.
‘Groot’는 관절의 움직임, 이동성, 그리고 운동 능력을 아우르는 휴머노이드 로봇 시스템입니다.
이러한 모델과 기술들이 이제 하나로 통합되고 있으며, 모두 전 세계에 공개되어 있습니다. 최전선(frontier) 휴머노이드 로봇 모델이 세상에 나온 것입니다.
그리고 오늘, 우리는 자율주행 자동차 분야의 성과인 ‘AlphaMayo’에 대해 말씀드리고자 합니다. 우리는 모델뿐만 아니라 학습에 사용된 데이터까지 모두 오픈소스로 공개합니다. 그래야만 모델이 어떻게 만들어졌는지 진정으로 신뢰할 수 있기 때문입니다.
우리는 모든 모델을 오픈소스로 공개하여 여러분이 이를 기반으로 파생 모델을 개발할 수 있도록 돕고 있습니다. 이를 위해 ‘NeMo 라이브러리’라는 전체 제품군을 갖추고 있습니다. 여기에는 Physics NeMo, Clara NeMo, Bio NeMo 등이 포함됩니다. 이 라이브러리들은 AI의 수명 주기(Lifecycle) 관리 시스템으로서, 데이터 처리와 생성부터 모델의 학습, 생성, 평가, 가드레일(안전장치) 적용, 그리고 배포에 이르기까지 모든 과정을 지원합니다.
이 라이브러리들은 각각 엄청나게 복잡하지만, 모두 오픈소스입니다. 이 플랫폼을 통해 엔비디아는 최전선 AI 모델을 구축하고 있으며, 그 방식은 매우 특별합니다. 우리는 모든 기업, 모든 산업, 모든 국가가 이 AI 혁명에 동참할 수 있도록 완전히 개방적인 방식으로 구축합니다. 우리가 이 분야에서 해내고 있는 작업들이 정말 자랑스럽습니다.
실제로 차트를 보시면, 이 산업에 대한 우리의 기여는 타의 추종을 불허하며, 앞으로도 그 속도는 줄어들지 않고 오히려 더 빨라질 것임을 확인하실 수 있을 것입니다.
이 모델들 또한 세계 최고 수준입니다.
[시스템 오류 발생]
모든 시스템이 다운됐군요. 샌타클래라에서는 절대 이런 일이 없는데, 라스베이거스라서 그런가 봅니다. 밖에서 누군가 잭팟이라도 터뜨렸나 보네요. 모든 시스템이 멈췄습니다.
좋습니다. 제 시스템은 여전히 먹통인 것 같지만 괜찮습니다. 즉흥적으로 계속하죠.
이 모델들은 최전선급 성능을 갖추고 있을 뿐만 아니라 오픈소스이며, 각종 리더보드에서도 최상위권을 차지하고 있습니다. 이는 우리가 매우 자부심을 느끼는 영역입니다. 우리는 리더보드와 지능(Intelligence) 부문에서 선두를 달리고 있습니다.
우리는 멀티모달 문서, 특히 PDF를 이해하는 핵심 모델을 보유하고 있습니다. 전 세계의 가장 가치 있는 정보들은 PDF 형태로 저장되어 있지만, 그 내용을 파악하고 해석해내기 위해서는 인공지능이 필요합니다.
우리의 PDF 리트리버(Retriever)와 파서(Parser)는 세계 최고 수준입니다. 음성 인식 모델 역시 절대적으로 세계 최고입니다. 우리의 검색 모델, 즉 시맨틱 검색과 AI 검색, 그리고 현대 AI 시대의 데이터베이스 엔진은 세계 최고 수준입니다. 우리는 지속적으로 리더보드 최상위권에 이름을 올리고 있습니다. 이 모든 것은 여러분이 직접 AI 에이전트를 구축할 수 있도록 돕기 위함입니다.
4. 에이전틱 AI(Agentic AI): 스스로 도구를 쓰고 계획하는 개인 비서
이것은 정말 획기적인 수준의 발전입니다.
ChatGPT가 처음 나왔을 때를 떠올려 보십시오. 사람들은 “결과물은 흥미로웠지만 ‘환각(hallucination)’ 현상이 심하다”고 말했습니다. 환각은 AI가 과거의 모든 것은 기억하지만, 현재와 미래를 알지 못하기 때문에 발생합니다. 따라서 답변하기 전에 먼저 조사를 수행하고 근거를 찾아야 합니다.
조사가 필요한지, 도구를 사용해야 하는지, 문제를 어떻게 단계별로 쪼개야 하는지를 추론하는 능력이 필요합니다. AI 모델은 이러한 각 단계를 수행할 수 있으며, 이 능력들을 조합하면 이전에는 한 번도 해본 적 없는 일을 수행하는 일련의 과정을 설계할 수 있습니다. 학습된 적이 없는 일도 해낼 수 있는 것입니다. 이것이 바로 추론이 가진 놀라운 힘입니다.
우리는 이제껏 본 적 없는 상황에 직면하더라도, 이를 과거의 경험을 통해 해결할 수 있는 상황이나 지식, 규칙으로 분해할 수 있습니다. 따라서 AI 모델의 추론 능력은 이제 엄청나게 강력해졌습니다. 에이전트의 추론 능력은 다양한 애플리케이션의 문을 활짝 열었습니다. 이제 우리는 AI 모델에게 처음부터 모든 것을 가르칠 필요가 없습니다. 우리가 태어날 때부터 모든 것을 알지 못하듯, AI도 상황에 맞춰 문제 해결 방법을 추론할 수 있으면 됩니다.
대규모 언어 모델(LLM)은 이제 이러한 근본적인 도약을 이뤄냈습니다. 강화학습, 사고의 사슬(Chain of Thought), 검색과 계획(Planning), 그리고 다양한 도구 사용 능력이 결합되어 이러한 기본 역량을 갖추게 되었으며, 이 모든 기술은 이제 완전히 오픈소스로 제공됩니다.
하지만 정말 놀라운 점은 또 다른 혁신이 일어났다는 것입니다. 저는 아빈드(Arvind)가 이끄는 퍼플렉시티(Perplexity)에서 이를 처음 목격했습니다. AI 검색 회사인 퍼플렉시티는 정말 환상적이고 혁신적인 기업입니다. 그들이 동시에 여러 모델을 사용한다는 사실을 처음 깨달았을 때, 저는 그것이 정말 천재적인 발상이라고 생각했습니다. 물론 우리도 그 방식을 따를 것입니다. AI 역시 당면한 문제를 해결하기 위해, 추론 과정의 어느 단계에서든 전 세계의 모든 뛰어난 AI를 활용하게 될 것입니다.
이것이 바로 AI가 진정한 ‘멀티모달(multimodal)’인 이유입니다. 즉, 음성, 이미지, 텍스트, 비디오, 3D 그래픽, 심지어 단백질 구조까지 이해한다는 의미입니다. 그야말로 멀티모달인 것이죠. 더 나아가 ‘멀티모델(multi-model)’이기도 합니다. 작업에 가장 적합한 모델이라면 무엇이든 사용할 수 있어야 한다는 뜻입니다. 이는 필연적으로 ‘멀티클라우드’를 의미합니다. 이 AI 모델들이 모두 각기 다른 곳에 존재하기 때문입니다. 또한 ‘하이브리드 클라우드’이기도 합니다. 엔터프라이즈 기업이든, 로봇 제조사든, 혹은 어떤 디바이스든 간에 때로는 엣지(Edge)에, 때로는 무선 기지국에, 때로는 기업 내부에, 혹은 병원처럼 데이터가 바로 옆에서 실시간으로 처리되어야 하는 장소에 AI가 존재해야 하기 때문입니다.
애플리케이션이 무엇이든 간에, 우리는 이제 미래의 AI 애플리케이션이 어떤 모습일지 알고 있습니다. 뒤집어 생각해보면, 미래의 애플리케이션은 AI 위에 구축될 것이므로, 이것이 바로 미래 애플리케이션의 기본 프레임워크가 됩니다. 제가 말씀드린 기능들을 수행할 수 있는 에이전틱 AI(Agentic AI)의 이 기본 프레임워크, 그리고 멀티모델 구조는 이제 모든 종류의 AI 스타트업들의 성장에 강력한 추진력을 불어넣었습니다.
그리고 이제 모든 오픈 모델과 우리가 제공하는 도구들 덕분에, 여러분은 AI를 커스터마이징하여 그 누구도 가르치지 않는 고유한 기술을 여러분의 AI에 학습시킬 수 있습니다. 다른 누구도 여러분과 같은 방식으로 AI를 지능적이고 똑똑하게 만들지 않습니다. 오직 여러분만이 할 수 있습니다. 이것이 바로 우리가 Nemotron, NeMo, 그리고 오픈 모델을 통해 이루고자 하는 목표입니다.
그 앞에 스마트 라우터를 배치하면, 이 라우터는 여러분이 입력한 프롬프트의 의도를 파악하여, 해당 애플리케이션에서 그 문제를 해결하는 데 가장 적합한 모델이 무엇인지 결정하는 관리자 역할을 수행합니다.
이 아키텍처를 한번 생각해 보십시오. 무엇을 얻게 됩니까? 갑자기 여러분은 한편으로는 완벽하게 커스터마이징 가능한 AI를 갖게 됩니다. 여러분의 회사를 위한 고유한 기술, 영업 비밀, 깊이 있는 도메인 전문 지식을 가르칠 수 있는 AI 말입니다. 아마도 여러분은 그 AI 모델을 학습시키는 데 필요한 모든 데이터를 이미 보유하고 있을 것입니다. 다른 한편으로, 여러분의 AI는 항상 최전선(frontier)에 있습니다. 구조적으로 여러분은 항상 최신 기술을 누리게 되며, 한편으로는 완벽하게 커스터마이징되어 있고, 다른 한편으로는 즉시 실행 가능한 상태인 것입니다.
그래서 우리는 이를 보여드리기 위해 가장 간단한 예제를 만들어 보았습니다. 우리는 이 전체 프레임워크를 ‘블루프린트(blueprint)’라고 부릅니다. 현재 전 세계 엔터프라이즈 SaaS 플랫폼에 통합된 블루프린트를 보유하고 있으며, 매우 뚜렷한 진전을 보이고 있습니다. 하지만 지금 보여드릴 것은 누구나 할 수 있는 짧은 예시입니다.
[데모 시연 내레이션]
개인 비서를 만들어 봅시다. 제 캘린더, 이메일, 할 일 목록을 관리해주고, 심지어 집도 지켜주길 원합니다. 저는 ‘Brev’를 사용하여 제 ‘DGX Spark’를 개인 클라우드로 전환했습니다. 덕분에 클라우드 GPU를 쓰든 DGX Spark를 쓰든 동일한 인터페이스를 사용할 수 있죠. 저는 쉽게 시작하기 위해 프론티어 모델 API를 사용하겠습니다.
제 이메일 관리를 돕게 하고 싶습니다. 그래서 제 에이전트가 호출할 수 있는 이메일 도구를 만듭니다. 이메일은 비공개로 유지하고 싶기 때문에, Spark에서 로컬로 실행되는 오픈 모델을 추가하겠습니다. 이제 모든 작업에 대해 에이전트가 적재적소에 맞는 모델을 사용하길 원하므로, ‘의도 기반 모델 라우터(Intent-based model router)’를 사용하겠습니다. 이렇게 하면 이메일 관련 프롬프트는 제 Spark 내부에 머물고, 다른 모든 작업은 프론티어 모델을 호출할 수 있습니다.
제 비서가 현실 세계와 상호작용하길 원하므로, Hugging Face의 ‘Richie’ 미니 로봇에 연결하겠습니다. 제 에이전트는 도구 호출(tool calling) 기능을 통해 Richie의 머리, 귀, 카메라를 제어합니다. Richie에게 목소리도 주고 싶은데, ‘ElevenLabs’가 정말 마음에 들어서 그들의 API를 연결하겠습니다.
[로봇 Richie 음성] “안녕하세요, 저는 DGX Spark에서 실행되는 Richie입니다.”
[사용자] “안녕, Richie. 오늘 내 할 일 목록에 뭐가 있지?”
놀랍지 않습니까? 정말 놀라운 점은, 이제 이런 일이 너무나도 쉬운 일이 되었다는 것입니다. 이제는 완전히 일상적인 일이 되었지만, 불과 몇 년 전만 해도 이 모든 것은 불가능했고, 상상조차 할 수 없는 일이었습니다
이 기본 프레임워크, 즉 언어 모델을 기반으로 애플리케이션을 구축하는 이 방식은 사전 학습된 독점적 최전선(frontier) 언어 모델을 활용합니다. 이를 커스터마이징된 모델과 결합하여 도구와 파일에 액세스하고, 다른 에이전트와도 연결되는 ‘에이전틱 프레임워크’, 즉 추론 프레임워크로 완성하는 것입니다. 이것이 바로 현대 시대 AI 애플리케이션의 아키텍처이며, 우리가 이러한 애플리케이션을 구축하는 속도는 믿을 수 없을 만큼 빨라졌습니다.
주목해 주십시오. 이 애플리케이션에 이전에 본 적 없는 정보나 구조가 명확하지 않은 데이터를 입력하더라도, AI는 추론을 통해 데이터와 정보를 파악하고 문제 해결 방법을 찾아내려 노력할 것입니다. 이것이 바로 인공지능입니다.
5. 엔터프라이즈의 미래: 엑셀과 명령어가 사라진 인터페이스
이 기본 프레임워크는 이제 통합되고 있으며, 제가 방금 설명한 모든 기술은 세계 최고의 엔터프라이즈 플랫폼 기업들과의 협력을 통해 구현되고 있습니다.
예를 들어, 팰런티어(Palantir)의 전체 AI 및 데이터 처리 플랫폼은 현재 엔비디아를 통해 통합 및 가속화되고 있습니다. 서비스나우(ServiceNow)는 세계 최고의 고객 및 직원 서비스 플랫폼입니다. 스노우플레이크(Snowflake)는 클라우드 기반의 세계 최고 데이터 플랫폼이며, 그곳에서도 놀라운 작업들이 진행 중입니다.
코드래빗(CodeRabbit)은 엔비디아 전사적으로 사용되고 있습니다. 크라우드스트라이크(CrowdStrike)는 AI 위협을 탐지하고 추적하기 위한 AI를 구축하고 있습니다. 넷앱(NetApp)의 데이터 플랫폼은 이제 엔비디아의 시맨틱 AI와 에이전틱 시스템을 탑재하여 고객 서비스를 제공하고 있습니다.
하지만 정말 중요한 점은 이것입니다. 이것이 단순히 애플리케이션을 개발하는 방식일 뿐만 아니라, 앞으로 여러분 플랫폼의 사용자 인터페이스(UI)가 될 것이라는 사실입니다. 팰런티어든, 서비스나우든, 스노우플레이크든, 혹은 우리와 협력하는 그 어떤 회사든 간에, 이제는 에이전틱 시스템 자체가 인터페이스입니다. 더 이상 수많은 빈 칸을 채워 넣어야 하는 엑셀 시트가 아닙니다. 단순히 명령어를 입력하는 커맨드 라인도 아닐 것입니다. 멀티모달 정보 처리가 가능해지면서 플랫폼과 상호작용하는 방식은 훨씬 더, 말하자면 ‘단순’해졌습니다. 마치 사람과 대화하듯 말이죠. 이것이 바로 에이전틱 시스템이 불러온 엔터프라이즈 AI의 혁명입니다.
<2부: 물리적 AI, 로보틱스, 그리고 ‘베라 루빈’ >
물리적 AI(Physical AI): 세상의 법칙을 배우는 ‘월드 파운데이션 모델’
자율주행의 완성 ‘AlphaMayo’: 벤츠와 함께 여는 레벨4 시대
로보틱스와 산업의 융합: AI로 설계하고 생산하는 미래 공장
차세대 슈퍼칩 ‘베라 루빈(Vera Rubin)’: 극한의 공동 설계
인프라의 혁신: 100% 수냉식 랙과 AI 전용 이더넷
메모리 병목 해소: 랙 내부의 초고속 스토리지와 BlueField-4
압도적 성능과 비용 절감: 무어의 법칙을 넘어선 경제성
6. 물리적 AI(Physical AI): 세상의 법칙을 배우는 ‘월드 파운데이션 모델’
다음은 물리적 AI(Physical AI)입니다. 이는 제가 수년간 강조해 온 영역이며, 실제로 우리는 8년 동안 이 작업을 진행해 왔습니다. 핵심 질문은 이것입니다.









