모든 에이전트를 위한 컴퓨터

https://x.com/leerob/status/2026738994084565137

어쩌면 우리 모두가 “빌더(builders)”가 될지도 모릅니다. 어쩌면 AI가 우리의 모든 코드를 작성하게 될지도 모릅니다.

정확히 어떻게 될지는 알기 어렵지만… 제가 흥미롭게 보는 지점은 “역사”입니다.

“클라우드에서 소프트웨어를 만든다(build software in the cloud)”는 아이디어는 꽤 오래전부터 매력적으로 여겨져 왔습니다. 우리가 로컬에서 소프트웨어를 실행할 때 겪게 되는 문제들이 여럿 있기 때문이죠:

파일/폴더에 접근하기 위한 보안 모델 (예: 샌드박싱)
로컬 환경의 취약함 (예: Docker, Nix 등)
하드웨어 성능 (예: 일반 소비자용 하드웨어 vs 강력한 VM)
환경의 가용성 (예: 노트북이 슬립 모드로 들어가는 문제)

그런데도… 대부분의 소프트웨어 작업은 여전히 localhost에서 이뤄지고 있습니다!

이 모든 어려움에도 불구하고, 왜 클라우드 컴퓨터가 아직 승리하지 못한 걸까요? 저는 “클라우드 컴퓨터를 상자에 담아 제공한다(cloud computer in a box)”는 아이디어가 지금까지 100번은 출시된 것 같다고 농담하곤 했습니다.

예전에는 이 네 가지 지루한 문제들을 없애기 위해 “dev containers”나 “cloud IDEs” 같은 개념이 등장했습니다. 매우 빠른 하드웨어, 항상 켜져 있고, 팀이 바로 접근할 수 있는 환경을 제공하는 방식이었죠.

실제로는 이런 것들이 주로 Meta 같은 회사들에서만 보였습니다. 물론 그들은 .env 파일에 비밀(secrets)을 로컬 머신에 저장하지 않았겠죠! 대신 모든 것을 접속할 수 있는 멋진 클라우드 환경을 갖추고 있었습니다. 하지만 이를 위해서는 로컬/내부 DevEx(개발자 경험)에 상당한 투자가 필요했습니다.

많은 스타트업들이 이 아이디어를 더 폭넓은 개발자들에게 가져가 보려 했지만, 제 생각에는 제대로 된 프로덕트-마켓 핏을 얻지 못했습니다. GitHub도 마찬가지입니다. 리포지토리를 열기 위해 “.” 키를 눌러 클라우드 VM(“Codespaces”)을 띄울 수 있지만요.

그래서… 아이디어는 맞았지만, 타이밍이 틀렸던 셈입니다. 조금 시간을 앞으로 돌리면, 우리는 처음으로 강력한 AI 모델들을 갖게 됩니다. 그리고 갑자기 클라우드 컴퓨팅에 대한 새로운 수요가 생겼습니다.

다만 그 당시 모델들은 여전히 꽤 형편없었습니다! 인간처럼 컴퓨터를 사용하는 데 서툴렀죠. 모델들이 “툴 콜링(tool calling)”을 꽤 잘하게 된 건 대략 Sonnet 4 즈음부터였습니다. 그리고 툴 콜링이 중요한 이유는, 모델을 그 부분에 맞게 잘 훈련시킬 수 있는 범용적인 추상화이기 때문입니다. 그냥 새 도구들을 계속 얹어 주면 됩니다!

그렇다면 왜 지금, 클라우드 컴퓨터라는 아이디어가 비로소 작동하기 시작한 걸까요? 저는 세 가지가 결합되었기 때문이라고 봅니다:

더 나은 모델
더 나은 제품
새로운 역량

이제 모델들은 효과적인 에이전트로 사용될 수 있습니다. 신뢰도 있게 도구를 호출할 수 있고, 새로운 강력한 도구들을 계속 부여할 수 있습니다. 여기에는 에이전트가 인간처럼 컴퓨터를 사용하도록 가르치는 것, 즉 스스로 화면을 탐색하고 클릭하며 돌아다니는 능력도 포함됩니다.

모델을 사용하는 제품과 에이전트들도 이 새로운 지능을 활용하도록 진화해 왔습니다. 아래 영상에서 보이는 아이디어들은 불과 4–5개월 전만 해도 제대로 작동하지 않았습니다. 프런티어는 매우 빠르게 움직이고 있습니다.

처음에 이야기했던 로컬 환경의 고통들로 돌아가 보면, 이런 클라우드 샌드박스는 더 나은 보안 모델을 제공하고, 더 좋은 하드웨어 위에서 돌아가며, 항상 사용 가능한 상태입니다 (당신이 자는 동안에도 에이전트는 계속 동작할 수 있습니다).

소프트웨어 공학은 “역량 점프(capability jumps)”로 특징지어집니다. 컴퓨터를 사용하는 에이전트와 훌륭한 UI가 있다는 것은 분명 도움이 되지만, 우리가 일하는 방식을 근본적으로 바꾸기에는 충분하지 않습니다 (기존 패턴을 바꾸는 일은 어렵습니다!).

하지만 에이전트가 자기 작업을 스스로 테스트하고, 그 결과가 올바르다는 것을 증명하는 데모 영상을 보내줄 수 있는 것 같은 새로운 역량은 우리가 소프트웨어를 만드는 방식을 의미 있게 바꾸게 될 것입니다.

이건 Cursor 내부에서도 큰 차이를 만들어 냈습니다. 클라우드 에이전트를 통해 머지된 PR 비율이 몇 달 사이에 대략 8%에서 30% 정도로 올랐습니다. 정말 엄청난 변화입니다.

그럼에도 불구하고, 이런 새로운 역량이 생겼다고 해서 기존 소프트웨어 공학의 모범 사례들이 사라지는 것은 아닙니다. 우리는 여전히 코드를 직접 들여다봅니다. 여전히 시스템 아키텍처에 대해 깊이 고민합니다. 다만 이것이 미래의 모습을 엿볼 수 있게 해 준다는 점은 분명합니다.

저에게 그 미래는 더 나은 추상화가 존재하는 세상입니다. 개발 과정에서 지루한 부분을 걷어내고, 개발자들이 더 큰 문제에 집중할 수 있게 해 주는 세상 말이죠. 하지만 그 지점까지 가려면 아직 갈 길이 멉니다. 우리가 만들어야 할 것도 정말 많습니다!

모든 에이전트를 위한 컴퓨터

On this Page