Claude Mythos(Capybara) - 블로그 초안 유출
TMT...앤트로픽은 fortune 에 보낸 성명에서 “외부 CMS 도구 중 하나에서 발생한 문제로 인해 초안 콘텐츠가 접근 가능한 상태가 되었다”고 인정했다. 회사는 이를 “인적 오류”에 기인한 문제라고 설명했다...
Fortune Article
우리는 새로운 AI 모델인 Claude Mythos의 학습을 완료했습니다. 지금까지 우리가 개발한 모델 중 단연 가장 강력한 AI 모델입니다.
“Mythos”1 (Capybara)2는 새로운 급의 모델을 위해 붙인 새로운 이름으로, 기존의 최상위 모델이었던 Opus 모델보다 더 크고 더 지능적인 모델입니다. 이 이름에는 지식과 아이디어를 서로 촘촘하게 엮어 주는 깊은 연결 조직을 떠올리게 하고자 하는 뜻이 담겨 있습니다.
기존의 최고 모델이었던 Claude Opus 4.6과 비교했을 때, Mythos는 소프트웨어 코딩, 학술적 추론, 사이버 보안 등 다양한 영역의 테스트에서 훨씬 더 높은 점수를 기록합니다.
Claude Mythos를 공개하기에 앞서, 우리는 그 어느 때보다도 신중하게 접근하면서, 자체 테스트에서 파악한 것보다 더 많은 관점에서 이 모델이 야기할 수 있는 위험을 이해하고자 합니다. 특히, 이 모델이 단기적으로 사이버 보안 영역에서 어떤 위험을 초래할 수 있는지 파악하고, 그 결과를 공유하여 사이버 방어자들이 미리 대비할 수 있도록 돕는 것을 목표로 하고 있습니다.
Mythos는 매우 크고 연산 집약적인 모델이기도 합니다. 우리 입장에서도 제공 비용이 매우 크며, 고객들이 사용하기에도 비용 부담이 큰 모델입니다. 우리는 일반 공개에 앞서 이 모델을 훨씬 더 효율적으로 만들기 위해 노력하고 있습니다.
이러한 이유로, 우리는 다른 모델들을 공개할 때보다 Mythos의 출시를 더 천천히, 점진적으로 진행하고자 합니다. 우선은 소수의 얼리 액세스 고객에게 Mythos를 제공하고, 이들이 모델의 사이버 보안 활용 가능성을 탐색한 뒤 그 결과를 공유받는 방식으로 시작합니다.
사이버 보안을 위한 선제적 준비
우리는 최근 몇 달 동안, AI 모델의 사이버 보안 능력이 얼마나 빠르게 발전하고 있는지 여러 차례 글을 통해 다뤄 왔습니다. 이러한 능력은 선한 목적으로도, 악의적인 목적으로도 사용될 수 있습니다. 우리는 모델이 대규모 코드베이스에서 취약점을 빠르게 찾아내는 데 어떻게 활용될 수 있는지를 문서화했고, 이미 대규모 사이버 공격을 실행하는 데 사용되고 있음을 보여준 바도 있습니다.
Mythos는 현재 사이버 보안 능력 측면에서 다른 어떤 AI 모델보다 한참 앞서 있지만, 이는 곧 수비 측의 대응 속도를 훨씬 상회하는 방식으로 취약점을 악용할 수 있는 모델들이 잇따라 등장하게 될 미래의 전조이기도 합니다.
그래서 우리의 Mythos 출시 계획은 사이버 방어자에게 초점을 맞추고 있습니다. 우리는 이들에게 얼리 액세스 형태로 모델을 제공하여, 다가올 AI 기반 공격의 물결에 대비해 자신들의 코드베이스를 더 탄탄하게 만드는 작업을 남들보다 서둘러 착수할 수 있도록 돕고자 합니다.
사전 안전성 테스트
다른 모든 모델과 마찬가지로, 우리는 Claude Mythos를 대상으로 매우 폭넓은 안전성 및 역량 평가를 수행했습니다.
공개 범위 확대
우리는 앞으로 몇 주에 걸쳐 Claude API를 사용하는 더 많은 고객에게 Claude Mythos 접근을 점진적으로 확대해 나갈 예정입니다. 특히 사이버 보안 활용 사례에 큰 관심을 두고 있기 때문에, 초기 얼리 액세스 프로그램 확대 역시 이 분야를 중심으로 진행하는 것을 목표로 하고 있습니다.