최신 AI 모델들이 실제로 전문 수학자처럼 숫자를 다룰 수 있을지 궁금해한 적 있나요? 저는 DeFi부터 그 난장판 같은 meme token 출시까지 모든 것을 구동하는 Solidity smart contracts 같은 블록체인 코드의 속살을 수년간 파고들어온 사람으로서, AI가 우리 분야를 어떻게 강화할지 늘 호기심이 있었습니다. 바로 그 맥락에서 Solidity 개발 배경을 가진 Cantina(https://cantina.xyz)와 Spearbit(https://spearbit.com)의 CEO Hari Krishnan이 등장합니다. 그는 최근 X post에서 암시적인 비교를 짧게 던졌는데, 이 비교는 암호화폐 기술에 큰 변화가 올 수 있음을 시사합니다.
Hari의 요지는? "GPT-5 pro is really good at math." 직설적입니다. 하지만 그는 이를 Google의 Gemini Deep Think와 비교하며, 이 모델이 International Mathematical Olympiad (IMO) gold medal-winning model이라는 과대광고에 "완전히 부합하지는 않는다"고 지적합니다. IMO는 수학 천재들을 위한 슈퍼볼과 같아서—고등학생들이 전문가들도 당황하게 만드는 문제를 푸는 곳이죠. DeepMind의 이전 AI는 그곳에서 은메달 수준을 기록했으니 기준은 매우 높습니다.
이건 그냥 헛소리가 아닙니다. Hari는 자신이 전에 올린 스레드를 인용하며 Gemini Deep Think를 다섯 가지 수학 퍼즐로 테스트했다고 말합니다. 결과는? 전반적으로 대실패였고, 그중에는 모델의 학습 데이터에서 그대로 나온 문제도 포함되어 있었습니다. 그는 "It tries its best to find an 'inductive pattern', but doesn't reason quite well,"라고 적었습니다. 아프네요. 참고로 귀납적 추론(inductive reasoning)은 데이터에서 패턴을 발견해 결과를 예측하는 셜록 홈즈식 추론 방식으로, meme coins의 tokenomics 최적화에서 복잡한 blockchain proofs 검증에 이르기까지 매우 중요합니다.
그럼 왜 meme token 세계에서 이게 중요할까요? GPT-5 Pro처럼 수학을 정확히 해내는 AI를 상상해 보세요. 이는 펌프앤덤프(pump-and-dump) 역학을 예측하거나 인간의 실수 없이 yield farming 전략을 시뮬레이션하는 등 바이럴 토큰 뒤의 복잡한 계산을 자동화할 수 있습니다. 이런 도구는 meme 제작을 민주화해 개발자들이 가스 수수료(gas fees)의 이차방정식을 디버깅하는 대신 문화적 훅과 재미 요소에 집중하게 만들 수 있습니다. 반대로 Gemini 같은 모델들이 계속 실수한다면, 우리는 고위험 블록체인 배포에서는 특히 AI에 사람의 감독을 더해야 한다는 것을 상기하게 됩니다—하나의 잘못된 계산이 커뮤니티에 큰 피해를 줄 수 있으니까요.
Solidity 베테랑의 관점에서 나온 Hari의 인사이트는 특히 설득력 있게 느껴집니다. 그가 Spearbit에서 하는 일은 스마트 계약을 감사(audit)해 종종 결국 수학적 실수로 귀결되는 취약점을 포착하는 것입니다. GPT-5가 계속 진화한다면, 다음 Dogecoin 후속 주자를 만드는 meme insider들에게 궁극의 공동 파일럿이 될지도 모릅니다.