최근 DeFi 애호가 @Defi0xJeff의 트윗을 통해 AI 기반 예측의 흥미로운 세계를 엿볼 수 있습니다. 해당 게시물에는 Prophet Arena라는 새로운 벤치마크가 소개되어 있는데, 이 벤치마크는 다양한 AI 모델들에게 Polymarket이나 Kalshi 같은 인기 예측 시장에서 가져온 실제 사건들을 예측하도록 시켜 성능을 비교합니다.
이 벤치마크가 흥미로운 이유는 각 AI 모델의 "개성"을 드러낸다는 점입니다. 같은 정보를 입력해도 서로 다른 방식으로 결과를 내놓아, 확률 처리나 예측 접근법에서 모델별 차이가 분명히 보입니다. 공개된 순위에 따르면, 현재 GPT-5가 두 가지 핵심 지표인 Brier Score와 Average Return에서 우위를 점하고 있습니다.
간단히 설명하자면, Brier Score는 확률적 예측의 정확도를 측정하는 방법으로, 예측한 확률과 실제 결과 사이의 제곱 차의 평균을 계산합니다. 점수가 낮을수록 정확도가 높은데, 이 벤치마크에서는 1에서 Brier Score를 뺀 값을 보고하기 때문에 수치가 높을수록 더 우수합니다. 즉 현실과 잘 맞는 보정된 예측에 높은 점수를 부여합니다.
반면 Average Return는 AI의 예측을 기반으로 최적의 배팅 전략을 시뮬레이션했을 때 얻을 수 있는 수익률을 의미합니다. 시장 상황과 일정한 위험회피 수준을 반영해 AI의 예측을 가상의 거래로 바꿔 어느 정도의 수익을 내는지 계산하는 방식입니다.
차트를 보면 GPT-5는 조정된 Brier Score에서 인상적인 84%로 최상위에 자리해 있으며, o1-medium과 Gemini 2.5 Experimental 같은 모델들이 그 뒤를 바짝 따릅니다. Average Return 항목에서는 GPT-5가 102%를 기록해 수익성 측면에서도 강한 잠재력을 보입니다. Grok x1, Claude Sonnet 3.5, Llama 4 등도 눈에 띄는 성과를 냈지만, Kim 2나 Phi 같은 모델 쪽으로는 성능이 급격히 떨어지는 것이 관찰됩니다.
트윗은 같은 사용자의 이전 스레드도 인용하며 AI와 예측 시장의 교차점에서 발생할 수 있는 기회들을 더 깊이 다룹니다. 상위 베터나 비정상적 시장 활동을 포착하는 데이터 분석 같은 저위험·즉시 적용 가능한 아이디어부터, 유동성 공급 관련 중간 수준의 전략, 예측 시장 수익을 패키징하는 DeFi 볼트나 AI 기반 헤지펀드 같은 고수익 아이디어까지 폭넓게 제시합니다.
암호화폐 쪽 사람들에게 이건 특히 유의미합니다. Polymarket 같은 예측 시장에서는 선거 결과부터 암호화폐 가격 변동까지 모든 것을 대상으로 베팅할 수 있으며, 투명성과 불변성을 위해 종종 blockchain과 연결됩니다. 여기에 AI를 접목하면 전략이 크게 강화될 수 있습니다—예컨대 GPT-5를 코파일럿으로 두고 시장 이벤트의 스크린샷을 스캔해 오해된 가격을 찾아내고 거래를 제안하게 하는 식입니다. @Defi0xJeff가 제안하듯, 예측 시장에 뛰어드는 사람에게는 매우 유용한 도구가 될 수 있습니다.
이 발전은 밈 토큰 영역에도 영향을 줄 수 있습니다. 밈 코인은 과대광고, 스토리텔링, 감정의 급격한 변동으로 성장하는 경향이 있어 예측 시장에 아주 적합합니다. 예측에서 뛰어난 AI 모델은 트레이더들이 펌프나 덤프를 예측하는 데 도움을 주거나 밈 관련 이벤트를 중심으로 한 새로운 DeFi 상품을 만들어낼 수도 있습니다.
블록체인에 관심이 있고 실력을 끌어올리고 싶다면, 예측 시장에서 AI를 실험해 보는 것이 차별화된 우위가 될 수 있습니다. 자세한 내용은 전체 스레드를 X에서 확인하고, 이들 벤치마크가 어떻게 진화하는지 주시하세요.