하이커뮤니티매니져
0
1
11:56

챗GPT의 오픈AI가 이례적으로 한 달 만에 신형 AI 모델 ‘GPT-5.2’를 출시하며 구글 제미나이의 추격에 맞불을 놨다. 이는 샘 올트먼 최고경영자(CEO)가 사내 ‘코드 레드(비상경보)’를 발령한 지 불과 열흘 만에 단행된 전격 공개로, 전문 지식작업 수행능력이 크게 향상된 것으로 평가되고 있다.
오픈AI는 11일(현지시간) GPT-5.2를 공개하며 “전문 지식 업무를 위한 가장 강력한 모델”이라고 밝혔다. 이번 모델은 기존 ‘즉답(Instant)’과 ‘사고(Thinking)’ 모드에 더해 장시간 심화분석을 수행하는 ‘프로(Pro)’ 모드를 새로 추가해 총 3단 구성으로 재편됐다.
특히 주목할 만한 성과는 전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 벤치마크에서 나왔다. GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가와 대등하거나 더 뛰어난 능력을 갖춘 것으로 평가됐다. 이는 지난 8월 출시된 GPT-5의 38.8%, 앤트로픽 ‘클로드 오퍼스 4.5’의 59.6%, 구글 ‘제미나이 3 프로’의 53.3%와 비교해 상당한 격차다.
오픈AI에 따르면 챗GPT 엔터프라이즈 평균 사용자는 AI로 하루 40~60분을 절약하고 있으며, 헤비 유저는 주당 10시간 이상을 절약하고 있다. 회사는 GPT-5.2가 스프레드시트 작성, 프레젠테이션 제작, 코딩, 이미지 인식, 긴 맥락 이해, 도구 활용, 복잡한 다단계 프로젝트 처리 등에서 더 많은 경제적 가치를 창출할 것이라고 강조했다.
소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서 GPT-5.2는 80%를 기록해 제미나이 3 프로(76.2%)를 능가했다. 코딩 특화 모델로 알려진 앤트로픽의 클로드 오퍼스(Claude Opus) 4.5(80.9%)와는 거의 대등한 수준을 보였다.
박사급 추론 능력을 측정하는 HLE 벤치마크에서도 우수한 성적을 냈다. 별도 도구 없이 모델 단독능력만 평가한 경우, GPT-5.2 프로는 36.6%로 제미나이 3 프로(37.5%)보다 소폭 낮았지만, 검색 등 도구를 결합한 평가에서는 50%를 기록해 제미나이 3 프로(45.8%)를 능가했다.
오픈AI가 GPT-5.2 출시를 앞당긴 배경에는 구글의 거센 추격이 있다. 지난 11월 구글이 발표한 제미나이 3 프로는 여러 AI 벤치마크에서 상위권을 차지하며 주목받았고, 제미나이 앱은 6억 5000만 월간 활성 사용자를 확보했다.
이에 올트먼 CEO는 12월 1일 사내 ‘코드 레드’를 선언하고, 광고·쇼핑 에이전트 등 다른 프로젝트를 뒤로 미루고 챗GPT 성능 개선에 자원을 집중하도록 지시했다.
올트먼 CEO는 11일 CNBC와의 인터뷰에서 “구글의 제미나이 3 모델 출시가 우리 지표에 미친 영향은 당초 예상보다 적었다”며 “내년 1월까지 코드 레드를 유지할 것”이라고 밝혔다. 월스트리트저널은 오픈AI가 내년 1월 새 모델을 추가로 공개한 뒤 경보를 해제할 계획이라고 보도했다.
GPT-5.2는 11일부터 챗GPT 플러스, 프로, 비즈니스, 엔터프라이즈 유료 요금제 사용자와 API를 통해 모든 개발자에게 제공된다.
이정환 기자 [email protected]
https://www.irobotnews.com/news/articleView.html?idxno=43888
토토하이, 토토하이먹튀신고, 토토힌먹튀사이트, 토토하이먹튀검증사이트, 토토하이먹튀없는사이트, 토토먹튀, 먹튀토토, 토토하이먹튀예방, 토토하이먹튀제보, 토토하이먹튀확인, 토토하이먹튀이력조회, 먹튀피해, 토토하이먹튀검증업체, 토토하이먹튀사이트검증, 토토하이먹튀공유, 토토하이먹튀사이트목록, 토토하이먹튀리스트, 토토하이안전공원, 토토하이안전놀이터, 토토하이안전사이트, 토토하이검증사이트