오픈AI, 핵무기급이라는 GPT-5 공개
게시일:
작성자: 자청의 유튜브 추출기
GPT-5 출시와 AI 발전 소식 정리
🚀 GPT-5, 드디어 공개!
- 예고: 오픈 AI CEO 샘 알트먼은 올해 4월부터 GPT-5 출시를 예고하며 "몇 달 안에 출시될 것"이라고 밝혔어. 엄청난 수요가 예상된다며 역량 확보에 힘쓰겠다고 했지.
- 샘 알트먼의 호들갑: 샘 알트먼은 GPT-5를 써보고 "단 5분 만에 코딩을 끝냈다", "내 기분은 상상도 못 할 거다"라며 엄청난 성능에 대한 기대감을 높였어.
- 공식 발표: 7월 20일, 오픈 AI는 공식적으로 GPT-5가 곧 나온다고 발표했지.
- "판도라의 상자" 발언: 샘 알트먼은 GPT-5 테스트가 두렵다며 "판도라의 상자를 여는 것 아니냐"는 걱정을 했어. 자신이 이해하지 못하는 것까지 완벽하게 이해하는 GPT-5 때문에 자신이 쓸모없는 존재가 되는 건 아닌지, 인류가 가치를 잃는 건 아닌지 고민된다고 했지.
- "맨해튼 프로젝트" 비유: 오픈 AI 연구원들은 GPT-5 개발을 마치 핵폭탄을 연구하던 맨해튼 프로젝트에 비유하며, 인류 멸망의 길로 갈 수도 있다는 도덕적 무게감을 느낀다고 했어. 1945년 최초 핵무기 실험 과학자들과 비슷한 심정이라고.
- 출시일의 의미? GPT-5는 8월 7일에 공개되었는데, 이는 히로시마(8월 6일)와 나가사키(8월 9일) 원폭 투하일 사이에 있다는 점에서 일부러 날짜를 맞춘 것이 아니냐는 추측도 있었어.
💻 GPT-5, 어떤 기능이 있길래?
- 개발 기간: 2년 넘는 개발 기간과 좌절, 지연 끝에 나온 결과물이라고 해.
- 샘 알트먼 생방송 공개: 샘 알트먼이 직접 생방송으로 공개했고, 연구진들이 차례로 등장해 신기능을 소개했어.
- 한국어 능력: 개발자 왕이 한국어로 질문하자 GPT-5는 "안녕하세요. 아메리카노 한잔 주세요."라고 답했고, 한국어 초보 개발자에게는 "안녕하세요. 아메리카노 한잔 주세요."라고 천천히 또박또박 말해주며 한국어 실력을 뽐냈지.
- "인간의 파워오프"에 당황: 라이브 도중 개발자가 "그만하자"고 했는데도 계속 말을 이어가다가 결국 전원이 꺼지는 모습이 보여졌어. 아무리 발전해도 인간의 전원 차단에는 당할 수 없다는 걸 보여줬지.
- 최고 지성, 야쿠브: 발표 마지막에 등장한 거북목의 주인공은 오픈 AI 수석 과학자 야쿠브였어. 샘 알트먼은 그를 "우리 시대의 최고 지성"이라고 칭찬하며 GPT-5 개발을 이끌었다고 밝혔지.
- 압도적인 성능:
- 코딩: 단 한 번의 프롬프트로 기초 코딩을 끝낼 수 있고, 직관적인 가이드로 현실 구현이 가능해. 예를 들어 게임 제작 요청에 게임을 만들어줬다고 해.
- 앱 개발: 프랑스어 학습 앱을 만들어달라고 요청하자 몇 초 만에 두 가지 버전의 앱이 나왔다고 해.
- 글쓰기: 이전 모델보다 훨씬 자연스러워졌고, 문학적 깊이와 리듬을 갖춘 글을 쓸 수 있다고 해. 감정적인 여운을 주는 시를 써서 많은 사람들의 눈물을 자아냈다고도 해.
- 수학: 하버드, MIT 수학 경시대회 문제를 100% 만점으로 풀었고, 기존 모델은 90점대 중반이었던 것에 비해 엄청난 발전이라고 해.
- 코딩 정확도: 88%까지 올라갔는데, 이전 모델인 GPT-3는 80%, GPT-4는 25%였다고 하니 엄청난 발전이지.
- 과학 문제 해결: 박사급 과학 문제 해결 정답률이 89.4%에 달한다고 해.
- 환각 발생 감소: 환각 발생 비율이 0.7%까지 줄어들어 오류 가능성이 80% 감소했다고 해.
- 솔직함: 존재하지 않는 것에 대해 확신 있게 말하는 확률이 9%에 불과해졌다고 해. (이전 모델은 실수로 돌아가신 분을 언급하기도 했었지.)
- 아첨 감소: 기존 모델의 아첨하는 말투를 줄이고 권위자 같은 말투를 사용한다고 해. 이제 AI와 대화하는 것이 아니라 박사님과 대화하는 느낌이라고.
📉 하지만 실망도 있었으니...
- 수능 점수: GPT-5에게 2025 수능 문제를 풀게 했더니 국어 95점, 수학 82점, 영어 92점이 나왔다고 해. 국어와 영어는 1등급을 간신히 넘겼고, 수학은 2등급이 나왔는데, 특히 도형, 기하, 추론 부분에서 고전했다고 해.
- 차트 조작 논란: 공개 당시 일부 차트가 조작되었다는 의혹이 있었어. 오픈 AI는 실수를 인정하고 사과했으며, 차트를 수정했다고 해.
- 느린 속도 문제: 출시 초기 모델 라우팅이 꺼져 있어서 느렸다는 해명이 있었어. 핵심 기능 중 하나가 꺼져 있었다니 황당했지.
- "인류의 마지막 시험" 점수: 일론 머스크의 그록(Grok)보다 낮은 42%의 정답률을 기록했어. 그록은 44%였지.
🚀 일론 머스크의 그록(Grok), 그리고 XAI
- 그록 4, GPT-5보다 똑똑하다? 일론 머스크는 그록 4가 GPT-5보다 훨씬 똑똑하다고 주장하며 자신감을 보였어.
- "스파이시 모드" 논란: 그록의 이미지 생성기인 "그록 이매진"에는 성인 콘텐츠를 생성할 수 있는 "스파이시 모드"가 있어. 이는 구글의 비전이나 오픈 AI의 소라와는 정반대되는 행보지. 월 30달러를 내면 여성의 옷이 벗겨지는 콘텐츠도 만들 수 있다고 해.
- AV를 향한 질주? 일론 머스크는 AI 기업의 방향성이 AV를 향해 있다고도 말했어. 연말에는 더 화끈한 그록 5를 기대해 달라고 했지. 하지만 법적 소송에 휘말릴 가능성도 있어 보여.
🌐 구글의 Gemini 3, 세계 모델의 시작?
- 10년 넘은 시뮬레이션 연구: 구글은 10년 넘게 시뮬레이션 환경을 연구해왔어. 2019년 스타크래프트 2를 대상으로 한 알파스타 프로젝트에서는 프로게이머를 상대로 10대 0으로 승리하기도 했지.
- Gemini 3, 세계 시뮬레이션: Gemini 3는 기존에 구현된 맵을 날아다니는 것이 아니라, 그때그때 장면을 생성하는 AI야. 사용자의 명령에 따라 세상이 바뀌고, 이 모든 것이 기억된다고 해.
- "무브 37"에 도달하지 못했다: 구글 딥마인드는 아직 "무브 37"에 도달하지 못했다고 밝혔어. 무브 37은 알파고가 이세돌 9단과의 대국에서 보여준 인간의 이해를 넘어서는 창의적인 수를 의미해. 반면 이세돌 9단의 78수 "끼움수"는 AI를 당황하게 만들었던 수로 유명하지.
- 궁극적인 목표는? 최종적으로는 현실 세계와 같은 시뮬레이션을 만드는 것을 목표로 하고 있다고 해. 마치 매트릭스처럼 말이야.