부산대학교

작성일: 2025.08.13

수정일: 2025.08.13

작성자: 김가랑

조회수: 51

"AGI로 가는 중요한 이정표"...오픈AI 'GPT-5' 공개, '박사급, 역사상 가장 진보된 차세대 인공지능 모델'

GPT-5는 AGI 그 자체는 아니지만, AGI로 가는 길에 놓인 중요한 이정표다. GPT-5의 등장은 AI 기술의 한계를 넓히고 AGI를 더 이상 먼 미래의 일이 아닌, 현실적인 목표로 만들고...

이미지:아이스톡

오픈AI(OpenAI)가 7일(현지시각) 라이브 스트리밍을 통해 역사상 가장 진보된 차세대 인공지능(AI) 모델 ‘GPT-5’를 공식 출시했다. 코딩, 수학, 글쓰기, 건강, 시각 인지 등 다양한 분야에서 이전 모델들을 뛰어넘는 성능을 선보이며, 전문가 수준의 지능을 모두가 활용할 수 있도록 구현했다. GPT-4o 이후 약 3개월 만에 공개된 이번 모델은 지능, 반응속도, 실용성에서 모두 비약적인 도약을 이루었다는 평가를 받는다.

오픈AI는 GPT-5가 “지금까지 개발한 모델 중 가장 똑똑하고, 빠르며, 유용하다”고 밝혔다. GPT-5 출시는 범용인공지능(AGI)으로 가는 중요한 이정표로 평가받고 있다. 하지만 GPT-5 자체가 AGI는 아니며, AGI를 향한 발판을 마련했다는 데에 큰 의미가 있다.

GPT-5는 코딩, 수학, 글쓰기 등 특정 분야에서 전문가 수준의 성능을 보여준다. 이는 AI가 단일 작업을 넘어, 여러 분야에서 복합적인 문제를 해결하는 능력을 갖추기 시작했다는 증거다. AGI는 모든 지적 작업을 인간 수준으로 수행하는 것을 목표로 하는데, GPT-5는 이 목표를 향한 핵심적인 구성 요소를 하나씩 채워가는 과정에 있다.

오픈AI GPT-5 출시 이미지

하나의 시스템, 다양한 기능

GPT-5는 대부분의 질문에 빠르게 답변하는 효율적인 모델과, 어려운 문제에 대해 깊이 사고하는 'GPT-5 thinking' 모델을 하나로 통합한 시스템이다. 실시간 라우터가 대화의 유형과 복잡성, 사용자의 의도 등을 파악해 최적의 모델을 자동으로 선택한다. 사용자가 프롬프트에 "심도 있게 생각해줘"와 같은 명령어를 추가하면 GPT-5 thinking 모델이 작동한다.

GPT-5는 단순히 벤치마크 점수가 높아진 것을 넘어, 실제 사용 환경에서 훨씬 더 유용해졌다. 환각(hallucinations) 현상이 크게 줄었고, 사용자 지시를 더 잘 따르며, 불필요하게 아첨하는 듯한 태도(sycophancy)도 줄였다. 특히, 챗GPT의 가장 일반적인 세 가지 용도인 코딩, 글쓰기, 건강 분야에서 눈에 띄는 개선을 이뤘다.

<코딩>GPT-5는 복잡한 프런트엔드 코드 생성과 대규모 저장소 디버깅에서 탁월한 성능을 보인다. 한 번의 프롬프트만으로도 미적 감각을 갖춘 웹사이트, 앱, 게임을 만들 수 있으며, 디자인 원칙에 대한 이해도가 높아졌다.

<글쓰기>문학적 깊이와 리듬감을 갖춘 글쓰기 작업을 돕는 가장 강력한 글쓰기 협업 도구가 됐다. 구조적 모호성이 있는 글쓰기, 예를 들어 자연스러운 흐름의 자유 시를 쓰는 것도 가능해져 일상적인 보고서, 이메일 작성 등에도 더욱 유용하다.

<건강>건강 관련 질문에 대해 이전 모델보다 훨씬 높은 정확도와 신뢰성을 보인다. GPT-5는 사용자의 상황, 지식 수준, 지역적 특성에 맞춰 더 안전하고 유용한 답변을 제공한다. 의료 전문가를 대체하는 것이 아닌, 사용자가 정보를 이해하고 의료 전문가에게 올바른 질문을 할 수 있도록 돕는 파트너 역할을 강조한다.

놀라운 벤치마크 성능

GPT-5는 여러 벤치마크에서 새로운 기록을 세웠다.

수학(AIME 2025에서 94.6% 달성), 실제 코딩(SWE-bench Verified에서 74.9%, Aider Polyglot에서 88% 기록), 멀티모달(MMMU에서 84.2%, HealthBench Hard에서 46.2% 기록) 등과 특히, 박사 수준의 과학 문제를 테스트하는 가장 어려운 과학 문제들을 모아둔 GPQA(Graduate-level Google-Proof Q&A Benchmark) 벤치마크에서는 GPT-5 Pro가 89.4%라는 새로운 최고 점수를 달성했다.

특히, 한국어 평가 벤치마크(KMMLU) 내부 테스트에서 전문가 수준을 뛰어 넘는 점수를 기록하며 기존 모델과 비교해 더 뛰어난 성능을 보이며 새로운 SOTA(Standard of the Art)를 달성했다. 이 성과는 GPT-4o에서 도입한 한글 토크나이제이션을 기반으로 지속적인 개선을 거쳐 이뤄졌다.

안정성과 안전성 강화

GPT-5는 이전 모델에 비해 환각 현상을 획기적으로 줄였다. GPT-4o 대비 사실 오류 발생률이 약 45% 감소했고, GPT-5 thinking 모델은 OpenAI o3에 비해 약 80% 적은 오류를 보였다. 또한, 불가능한 작업이나 정보가 부족한 상황에서 모델이 더 정직하게 자신의 한계를 인식하고 소통하도록 훈련되어 기만율을 4.8%에서 2.1%로 낮췄다.

안전성 측면에서는 '안전한 완성(safe completions)'이라는 새로운 훈련 방식을 도입했다. 이를 통해 모델은 모호한 의도가 담긴 질문에 대해 무조건 거부하기보다는, 안전한 범위 내에서 가장 도움이 되는 답변을 제공하도록 학습됐다.

GPT-5 Pro와 개인화 기능

가장 복잡하고 어려운 작업을 위해 GPT-5 Pro도 함께 출시됐다. GPT-5 Pro는 더 긴 시간 동안 사고하고 병렬 컴퓨팅을 활용하여 최고 품질의 답변을 제공하는 모델이다. 외부 전문가 평가에서도 GPT-5 thinking 모델보다 67.8% 더 선호되었으며, 주요 오류는 22% 더 적었다.

또한, GPT-5의 개선된 지시 수행 능력을 바탕으로, 사용자의 성격에 맞게 대화 스타일을 설정할 수 있는 4가지 새로운 프리셋(Cynic, Robot, Listener, Nerd)을 연구용으로 제공한다.

GPT-5 사용 방법 및 출시 일정

GPT-5는 이제 챗GPT의 기본 모델로 제공된다. Plus, Pro, Team, Free 등 모든 사용자가 GPT-4o, OpenAI o3 등을 대체하는 GPT-5를 사용할 수 있다. 유료 구독자는 'GPT-5 Thinking'을 직접 선택하거나, 프롬프트에 'think hard about this'와 같은 명령어를 입력해 심도 깊은 추론을 유도할 수 있다.

GPT-5는 이날부터 Plus, Pro, Team, Free 사용자에게 순차적으로 배포되며, Enterprise 및 Edu 고객은 1주일 뒤에 제공될 예정이다. 무료 사용자의 경우 GPT-5 사용량 제한에 도달하면, 더 작고 빠른 'GPT-5 mini'로 자동 전환된다.

아래는 이날 진행된 GPT-5 발표 영상으로 이날 샘 올트먼(Sam Altman) CEO를 비롯한 그렉 브록만(Greg Brockman), 세바스티앙 부베크(Sebastien Bubeck), 마크 첸(Mark Chen), 얀 뒤부아(Yann Dubois), 브라이언 피오카(Brian Fioca), 아디 가네쉬(Adi Ganesh), 올리버 고드먼트(Oliver Godement), 사치 제인(Saachi Jain), 크리스티나 카플란(Christina Kaplan), 크리스티나 김(Christina Kim), 일레인 야 레(Elaine Ya Le), 펠리페 밀론(Felipe Millon), 미셸 포크라스(Michelle Pokrass), 야쿠브 파초키(Jakub Pachocki), 막스 슈워처(Max Schwarzer), 레니 송(Rennie Song), 뤄천 왕(Ruochen Wang)이 참여했다.

한편, 이번 GPT-5 출시는 범용인공지능(Artificial General Intelligence, AGI)으로 가는 중요한 이정표로 평가받고 있다. 하지만 GPT-5 자체가 AGI는 아니며, AGI를 향한 발판을 마련했다는 데에 큰 의미가 있다.

전문가 수준의 지능, AGI의 한 조각

GPT-5는 코딩, 수학, 글쓰기 등 특정 분야에서 전문가 수준의 성능을 보여준다. 이는 AI가 단일 작업을 넘어, 여러 분야에서 복합적인 문제를 해결하는 능력을 갖추기 시작했다는 증거다. AGI는 모든 지적 작업을 인간 수준으로 수행하는 것을 목표로 하는데, GPT-5는 이 목표를 향한 핵심적인 구성 요소를 하나씩 채워가는 과정에 있다.

특히, 'GPT-5 thinking' 모델은 복잡한 문제를 논리적으로 분해하고 해결하는 추론 능력을 강화했다. 이는 단순한 패턴 인식을 넘어, 인간처럼 사고하는 능력에 근접했다는 점에서 AGI와 직접적으로 연결된다.

멀티모달 및 에이전트 기능 강화

GPT-5는 단순히 텍스트를 넘어 이미지, 코드 등 다양한 데이터를 이해하고 처리하는 멀티모달 능력이 크게 향상됐다. 또한, 복잡한 다단계 요청을 처리하고 여러 도구를 조율하는 에이전트 기능도 강화됐다.

이러한 기능들은 AGI를 구현하는 데 필수적인 요소다. AGI는 단순히 답을 찾는 것을 넘어, 인간처럼 다양한 정보를 종합하고, 도구를 활용하여 구체적인 행동을 실행할 수 있어야 하기 때문이다. GPT-5는 이러한 '행동'과 '실행' 능력을 한 단계 끌어올렸다.

기술적 진보와 함께 커지는 AGI의 위험성

GPT-5의 강력한 능력은 AGI의 위험성에 대한 경각심도 높인다. 샘 올트먼 CEO는 GPT-5의 개발을 맨해튼 프로젝트에 비유하며, "기술 발전 속도에 비해 윤리적, 사회적 준비가 턱없이 부족하다"는 점을 우려했다.

GPT-5는 환각 현상을 줄이고 안전한 답변을 유도하는 등 안전성 측면에서 큰 발전을 이뤘지만, AGI가 현실화될 경우 통제 불가능한 문제가 발생할 수 있다는 점은 여전히 큰 과제다. AGI는 인류에게 엄청난 이점을 줄 수 있지만, 동시에 예상치 못한 위험도 내포하고 있기 때문에 GPT-5와 같은 강력한 모델의 등장은 AGI 거버넌스에 대한 논의를 더욱 촉발시킬 것이다.

결론적으로 GPT-5는 AGI 그 자체는 아니지만, AGI로 가는 길에 놓인 중요한 이정표다. GPT-5의 등장은 AI 기술의 한계를 넓히고 AGI를 더 이상 먼 미래의 일이 아닌, 현실적인 목표로 만들고 있다.

출처 : 인공지능신문(https://www.aitimes.kr)

첨부파일: 첨부파일이(가) 없습니다.