본문 바로가기
IT 기기

OpenAI GPT-5 출시 및 평가 총정리, 생각보다 혹평이

by tinywisdom 2025. 8. 8.
반응형

2025년 8월 7일, OpenAI는 GPT-5를 공식 출시하였습니다. 이는 ChatGPT의 차세대 모델로, 무료 사용자부터 유료 플랜(Plus, Pro, Team)까지 모든 사용자에게 즉시 제공되며, Azure AI Foundry와 GitHub Copilot을 통해 개발자 접근도 가능해졌습니다. Microsoft 365 Copilot 통합으로 기업 환경에서도 활용이 확대되었습니다. 대부분의 국가에서 즉시 이용 가능하나, 일부 지역에서는 지연이 발생할 수 있습니다.

주요 특징 및 성능 향상

GPT-5는 이전 GPT-4 시리즈 대비 추론, 코딩, 쓰기 능력이 크게 개선된 점을 강조합니다. OpenAI CEO Sam Altman은 이를 "PhD 수준의 전문가"에 비유하였습니다. 구체적으로:

  • 추론 및 문제 해결: 복잡한 작업에서 효율성을 높였으며, 환각 문제를 줄이기 위해 모델이 솔직한 응답을 우선하도록 훈련되었습니다.
  • 코딩 기능: GitHub Copilot에서 프리뷰로 제공되며, 속도와 정확도가 향상되었습니다.
  • 안전성 강조: AI의 윤리적 측면을 강화하여 더 안전한 응답을 제공합니다.
  • 기타 개선: 비전 추론 능력 강화와 사용자 인터페이스 업데이트가 이루어졌습니다.

 

다만 DC인사이드 등 주요 커뮤니티에서는 아쉽다는 피드백도 더러 있어서 정리해보았습니다.

 

1. 과도한 기대와 하이프 대비 실망스러운 성능 개선

GPT-5는 "PhD 수준의 전문가"로 홍보되었으나, 실제로는 점진적 개선에 그쳐 혁신적이지 않다는 평가가 많습니다. 예를 들어, 벤치마크 성능이 Gemini 2.5 Pro 대비 약 1% 향상된 수준에 불과하다는 지적이 있습니다. 또한, 출시 이벤트와 마케팅이 과장되어 "슬롭(무의미한 내용)" 생성으로 비유되며, AGI(인공 일반 지능)로의 진전을 약속했으나 미달성했다고 비판받습니다.

2. 성능 및 기능적 한계

  • 환각(hallucination)과 오류 지속: 모델이 잘못된 정보를 생성하거나, 복잡한 문제에서 실패하는 경우가 여전합니다. 예를 들어, 특정 퍼즐 문제에서 실패하거나, 요청을 부분적으로만 수행하는 사례가 보고되었습니다.
  • 창의성과 쓰기 스타일 부족: 쓰기가 딱딱하고 생기 없으며, 창의적 쓰기 지원이 열위하다는 의견이 있습니다. 이전 모델(GPT-4o)보다 문학적 스타일이 떨어진다는 피드백이 다수입니다.
  • 코딩 및 에이전트 기능의 이상 행동: 코딩에서 클래스 알파벳 순 정렬 같은 불필요한 행동이 발생하거나, 복잡한 작업에서 오류가 나타납니다. 또한, 함수 호출 지원 미비와 비디오 이해 기능 부재가 지적됩니다.
  • 응답 품질 저하: 응답이 너무 짧거나, "생각 더 해보기"를 요구해야 정확해지며, 대화적 매력이 부족합니다.

3. 경쟁 모델과의 비교 열위

다른 AI 모델(예: Claude Sonnet 4, Grok 4 Heavy, Gemini) 대비 성능이 뒤처진다는 평가가 있습니다. 예를 들어, Grok 4가 이미 GPT-5보다 우수하며, OpenAI의 인재 유출이 원인으로 지목됩니다. 이는 AI 산업의 경쟁 심화로 인해 OpenAI의 입지가 좁아진 점을 반영합니다.

4. 접근성과 윤리적 문제

무료 사용자 포함 롤아웃에도 불구하고, ChatGPT Plus 사용자에게 32K 토큰 컨텍스트 윈도우 제한이 적용되어 실망을 유발합니다. 또한, 윤리적 우려(예: 편향성, 프라이버시 침해)가 제기되며, 모델이 "모르겠다"고 응답하도록 훈련된 점이 오히려 사용자 경험을 저하시킨다는 의견도 있습니다.

반응형