OpenAI가 새롭게 선보인 “OpenAI o3-mini” 모델은, 그동안 ‘o1-mini’로 불리던 모델보다 더 빠르고 정확하면서도 비용까지 절감한 버전입니다. 일반 사용자 뿐 아니라, 개발자들에게 매우 유용한 기능 또한 제공합니다. 특히 수학, 과학, 코딩과 같이 생각을 많이 필요로 하는 분야에서, 비용은 낮으면서도 o1과 견주거나 뛰어넘는 성능을 발휘합니다.
- o3-mini에는 ‘함수 호출(Function calling)’, ‘구조화된 출력(Structured Outputs)’, ‘개발자 메시지(Developer messages)’ 등, 프로그래밍을 할 때 곧바로 적용 가능한 기능들이 대거 추가되었습니다.
A. 스트리밍(Streaming) 기능
- 긴 답변을 끊김 없이 자연스럽게 이어서 보여주는 기술입니다.
예컨대, 유튜브 동영상이 버퍼링 없이 재생되는 것처럼,
ChatGPT 답변도 한 번에 쭉 이어서 받아볼 수 있습니다.
- 간단히 말해, 답변이 조금씩 끊기거나 느리게 나오지 않고,
빠르고 부드럽게 도착한다는 뜻입니다.
B. 추론 강도 옵션(낮음·중간·높음)
- “추론 강도”란, 모델이 답변을 얼마나 깊이 생각해서 내놓을지를
조절하는 설정입니다.
- 가벼운 정보 검색이나 짧은 질문에는 빠르게 답변(낮음)을,
복잡한 수학 문제나 과학 지식이 필요한 질문에는 시간을 들여
정확하게 생각한 답변(높음)을 선택할 수 있어, 다양한 상황에 맞춰 활용 가능합니다.
- ChatGPT 유료 사용자: Plus, Team, Pro라면 지금 바로(2025년 2월 1일 기준) 사용할 수 있습니다. 2월에는 Enterprise 사용자도 이용 가능.
- 무료 사용자도 체험 가능: 메시지 작성 창에서 ‘Reason’ 모드를 누르거나, 답변 다시 생성(regenerate)을 통해 사용 가능합니다.
- o1-mini 대체: 기존 o1-mini보다 더 많은 일일 요청 한도(기존의 50개에서 150개로)와 빠른 속도를 제공합니다. 복잡한 코딩이나 수학 문제를 다룰 때 특히 유리합니다.
1. STEM(수학·과학·코딩) 특화: o3-mini는 과학 문제 풀이, 수학 계산, 프로그래밍에 강합니다. 예를 들어, 중간(Medium) 정도의 추론 강도로도 이미 o1과 비슷한 능력을 보이며, 더 빠른 응답을 보여줍니다.
2. 테스트 결과: 전문가 평가에서 o3-mini는 o1-mini보다 정답률이 높고, 오류가 적다는 사실이 확인되었습니다.
3. 추론 강도별 성능: 어렵지 않은 문제에는 빠른 답을, 어려운 문제에는 깊이 생각한 답을 주도록 추론 강도별 설정(낮음, 중간, 높음)이 가능합니다.
- AIME 2024(수학 경시대회): 중간 추론 강도에서도 o1 수준의 성능, 높은 추론 강도에서는 o1-mini와 o1보다 더 우수.
- GPQA Diamond(박사 수준 과학): 낮은 추론 강도에서도 이미 o1-mini보다 더 잘 풀고, 높은 추론 강도에서는 o1에 버금가는 결과.
- FrontierMath(고급 수학): 어려운 문제에도 효과적으로 접근해, 첫 시도 해결률까지 높아졌습니다.
- Codeforces(코딩 경진대회): 단계별로 추론 강도를 높일수록 성능이 올라가고, 중간 추론 강도만으로도 o1과 비슷해집니다.
- SWE-bench Verified(소프트웨어 엔지니어링): 기존 공개된 모델 중 가장 좋은 점수를 받았으며, 추론 강도를 높이면 더 큰 향상을 보입니다.
- 응답 속도 약 24% 개선: o1-mini에 비해 답변 시작까지 걸리는 시간이 훨씬 줄어듭니다.
- 첫 토큰 출력이 빨라짐: 보통 답변이 시작되기까지 평균 2.5초 정도 줄어들었다고 합니다.
- 비용 대비 효율 극대화: o3-mini는 gpt-4o보다 유사한(약간 더 높음) 정도의 비용으로 챗GPT 모델 중, 가성비가 가장 뛰어납니다 (2025년 2월 기준)
- STEM 분야나 복잡한 문제에 특히 유리하므로, 코딩·수학·과학 같은 분야에서 빠르고 정확한 솔루션을 얻고 싶다면 좋은 선택이 될 것입니다.
ChatGPT에 o3-mini가 탑재되면서 일반 사용자라도 쉽고 빠르게, 동시에 정확하게 다양한 정보를 얻고 문제를 해결할 수 있게 되었습니다. 필자 또한 프로그래머인데, AI의 발전 속도가 너무 빠르다고 느껴집니다.
이제 여러 명의 인간 프로그래머와 함께 작업하는 것보다, AI의 도움을 받는 것이 훨씬 낫다고 여겨지네요..