SMS처리 도우미
  1 2 3 4 5 6 7 8 9  

E-mail
  ldwin@naver.com
제목
  ChatGPT o3-mini 모델 출시, 더욱 강력해진 코딩·수학·과학 능력 (From. 소스놀이터)


OpenAI가 새롭게 선보인 “OpenAI o3-mini” 모델은, 그동안 ‘o1-mini’로 불리던 모델보다 더 빠르고 정확하면서도 비용까지 절감한 버전입니다. 일반 사용자 뿐 아니라, 개발자들에게 매우 유용한 기능 또한 제공합니다. 특히 수학, 과학, 코딩과 같이 생각을 많이 필요로 하는 분야에서, 비용은 낮으면서도 o1과 견주거나 뛰어넘는 성능을 발휘합니다.



특징 알아보기

 

개발자를 위한 새로운 기능 대거 포함

 

  - o3-mini에는 ‘함수 호출(Function calling)’, ‘구조화된 출력(Structured Outputs)’, ‘개발자 메시지(Developer messages)’ 등, 프로그래밍을 할 때 곧바로 적용 가능한 기능들이 대거 추가되었습니다.


     A. 스트리밍(Streaming) 기능

 

        - 긴 답변을 끊김 없이 자연스럽게 이어서 보여주는 기술입니다.
           예컨대, 유튜브 동영상이 버퍼링 없이 재생되는 것처럼,
           ChatGPT 답변도 한 번에 쭉 이어서 받아볼 수 있습니다.

        - 간단히 말해, 답변이 조금씩 끊기거나 느리게 나오지 않고,
           빠르고 부드럽게 도착한다는 뜻입니다.

 

     B. 추론 강도 옵션(낮음·중간·높음)

 

         - “추론 강도”란, 모델이 답변을 얼마나 깊이 생각해서 내놓을지를
            조절하는 설정입니다.

         - 가벼운 정보 검색이나 짧은 질문에는 빠르게 답변(낮음)을,
            복잡한 수학 문제나 과학 지식이 필요한 질문에는 시간을 들여
            정확하게 생각한 답변(높음)을 선택할 수 있어, 다양한 상황에 맞춰 활용 가능합니다.
 



ChatGPT 및 API 접근성
 

- ChatGPT 유료 사용자: Plus, Team, Pro라면 지금 바로(2025년 2월 1일 기준) 사용할 수 있습니다. 2월에는 Enterprise 사용자도 이용 가능.

- 무료 사용자도 체험 가능: 메시지 작성 창에서 ‘Reason’ 모드를 누르거나, 답변 다시 생성(regenerate)을 통해 사용 가능합니다.

- o1-mini 대체: 기존 o1-mini보다 더 많은 일일 요청 한도(기존의 50개에서 150개로)와 빠른 속도를 제공합니다. 복잡한 코딩이나 수학 문제를 다룰 때 특히 유리합니다.

 


어느 정도의 뛰어난 성능? 놀라운데!?
 

1. STEM(수학·과학·코딩) 특화: o3-mini는 과학 문제 풀이, 수학 계산, 프로그래밍에 강합니다. 예를 들어, 중간(Medium) 정도의 추론 강도로도 이미 o1과 비슷한 능력을 보이며, 더 빠른 응답을 보여줍니다.

2. 테스트 결과: 전문가 평가에서 o3-mini는 o1-mini보다 정답률이 높고, 오류가 적다는 사실이 확인되었습니다.

3. 추론 강도별 성능: 어렵지 않은 문제에는 빠른 답을, 어려운 문제에는 깊이 생각한 답을 주도록 추론 강도별 설정(낮음, 중간, 높음)이 가능합니다.


 

눈여겨볼 만한 벤치마크 성적
 

- AIME 2024(수학 경시대회): 중간 추론 강도에서도 o1 수준의 성능, 높은 추론 강도에서는 o1-mini와 o1보다 더 우수.

- GPQA Diamond(박사 수준 과학): 낮은 추론 강도에서도 이미 o1-mini보다 더 잘 풀고, 높은 추론 강도에서는 o1에 버금가는 결과.

- FrontierMath(고급 수학): 어려운 문제에도 효과적으로 접근해, 첫 시도 해결률까지 높아졌습니다.

- Codeforces(코딩 경진대회): 단계별로 추론 강도를 높일수록 성능이 올라가고, 중간 추론 강도만으로도 o1과 비슷해집니다.

- SWE-bench Verified(소프트웨어 엔지니어링): 기존 공개된 모델 중 가장 좋은 점수를 받았으며, 추론 강도를 높이면 더 큰 향상을 보입니다.

 


왜 빠르고 효율적인가?
 

- 응답 속도 약 24% 개선: o1-mini에 비해 답변 시작까지 걸리는 시간이 훨씬 줄어듭니다.

- 첫 토큰 출력이 빨라짐: 보통 답변이 시작되기까지 평균 2.5초 정도 줄어들었다고 합니다.

 

앞으로의 전망
 

- 비용 대비 효율 극대화: o3-mini는 gpt-4o보다 유사한(약간 더 높음) 정도의 비용으로 챗GPT 모델 중, 가성비가 가장 뛰어납니다 (2025년 2월 기준)

- STEM 분야나 복잡한 문제에 특히 유리하므로, 코딩·수학·과학 같은 분야에서 빠르고 정확한 솔루션을 얻고 싶다면 좋은 선택이 될 것입니다.

 

ChatGPT에 o3-mini가 탑재되면서 일반 사용자라도 쉽고 빠르게, 동시에 정확하게 다양한 정보를 얻고 문제를 해결할 수 있게 되었습니다. 필자 또한 프로그래머인데, AI의 발전 속도가 너무 빠르다고 느껴집니다.
이제 여러 명의 인간 프로그래머와 함께 작업하는 것보다, AI의 도움을 받는 것이 훨씬 낫다고 여겨지네요..

트위터, 페이스북 공유 부탁드립니다~!
트위터   페이스북


  • 패스워드
           
X