오픈 AI가 그동안 사실상 오픈이 아니었죠.
아마도 다른 오픈 모델들이 계속 출시 되면서 위기감을 느꼈느지 드디어 오픈 소스모델을 선보였습니다.
성능은 고가모델은 아니고 대충 중간정도 모델을 기준으로 gpt-oss라는 이름을 붙인거 같습니다.
허깅페이스에 설명된 내용중 일부를 축약하면 다음과 같습니다.
1. 오픈 모델 종류
gpt-oss-120b— 단일 H100 GPU에 맞는 생산, 일반 용도, 고도 추론 사용 사례(5.1B 활성 매개변수가 있는 117B 매개변수)
gpt-oss-20b— 낮은 지연 시간과 로컬 또는 특수 사용 사례(3.6B 활성 매개변수가 있는 21B 매개변수)
돌려보려면 120b는 RAM 80G, 20b는 16G RAM이 있는 GPU면 가능하다고 합니다.
2. 특징
- Apache 2.0 라이선스, 특허 위험 없이 자유롭게 구축할 수 있습니다. 실험, 사용자 정의 및 상업적 배포에 이상적입니다.
- 특정 사용 사례와 지연 시간 요구 사항에 따라 추론 노력(낮음, 중간, 높음)을 쉽게 조정할 수 있습니다.
- 모델의 추론 과정에 대한 완전한 접근 권한을 확보하여 디버깅을 용이하게 하고 출력 결과에 대한 신뢰도를 높입니다.
- 매개변수 미세 조정을 통해 특정 사용 사례에 맞게 모델을 완벽하게 사용자 지정할 수 있습니다.
- 에이전트 기능, 함수 호출, 웹 브라우징 , Python 코드 실행 및 구조화된 출력을 위해 모델의 기본 기능을 사용합니다 .
- 기본 MXFP4 양자화: 모델은 MoE 계층에 대해 기본 MXFP4 정밀도로 훈련되어 gpt-oss-120b단일 H100 GPU에서 실행되고 gpt-oss-20b모델은 16GB 메모리 내에서 실행됩니다.
https://huggingface.co/collections/openai/gpt-oss-68911959590a1634ba11c7a4
gpt-oss - a openai Collection
Open-weight models designed for powerful reasoning, agentic tasks, and versatile developer use cases.
huggingface.co
코딩 벤치 마크 결과를 보겠습니다.
물론 좋은 결과가 나오는 벤치 마크를 사용했겠지만 나쁘지 않네요.
이제 튜닝 모델이 쏟아져 나오겠지요?
'IT > 개발' 카테고리의 다른 글
vscode에서 launch.json을 이용하여 프로젝트 하위 폴더 파일 디버깅하기(subfolder 지정) (0) | 2025.07.30 |
---|---|
Deepface로 얼굴 속성 분석하기 (얼굴, 성별, 나이, 인종, 감정 인식) (0) | 2025.07.17 |
구글 mediapipe API를 이용하여 얼굴 인식 및 face landmark 그리기 (0) | 2025.07.16 |
OpenCV, 알고리즘 기반의 정면 얼굴 탐지 모델(딥러닝x, 사용예제) (0) | 2025.07.16 |
Openai API를 이용하여 web 검색 하기 + 결과에서 얼굴이 있는 이미지만 저장하기(Web search, Responses API, opencv) (0) | 2025.07.16 |