IT/개발

OpenAI 오픈소스 모델 출시(허깅스페이스, 120B,20B 모델공개)

빗자루검 2025. 8. 6. 11:04
반응형

 

오픈 AI가 그동안 사실상 오픈이 아니었죠.

 

아마도 다른 오픈 모델들이 계속 출시 되면서 위기감을 느꼈느지 드디어 오픈 소스모델을 선보였습니다. 

성능은 고가모델은 아니고 대충 중간정도 모델을 기준으로 gpt-oss라는 이름을 붙인거 같습니다. 

 

허깅페이스에 설명된 내용중 일부를 축약하면 다음과 같습니다. 

 

1. 오픈 모델 종류 

 

gpt-oss-120b— 단일 H100 GPU에 맞는 생산, 일반 용도, 고도 추론 사용 사례(5.1B 활성 매개변수가 있는 117B 매개변수)
gpt-oss-20b— 낮은 지연 시간과 로컬 또는 특수 사용 사례(3.6B 활성 매개변수가 있는 21B 매개변수)

 

돌려보려면 120b는 RAM 80G, 20b는 16G RAM이 있는 GPU면 가능하다고 합니다.

 

2. 특징 


- Apache 2.0 라이선스, 특허 위험 없이 자유롭게 구축할 수 있습니다. 실험, 사용자 정의 및 상업적 배포에 이상적입니다.


- 특정 사용 사례와 지연 시간 요구 사항에 따라 추론 노력(낮음, 중간, 높음)을 쉽게 조정할 수 있습니다.


- 모델의 추론 과정에 대한 완전한 접근 권한을 확보하여 디버깅을 용이하게 하고 출력 결과에 대한 신뢰도를 높입니다. 


- 매개변수 미세 조정을 통해 특정 사용 사례에 맞게 모델을 완벽하게 사용자 지정할 수 있습니다.


- 에이전트 기능, 함수 호출, 웹 브라우징 , Python 코드 실행 및 구조화된 출력을 위해 모델의 기본 기능을 사용합니다 .

 

- 기본 MXFP4 양자화: 모델은 MoE 계층에 대해 기본 MXFP4 정밀도로 훈련되어 gpt-oss-120b단일 H100 GPU에서 실행되고 gpt-oss-20b모델은 16GB 메모리 내에서 실행됩니다.

 

 

https://huggingface.co/collections/openai/gpt-oss-68911959590a1634ba11c7a4

 

gpt-oss - a openai Collection

Open-weight models designed for powerful reasoning, agentic tasks, and versatile developer use cases.

huggingface.co

 

 

코딩 벤치 마크 결과를 보겠습니다. 

 

 

 

물론 좋은 결과가 나오는 벤치 마크를 사용했겠지만 나쁘지 않네요.

이제 튜닝 모델이 쏟아져 나오겠지요? 

반응형