또 난리가 났네요.
이번에 OpenAI에서 최신 모델을 또 발표 했습니다. 어디까지 발전할까요?
모델을 발표할때마다 API 비용은 계속해서 낮추고 있어 진입 장벽은 점점 낮아지고 있습니다.
시장을 다 먹어버리고 올리는건 아닐지.... 의심
일단 GPT-4o 에 대해서 간단히 살펴 보면
"
GPT-4o("옴니"의 "o"는 "옴니"를 의미)는 훨씬 더 자연스러운 인간과 컴퓨터 간의 상호작용을 위한 단계로, 텍스트, 오디오, 이미지 및 비디오의 모든 조합을 입력으로 받아들이고 텍스트, 오디오 및 이미지의 모든 조합을 출력으로 생성합니다. 최소 232밀리초, 평균 320밀리초 만에 오디오 입력에 응답할 수 있으며, 이는 대화에서 사람의 응답 시간(새 창에서 열기)과 비슷한 수준입니다. 영어 텍스트 및 코드에 대한 GPT-4 터보 성능과 비슷하며, 비영어권 언어의 텍스트에 대한 성능이 크게 향상되는 동시에 API에서 훨씬 빠르고 50% 더 저렴합니다. GPT-4o는 특히 기존 모델에 비해 시각 및 오디오 이해 능력이 뛰어납니다.
"
이렇게 설명하고 있네요.
최대 토큰 수는 동일하지만 한국어 토큰 처리 방식이 바뀌어서 예전보다 사용 비용도 적게 들거라고 하더군요.
Korean 1.7x fewer tokens (from 45 to 27) | 안녕하세요, 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어 모델입니다, 만나서 반갑습니다! |
일단 딴건 몰라도 속도 하나는 엄청 빨라진건 확실합니다.
기존 벤치마크에서 측정한 결과, GPT-4o는 텍스트, 추론 및 코딩 인텔리전스에서 GPT-4 터보 수준의 성능을 달성하는 동시에 다국어, 오디오 및 시각 기능에서 최고의 성능을 발휘 한다고 합니다.
*가격
GPT-4o는 또 반으로 가격을 낮췄습니다.
데모화면을 보면 정말 대단하다는 생각이 듭니다.
https://openai.com/index/hello-gpt-4o/
*사용해보기
혹시 API 사용하는 법이 궁금하시면 간략 샘플
https://yongeekd01.tistory.com/141
https://yongeekd01.tistory.com/142
https://yongeekd01.tistory.com/143
https://yongeekd01.tistory.com/144
https://yongeekd01.tistory.com/145
https://yongeekd01.tistory.com/146
'IT > 개발' 카테고리의 다른 글
객체 탐지 모델 YOLO의 버전별 라이센스 비교 (MIT, Apache 2.0, GPL-3.0, AGPL-3.0 차이, license) (0) | 2024.05.22 |
---|---|
chatGPT-4o를 이용하여 이미지 분석하기(gpt-4-turbo, gpt-4o, Image Description, 이미지 해석 예제코드) (0) | 2024.05.21 |
tesseract OCR을 이용하여 이미지에서 문자 인식해보기(초간단) (0) | 2024.05.09 |
easyOCR을 이용하여 이미지에서 문자 인식해보기(초간단) (0) | 2024.05.03 |
GPT-4 Turbo 성능 및 API 가격 비교(chatGPT4, 타모델과 성능 비교) (0) | 2024.04.11 |