오픈AI GPT-4o mini, 반값 챗GPT 출시, 2024.07.18 발표…GPT-3.5 Turbo보다 60% 이상 저렴

카테고리 없음

오픈AI GPT-4o mini, 반값 챗GPT 출시, 2024.07.18 발표…GPT-3.5 Turbo보다 60% 이상 저렴

챗GPT 인공지능 AI 2024. 7. 20. 00:36

오픈AI GPT-4o mini, '반값 챗GPT, 출시, 2024.07.18 발표

…GPT-3.5 Turbo보다 60% 이상 저렴

OpenAI는 지능을 가능한 한 광범위하게 접근 가능하게 만드는 데 전념하고 있습니다. 오늘 저희는 가장 비용 효율적인 소형 모델인 GPT-4o mini를 발표합니다. 저희는 GPT-4o mini가 지능을 훨씬 더 저렴하게 만들어 AI로 구축된 애플리케이션 범위를 크게 확장할 것으로 기대합니다. GPT-4o mini는 MMLU에서 82%를 기록했으며 현재 LMSYS 리더보드 에서 채팅 선호도에서 GPT-4 1 보다 우수한 성과를 거두고 있습니다.(새 창에서 열립니다). 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로 가격이 책정되어 이전 프론티어 모델보다 훨씬 저렴하고 GPT-3.5 Turbo보다 60% 이상 저렴합니다.

GPT-4o mini는 낮은 비용과 지연 시간으로 다양한 작업을 처리할 수 있습니다. 여기에는 여러 모델 호출을 연결하거나 병렬화하는 애플리케이션(예: 여러 API 호출), 모델에 대량의 컨텍스트를 전달하는 애플리케이션(예: 전체 코드 베이스 또는 대화 기록), 빠르고 실시간 텍스트 응답을 통한 고객과 상호 작용하는 애플리케이션(예: 고객 지원 챗봇)이 포함됩니다.

오늘날 GPT-4o mini는 API에서 텍스트와 비전을 지원하며, 텍스트, 이미지, 비디오 및 오디오 입력과 출력에 대한 지원은 향후 제공될 예정입니다. 이 모델은 128K 토큰의 컨텍스트 창을 가지고 있으며, 요청당 최대 16K 출력 토큰을 지원하며, 2023년 10월까지의 지식을 보유하고 있습니다. GPT-4o와 공유되는 개선된 토크나이저 덕분에 영어가 아닌 텍스트를 처리하는 것이 이제 더욱 비용 효율적입니다.

[뛰어난 텍스트 지능과 다중 모드 추론을 갖춘 소형 모델]
GPT-4o mini는 텍스트 인텔리전스와 멀티모달 추론 모두에서 학술적 벤치마크에서 GPT-3.5 Turbo 및 기타 소형 모델을 능가하며 GPT-4o와 동일한 범위의 언어를 지원합니다. 또한 함수 호출에서 강력한 성능을 보여주어 개발자가 데이터를 페치하거나 외부 시스템에서 작업을 수행하는 애플리케이션을 빌드할 수 있으며 GPT-3.5 Turbo에 비해 롱 컨텍스트 성능이 향상되었습니다.

[GPT-4o mini는 여러 주요 벤치마크를 통해 평가되었습니다 .]

추론 작업: GPT-4o 미니는 텍스트와 시각을 모두 포함하는 추론 작업에서 다른 소형 모델보다 우수하며, 텍스트 지능 및 추론 벤치마크인 MMLU에서 82.0%의 점수를 받았습니다. 이는 Gemini Flash의 77.9%, Claude Haiku의 73.8%보다 높습니다.

수학 및 코딩 능력: GPT-4o 미니는 수학적 추론 및 코딩 작업에서 탁월하여 시중의 이전 소형 모델보다 성능이 뛰어납니다. 수학적 추론을 측정하는 MGSM에서 GPT-4o 미니는 87.0%를 기록한 반면 Gemini Flash는 75.5%, Claude Haiku는 71.7%를 기록했습니다. GPT-4o 미니는 코딩 성능을 측정하는 HumanEval에서 87.2%를 기록한 반면 Gemini Flash는 71.5%, Claude Haiku는 75.9%를 기록했습니다.

다중 모드 추론: GPT-4o mini는 다중 모드 추론 평가인 MMMU에서도 강력한 성능을 보였으며, Gemini Flash의 56.1%, Claude Haiku의 50.2%에 비해 59.4%를 기록했습니다.

평가 벤치마크

모델 개발 프로세스의 일환으로, 우리는 소수의 신뢰할 수 있는 파트너와 협력하여 GPT-4o mini의 사용 사례와 한계를 더 잘 이해했습니다. 우리는 Ramp 와 같은 회사와 협력했습니다.(새 창에서 열립니다)그리고 슈퍼휴먼(새 창에서 열립니다)영수증 파일에서 구조화된 데이터를 추출하거나 스레드 기록이 제공될 경우 고품질 이메일 응답을 생성하는 등의 작업에서 GPT-4o mini가 GPT-3.5 Turbo보다 훨씬 더 나은 성능을 발휘한다는 것을 발견했습니다.

[내장된 안전 조치]
안전은 처음부터 우리 모델에 내장되어 있으며 개발 프로세스의 모든 단계에서 강화됩니다. 사전 훈련에서 우리는 다음을 필터링합니다 .(새 창에서 열립니다)증오 표현, 성인 콘텐츠, 주로 개인 정보를 집계하는 사이트, 스팸과 같이 모델이 학습하거나 출력하기를 원하지 않는 정보. 훈련 후, 우리는 강화 학습과 인간 피드백(RLHF) 과 같은 기술을 사용하여 모델의 행동을 정책에 맞춰 조정하여 모델 응답의 정확도와 신뢰성을 개선합니다.

GPT-4o 미니는 GPT-4o 와 동일한 안전 완화책이 내장되어 있으며 , 당사는 Preparedness Framework 에 따라 자동 평가와 인적 평가를 모두 사용하여 신중하게 평가했으며 자발적 약속 에 따라 평가했습니다 . 사회 심리학 및 허위 정보와 같은 분야의 70명 이상의 외부 전문가가 GPT-4o를 테스트하여 잠재적 위험을 파악했으며, 당사는 이를 해결하고 향후 GPT-4o 시스템 카드와 Preparedness 점수표에서 세부 정보를 공유할 계획입니다. 이러한 전문가 평가의 통찰력은 GPT-4o와 GPT-4o 미니의 안전을 개선하는 데 도움이 되었습니다.

이러한 학습을 바탕으로, 저희 팀은 또한 저희 연구에서 얻은 새로운 기술을 사용하여 GPT-4o mini의 안전성을 개선하기 위해 노력했습니다. API의 GPT-4o mini는 저희의 명령어 계층을 적용한 최초의 모델입니다.(새 창에서 열립니다)이 방법은 모델의 탈옥, 즉석 주입 및 시스템 즉석 추출에 대한 저항 능력을 향상시키는 데 도움이 됩니다. 이를 통해 모델의 응답이 더 신뢰할 수 있고 대규모 애플리케이션에서 사용하기에 더 안전해집니다.

우리는 GPT-4o mini의 사용 방식을 계속 모니터링하고 새로운 위험이 발견됨에 따라 모델의 안전성을 개선할 것입니다.

[가용성 및 가격]
GPT-4o mini는 이제 Assistants API, Chat Completions API 및 Batch API에서 텍스트 및 비전 모델로 사용할 수 있습니다. 개발자는 1M 입력 토큰당 15센트, 1M 출력 토큰당 60센트를 지불합니다(표준 책의 2500페이지에 해당). 앞으로 며칠 안에 GPT-4o mini에 대한 미세 조정을 출시할 계획입니다.

ChatGPT에서 무료, 플러스, 팀 사용자는 오늘부터 GPT-3.5 대신 GPT-4o mini에 액세스할 수 있습니다. 엔터프라이즈 사용자도 다음 주부터 액세스할 수 있게 되는데, 이는 모든 사람이 AI의 이점을 누릴 수 있도록 하는 사명에 따른 것입니다.

[오픈AI 향후 계획]
지난 몇 년 동안 우리는 AI 인텔리전스의 놀라운 발전과 상당한 비용 절감을 목격했습니다. 예를 들어, GPT-4o mini의 토큰당 비용은 2022년에 도입된 덜 유능한 모델인 text-davinci-003 이후로 99% 감소했습니다. 우리는 모델 역량을 향상시키면서 비용을 낮추는 이러한 궤적을 계속 이어갈 것을 약속합니다.

우리는 모든 앱과 모든 웹사이트에 모델이 완벽하게 통합되는 미래를 구상합니다. GPT-4o mini는 개발자가 강력한 AI 애플리케이션을 보다 효율적이고 저렴하게 빌드하고 확장할 수 있는 길을 열어줍니다. AI의 미래는 더욱 접근 가능하고 신뢰할 수 있으며 일상적인 디지털 경험에 내재화되고 있으며, 우리는 계속해서 선두를 달릴 수 있어 기쁩니다.

■ 유튜브 홍보 영상

https://youtu.be/gegV6lZLeEg?si=cOlV3k_PkP3-zLNg

※출처: GPT-4o mini: advancing cost-efficient intelligence