구글, 고급 제미니 1.5 시리즈 모델 공개하고 API 가격 50% 인하

2024/09/24

오늘, 구글은 두 가지 향상된 프로덕션 준비 Gemini 1.5 모델을 공개했습니다 : Gemini-1.5-Pro-002와 Gemini-1.5-Flash-002. 이 최신 모델은 5월에 출시된 원래 Gemini 1.5 모델에 비해 점진적인 개선을 제공합니다.

개정된 Gemini 1.5 시리즈 모델은 MMLU-Pro에서 약 7% 증가, MATH 및 HiddenMath 벤치마크에서 약 20% 향상, 비전 및 코딩 시나리오에서 2%~7%의 개선을 달성했습니다. 또한 Google은 모델 응답의 전반적인 유용성을 개선했습니다. 이러한 모델은 이제 더 간결한 형식으로 응답을 생성하며 기본 출력 길이는 이전 모델보다 약 5%~20% 더 짧습니다.

모델 기능이 개선된 것 외에도 Google은 가격에도 주목할 만한 변경을 적용하고 있습니다. 즉, Gemini 1.5 시리즈 모델 API의 비용을 낮추고 있습니다.

입력 토큰이 64% 감소했습니다.
출력 토큰이 52% 감소했습니다.
2024년 10월 1일부터 128K 토큰 미만 프롬프트에 대해 Gemini 1.5 Pro의 증분 캐시 토큰이 64% 감소합니다.

Google은 또한 속도 제한을 높여 개발자가 정교한 AI 애플리케이션을 만들 수 있도록 합니다. Gemini 1.5 Flash 모델의 유료 티어 속도 제한은 이제 2,000RPM이고, Pro 모델의 경우 각각 1,000RPM과 360RPM에서 1,000RPM으로 증가했습니다. 또한 이러한 새로운 모델에서는 대기 시간이 감소하여 개발자에게 두 배 더 빠르고 세 배 더 짧은 대기 시간을 제공하는 것으로 기대됩니다.

업데이트된 Gemini 1.5(-002 모델) 출시와 함께 Google은 안전 프로토콜을 유지하면서 사용자 지침을 준수하는 모델의 기능을 강화했습니다. 기본적으로 Google은 이러한 최신 모델에 AI 콘텐츠 안전 필터를 적용하지 않습니다. 대신 개발자는 특정 요구 사항에 따라 필터를 적용할 수 있습니다.

마지막으로 Google은 “Gemini-1.5-Flash-8B-Exp-0924″로 알려진 Gemini 1.5 모델의 업그레이드 버전을 출시했습니다. 이 실험적 버전은 텍스트 및 멀티모달 애플리케이션에서 성능이 크게 향상되었습니다. 이러한 모든 업데이트된 Gemini 1.5 모델은 이제 Google AI Studio 및 Gemini API를 통해 개발자가 액세스할 수 있습니다. 대규모 기업 및 Google Cloud 고객의 경우 이러한 새롭게 업데이트된 Gemini 1.5 모델은 Vertex AI에서 사용할 수 있습니다.

원천

답글 남기기 응답 취소