Google의 ‘Gemma’ AI는 무엇이며 Gemini와 어떻게 다른가요?
Google은 지난 몇 주 동안 AI 열차를 열심히 타고 있었습니다. 먼저 회사는 Gemini Advanced 및 1.5 Pro 모델을 출시했으며 이제 거대 기술 기업이 Gemma AI와 함께 여기에 있습니다.
Gemma는 주력 Gemini 모델을 기반으로 하는 경량 오픈 소스 AI 모델 제품군입니다. Gemini를 만드는 데 사용된 최첨단 모델을 만드는 데에도 동일한 기술과 연구가 사용되었습니다. 젬마는 쌍둥이자리의 동생이라고 생각할 수 있습니다.
젬마는 무엇입니까?
개발자를 위해 설계된 Gemma는 Gemini가 요구하는 광범위한 컴퓨팅 리소스 없이도 다양한 유형의 소비자 하드웨어(노트북, 클라우드 환경 또는 표준 워크스테이션)에서 실행할 수 있으므로 일상적인 AI 개발자에게 AI 기능을 제공하는 데 중점을 둡니다.
크기:
Gemma는 현재 2B와 7B(매개변수)의 두 가지 크기로 제공되며 각 모델에는 기본(사전 학습) 및 명령 조정의 두 가지 변형이 있습니다.
Google은 사전 학습된 모델을 안전하고 신뢰할 수 있게 만들기 위해 학습 세트에서 개인 정보 및 기타 민감한 데이터를 필터링했습니다.
지침 조정 모델의 경우, 회사는 인간 피드백(RLHF)을 통한 광범위한 미세 조정 및 강화 학습을 사용하여 모델이 책임 있는 행동에 부합하도록 만들었습니다.
젬마에 접근하기:
Gemma는 HuggingFace, Kaggle, NVIDIA NeMo, MaxText 등 널리 사용되는 도구와 통합되어 있어 쉽게 시작할 수 있습니다. Vertex AI 및 Google Kubernetes Engine(GKE)을 통해 Google Cloud에 배포하는 것도 쉽습니다.
또한 NVIDIA GPU 및 Google Cloud TPU와 같은 AI 하드웨어 플랫폼에 최적화되었습니다.
유효성:
전 세계적으로 사용 가능한 Gemma 모델은 현재 영어로만 작동하며 Google은 향후 확장을 희망하고 있습니다. 또한 크기가 작기 때문에 질문 답변, 요약, 추론과 같은 언어 관련 작업에 가장 적합합니다.
개발자는 요약 또는 RAG(검색 증강 생성)와 같은 작업을 위한 애플리케이션에 맞게 Gemma 모델을 미세 조정할 수 있습니다.
오픈 소스 모델에 가드레일을 설치하는 것이 더 어렵기 때문에 Gemma 모델에는 책임감 있는 AI 툴킷이 함께 제공되어 개발자가 Gemma를 사용할 때 자체 지침을 만들 수 있습니다.
젬마 대 쌍둥이자리
Gemini는 웹 앱 , Android 앱 또는 iOS의 Google 앱을 통해 최종 고객에게 제공됩니다 . 그러나 Gemma 모델은 개발자만을 위해 설계되었습니다.
개발자는 API 또는 Vertex AI를 통해 Gemini에 액세스하여 폐쇄형 모델로 만들 수 있습니다. 이에 비해 Gemma는 개발자, 연구원 및 기업이 실험하고 자체 애플리케이션에 통합하기 위해 쉽게 사용할 수 있는 오픈 소스 모델입니다.
Gemini 모델도 규모가 커서 전문적인 데이터 센터 하드웨어가 필요한 경우가 많습니다. Gemma는 더 작기 때문에 휴대성이 뛰어나고 비용 효율적으로 실행할 수 있습니다.
둘 다 미세 조정할 수 있지만 Gemma는 사용자 정의를 염두에 두고 제작되었습니다. 개발자는 특정 유형의 데이터를 사용하거나 특수 작업을 수행하기 위해 Gemma 모델을 보다 쉽게 적용할 수 있습니다.
Gemma 모델, 특히 Gemma 7B는 벤치마크 테스트에서 Llama 2 7B 또는 Mistral 7B와 같은 다른 유사한 LLM 모델과 비슷한 성능을 보였습니다. Gemma는 고급 AI 모델의 접근성과 적응성을 높이기 위한 Google의 노력을 나타냅니다. 또한 회사는 Gemma 제품군을 확장하면서 앞으로 더 많은 변형을 출시할 계획입니다.
답글 남기기