Gemma 3는 10억, 40억, 120억, 270억 개의 매개변수를 포함한 4가지 변형으로 출시되었습니다. Google에 따르면, 이는 대규모 컴퓨터 클러스터가 필요하지 않고 단일 GPU나 TPU에서 실행할 수 있는 세계 최고의 단일 속도 모델입니다.

이론상, 이를 통해 Gemma 3는 Pixel 휴대폰의 Tensor Processing Unit(TPU)에서 직접 실행될 수 있는데, 이는 Gemini Nano 모델이 모바일 기기에서 로컬로 실행되는 방식과 유사합니다.

제미니 AI 모델 시리즈와 비교했을 때, Gemma 3의 가장 큰 장점은 오픈 소스라는 점입니다. 덕분에 개발자는 모바일 애플리케이션과 데스크톱 소프트웨어에서 필요에 따라 쉽게 사용자 정의, 패키징, 배포할 수 있습니다. 또한 Gemma는 140개 이상의 언어를 지원하며, 그 중 35개 언어는 이미 교육 패키지로 제공됩니다.

ad13e24ffc15c60fc50aa51c6fff5038.jpeg
Gemma 3(270억 개의 매개변수 버전)의 성능을 다른 AI 모델과 비교합니다. 사진: 구글

최신 Gemini 2.0 모델과 유사하게 Gemma 3는 텍스트, 이미지, 비디오를 처리할 수 있습니다. 성능 측면에서 Gemma 3는 DeepSeek V3, OpenAI o3-mini, Meta의 Llama-405B 변형을 포함한 다른 여러 인기 있는 오픈소스 AI 모델보다 우수한 성능을 보입니다.

200페이지 분량의 책에 해당하는 맥락

Gemma 3는 최대 128,000개 토큰의 컨텍스트 창을 지원하는 데, 이는 200페이지짜리 책의 데이터 양과 같습니다. 비교를 위해, Gemini 2.0 Flash Lite 모델은 최대 100만 개의 토큰에 대한 컨텍스트 창을 갖습니다.

79f4765176ea9c0652ae7c685e0c1e21.jpeg
Gemma 3(270억 개의 매개변수 버전)의 성능을 다른 AI 모델과 비교합니다. 사진: 구글

Gemma 3는 외부 데이터 세트와 상호 작용하고 자동화된 에이전트 역할을 할 수 있습니다. 이는 Gemini가 Gmail이나 Docs와 같은 플랫폼 간 작업을 원활하게 지원하는 방식과 유사합니다.

Google의 최신 오픈소스 AI 모델은 로컬에 배포하거나 Vertex AI와 같은 회사의 클라우드 서비스를 통해 배포할 수 있습니다. Gemma 3는 현재 Google AI Studio에서 사용할 수 있으며, Hugging Face, Ollama, Kaggle과 같은 타사 플랫폼에서도 사용할 수 있습니다.

Google의 3세대 오픈소스 모델은 기업이 대규모 언어 모델(LLM)과 소규모 언어 모델(SLM)을 동시에 개발하는 업계 추세에 따른 것입니다. 구글의 경쟁사인 마이크로소프트 또한 오픈소스 Phi 계열의 소규모 언어 모델을 통해 비슷한 전략을 추구하고 있습니다.

Gemma와 Phi와 같은 소규모 언어 모델은 리소스 효율성이 높은 것으로 평가되어 스마트폰과 같은 기기에서 실행하는 데 이상적입니다. 또한 대기 시간이 짧기 때문에 모바일 애플리케이션에 특히 적합합니다.

미국 법무부: 구글, 크롬 브라우저와 영원히 '작별 인사'해야 검색 대기업 구글은 크롬 브라우저를 매각해야 하겠지만, 인공지능 스타트업에 투자하는 것은 여전히 ​​허용된다.