구글, 가장 강력한 AI 모델 ‘제미니’ 출시

0
227

수요일, 구글은 오픈AI(OpenAI), 마이크로소프트(Microsoft), 메타(Meta) 제품과 경쟁하기 위해 새로운 멀티모달 일반 AI(인공지능) 모델인 제미니(Gemini)를 출시했다.

구글, 가장 강력한 AI 모델 ‘제미니’ 출시

구글, 제미니 출시

검색 대기업에 따르면 Gemini는 회사가 구축한 ‘가장 크고 유능한’ 대형 언어 모델(LLM)이며, 여러 주요 벤치마크에서 최첨단 성능을 발휘합니다.

Google DeepMind AI 유닛에서 개발한 이 유연한 AI 모델은 Google의 TPU(Tensor Process Unit)에서 훈련되어 이전의 작고 성능이 떨어지는 모델보다 훨씬 빠르게 실행됩니다. 텍스트, 코드, 오디오, 이미지 및 비디오를 포함한 다양한 유형의 정보를 일반화하고 원활하게 이해하고, 작동하고, 결합할 수 있습니다.

Google은 첫 번째 버전인 Gemini 1.0을 세 가지 크기로 제공합니다. 매우 복잡한 작업을 위한 가장 크고 성능이 뛰어난 모델인 Gemini Ultra; 광범위한 작업에 걸쳐 확장할 수 있는 최고의 모델인 Gemini Pro; 기기 내 작업을 위한 가장 효율적인 모델인 Gemini Nano가 있습니다.

“이것은 쌍둥이 자리 시대의 첫 번째 모델이자 올해 초 Google DeepMind를 설립했을 때 가졌던 비전의 첫 실현입니다. 이 새로운 모델 시대는 우리가 회사로서 수행해 온 가장 큰 과학 및 엔지니어링 노력 중 하나를 나타냅니다.” Google 및 Alphabet의 CEO인 Sundar Pichai는 이번 발표에 대한 블로그 게시물의 메모에서 말했습니다.

Google DeepMind에 따르면 Gemini Ultra는 이미지 이해나 수학적 추론과 같은 기능을 측정하는 널리 사용되는 학술 벤치마크 테스트 32개 중 30개에서 GPT-4보다 성능이 뛰어납니다.

특히, 구글은 수학, 물리학, 역사, 법학, 의학, 윤리 등 57개 과목을 조합해 세계 지식과 문제를 모두 테스트하는 MMLU(대규모 다중 작업 언어 이해)에서 Gemini Ultra의 점수가 90%라고 밝혔습니다. 해결 능력을 통해 해당 벤치마크에서 인간 전문가를 능가하는 최초의 AI 모델이 되었습니다.

또한 Google은 Gemini Ultra가 의도적인 추론이 필요한 다양한 도메인에 걸친 다중 모드 작업으로 구성된 새로운 MMMU 벤치마크에서 59.4%를 기록했다고 밝혔습니다. 추가 처리를 위해 이미지에서 텍스트를 추출하는 OCR(광학 문자 인식) 시스템의 지원 없이도 이미지 벤치마크에서 이전 모델보다 성능이 뛰어났습니다.

Gemini AI의 가용성

Google은 이제 Pro 버전을 Bard 챗봇에서 사용할 수 있으며 170개 이상의 국가 및 지역에서 영어로 사용할 수 있으며 곧 다양한 방식으로 확장하고 새로운 언어 및 위치를 지원할 계획이라고 밝혔습니다. 12월 13일부터 개발자와 기업 고객은 Google AI Studio 또는 Google Cloud Vertex AI의 Gemini API를 통해 Gemini Pro에 액세스할 수 있습니다.

또한 Google은 Pixel 8 Pro 스마트폰에 Gemini Nano를 탑재하고 있으며 앞으로 몇 달 내에 검색, 광고, Chrome 및 기타 서비스에 Gemini를 통합할 계획입니다. 또한 Android 개발자는 Pixel 8 Pro 기기부터 Android 14에서 사용할 수 있는 새로운 시스템 기능인 AICore를 통해 Gemini Nano에 액세스할 수 있습니다. 초기 미리보기 기준.

마지막으로 Google은 2024년 초부터 Bard Advanced를 통해 AI 모델의 가장 발전된 버전인 Gemini Ultra를 출시할 계획입니다. “초기 실험 및 피드백을 위해” 고객, 개발자, 파트너, 안전 및 책임 전문가를 선정하여 사용할 수 있습니다. 내년 초에 개발자와 기업 고객에게 출시되기 전에 말이죠.