본문 바로가기
IT와 AI 인공지능

구글, 최첨단 AI 모델 제미나이(Gemini) 1.0 출시, 챗봇 바드(Bard)가 더욱 좋아집니다.

by 새콤달콤심쿵 2023. 12. 7.
반응형

최첨단 AI 모델 제미나이(Gemini) 출시

구글(Google)이 인공지능(AI) 분야에서 새로운 혁신을 이끌어낼 최첨단 AI 모델 제미나이(Gemini)를 공식적으로 발표했습니다. 제미나이(Gemini)는 구글의 연구팀이 개발한 다중 모달(Multimodal) AI 모델로, 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 처리하고 생성할 수 있는 능력을 갖추고 있습니다. 

구글, 최첨단 AI 모델 제미나이(Gemini) 1.0 출시
구글, 최첨단 AI 모델 제미나이(Gemini) 1.0 출시


제미나이(Gemini)는 구글의 대표적인 AI 프로젝트인 구글 딥마인드(Google DeepMind), 구글 브레인(Google Brain)과 구글 리서치(Google Research)의 공동 연구로 탄생했고 제미나이의 핵심 기술은 트랜스포머(Transformer)라는 딥러닝 아키텍처에 기반하며 트랜스포머는 자연어 처리(Natural Language Processing) 분야에서 큰 성과를 낸 바잔(BERT), GPT-3 등의 유명한 AI 모델들도 사용하는 기술입니다.    

 

제미나이(Gemini) 1.0의 주요특징

제미나이(Gemini)는 다양한 형태의 데이터를 처리할 수 있도록 트랜스포머를 발전시켰습니다. 예를 들어, 제미나이는 이미지로 답변하는 텍스트 질문이나, 이미지에 대한 텍스트 설명을 작성하는 기능을 가지고 있습니다. 또한, 제미나이는 음악, 영화, 게임 등의 콘텐츠를 생성하고 분석할 수 있는 오디오와 비디오 데이터도 활용할 수 있습니다.   

제미나이(Gemini)는 바드와 검색을 더욱 편하게 제공됩니다.
제미나이(Gemini)는 바드와 검색을 더욱 편하게 제공됩니다.

구글은 제미나이를 오픈소스로 공개할 계획이며, 이를 통해 다른 연구자들과 개발자들이 제미나이를 활용하고 발전시킬 수 있도록 할 것이라고 말했다. 또한, 구글은 제미나이를 구글 바드(Google Bard) 구글 클라우드(Google Cloud)와 구글 어시스턴트(Google Assistant) 등의 자사 서비스에도 적용할 예정이다. 

 

제미나이(Gemini)의 다양한 최적화 

제미나이는 구글이 지금까지 만든 AI 모델 중에서도 가장 유연하며, 데이터센터부터 모바일 기기까지 모든 환경에서 효율적으로 활용될 수 있는 설계로 구현되었습니다. 이 모델은 다양한 작업에 대한 최상위 성능을 자랑하며, 세 가지 다른 크기의 버전으로 최적화되어 있습니다. 

1. 제미나이 울트라(Gemini Ultra): 매우 복잡한 작업에 적합한 가장 유용하고 규모가 큰 모델
2. 제미나이 프로(Gemini Pro): 다양한 작업에서 확장하기에 가장 적합한 모델
3. 제미나이 나노(Gemini Nano): 온 디바이스 작업에 가장 효율적인 모델 

 

제미나이(Gemini) 최첨단 성능 

구글의 제미나이 울트라는 다양한 작업에서 뛰어난 성능을 보여줍니다. 이 모델은 자연스러운 이미지, 음성, 영상을 이해하고 수학적 추론을 할 수 있습니다. 32개의 벤치마크 중 30개에서 최신 기술을 앞서고, 57개의 주제를 다루는 MMLU 테스트에서 전문가보다 높은 점수를 얻었습니다. 또한, 멀티모달 작업으로 구성된 MMMU 벤치마크에서도 최고의 성능을 보였습니다. 제미나이 울트라는 OCR 시스템 없이도 이미지에서 문자를 인식할 수 있으며, 멀티모달 추론 능력이 탁월합니다.  

제미나이는 다양한 멀티모달 벤치마크에서 최첨단 성능을 능가하는 성능을 발휘합니다.
제미나이는 다양한 멀티모달 벤치마크에서 최첨단 성능을 능가하는 성능을 발휘합니다.

 

제미나이(Gemini) 차세대 기능 

제미나이(Gemini)1.0은 텍스트, 이미지, 오디오와 같은 다른 유형의 데이터를 통합적으로 학습하고 분석할 수 있어 학습한 데이터를 결합하고 보완하여 더 정교하고 다양한 지식을 생성할 수 있습니다.   

제미나이: 수학과 물리학의 추론 설명

 

대규모의 사전 학습 데이터와 멀티모달 데이터를 활용하여 미세 조정을 통해 성능을 향상시켜 이미지 설명, 이미지 검색, 음성 인식, 자연어 처리 등의 작업에서 우수한 결과를 보여주었습니다. 또한 수학이나 물리학과 같은 어려운 주제에 대해서도 정확하고 깊이 있는 답변을 제공합니다.   

정교한 추론

제미나이 1.0의 정교한 멀티모달 추론 기능은 복잡한 형태의 텍스트 및 시각적 정보를 이해하는 데 도움이 됩니다. 따라서 방대한 양의 데이터 속에서 식별하기 어려운 지식을 발견하는 데 뛰어난 능력을 발휘합니다.

제미나이: 과학 문헌의 통찰력 확보

 

정보를 읽고, 필터링하고, 이해하여 수십만 개의 문서에서 인사이트를 추출하는 이 엄청난 능력은 과학에서 금융에 이르기까지 다양한 분야에서 새로운 혁신을 놀라운 속도로 이끌어내는 데 도움이 될 것입니다.

 

강화된 코딩

제미나이(Gemini)1.0은 여러 프로그래밍 언어(파이썬, 자바, C++, Go 등)로 쓰인 코드를 제안하는 강력한 AI 모델로 다른 언어 간에도 쉽게 전환하고, 코드의 의미와 목적을 파악할 수 있어 코딩 벤치마크에서 최고의 성능을 보여주며, 코딩의 실력을 높일 수 있는 알고리즘을 제공합니다.  

제미나이: 경쟁력 있는 프로그래밍에 탁월함

 

코딩 문제 해결에 뛰어난 제미나이 울트라는 HumanEval과 Natural2Code 같은 테스트에서 높은 점수를 받았습니다. 

알파코드 2는 제미나이를 기반으로 한 더욱 발전된 버전으로, 복잡한 수학과 이론적 컴퓨터 과학을 포함하는 문제도 해결할 수 있어 알파코드 2는 기존 알파코드보다 2배 이상 많은 문제를 풀고, 경쟁 제품보다 85% 더 좋은 성능을 보입니다. 프로그래머가 알파코드 2에게 코드의 특성을 지정하면 더욱 정교한 코드를 생성할 수 있습니다. 

안정성, 확장성, 효율성 향상 

구글은 자체 설계한 텐서 프로세싱 유닛 (Tensor Processing Unit: TPU) v4 및 v5e를 사용하여 AI 최적화 인프라에서 대규모로 제미나이 학습을 진행했습니다. 제미나이는 학습 단계부터 가장 안정적이고 확장성이 뛰어나며, 가장 효율적인 모델로 설계되었습니다. 

구글 데이터센터 내 위치한 클라우드 TPU v5p AI 액셀러레이터의 모습
구글 데이터센터 내 위치한 클라우드 TPU v5p AI 액셀러레이터의 모습

 

구글은 최첨단 AI 모델 학습을 위한 Cloud TPU v5p를 발표하여 Gemini의 성능을 높이고 개발자와 기업이 효율적으로 대규모 생성 AI 모델을 교육할 수 있게 지원합니다.

 

Bard Advanced의 미래

- 다중 모드 기능: 구글(Google)은 내년에 Bard Advanced를 출시할 예정이며, Gemini Ultra를 기반으로 한 이 모델은 텍스트 외에도 이미지, 오디오, 비디오를 처리할 수 있는 다중 모드 기능을 제공합니다.
- 상호 작용 강화: 제미나이(Gemini)의 강력한 다중 모드 기능은 텍스트 이외의 상호 작용에서 빛을 발하고 있습니다. 이는 새로운 차원의 통합과 추론을 가능케 합니다.

 

제미나이(Gemini)의 출시 및 활용

- 제미나이 출시 계획 : 제미나이 프로가 적용된 바드(Bard)는 170개 이상의 영어로 전 세계에 서비스를 제공합니다. 이 서비스는 곧 다른 언어(한국어는 추후 출시 예정)와 지역에도 확장될 예정입니다. 
- 구글 픽셀 스마트폰에 탑재: 구글 픽셀 8 프로 스마트폰에는 제미나이 나노가 탑재되어 녹음 앱에서 요약을 만들어주는 등의 혁신적인 기능을 가능하게 됩니다. 제미나이 나노는 Gboard의 스마트 답장과 다른 메시징 앱에서도 사용할 수 있게됩니다.
- 다양한 제품 및 서비스에서의 제미나이 활용: 구글 검색, 광고, 크롬, 듀엣 AI 등 다른 구글 제품 및 서비스에서도 제미나이를 이용할 수 있습니다.

- 제미나이를 활용한 앱 개발: 오는 12월3일부터 개발자와 기업 고객은 Google AI Studio 또는 Vertex AI에서 제미나이 프로를 사용할 수 있습니다. Google AI Studio는 웹 기반 개발자 도구로, 앱을 쉽게 만들고 출시할 수 있습니다.  
- AICore를 활용한 안드로이드 개발: 안드로이드 개발자는 AICore를 사용하여 제미나이 나노를 활용한 온 디바이스 작업을 할 수 있습니다. AICore는 안드로이드 14의 새로운 기능으로, 사전 체험을 통해 사용할 수 있습니다.  

 

자주 묻는 질문

1. Bard Advanced는 어떻게 ChatGPT와 비교될까요? 
Bard Advanced는 Gemini Ultra를 기반으로 하여 텍스트 외에도 이미지, 오디오, 비디오를 처리할 수 있는 강력한 다중 모드 기능을 제공합니다. 이는 ChatGPT와의 경쟁에서 높은 수준의 성능을 보여줄 것으로 예상됩니다.

 

2. 재미나이(Gemini) Pro, Ultra, Nano 중 어떤 모델을 선택해야 할까요?
모델 선택은 사용자의 용도와 성능 요구에 따라 다를 수 있습니다. Pro는 중간 지점에서 균형을 제공하며, Ultra는 가장 뛰어난 성능을, Nano는 작고 빠른 작업에 적합한 모델입니다.

 

3. Bard의 업그레이드로 어떤 변화가 있었나요?
재미니아(Gemini)모델의 도입으로 바드(Bard)는 사용자 경험에서 현저한 향상을 이루었습니다. 요약, 브레인스토밍, 글쓰기 등 다양한 작업에서 더 나은 성능을 제공하고 있습니다.

 

4. 재미나이(Gemini)의 다중 모드 기능은 어떤 상황에서 빛을 발하나요?
재미나이(Gemini)의 다중 모드 기능은 주로 텍스트 이외의 상호 작용에서 빛을 발하며, 이미지, 오디오, 비디오 처리 등 다양한 기능을 수행할 수 있습니다.

 

5. Bard Advanced의 출시일은 언제인가요?
구글(Google)은 내년에 Bard Advanced의 미리보기를 계획하고 있으며, Gemini Ultra를 기반으로 한 이 모델은 기존 Bard의 성능을 한 단계 높일 것으로 예상됩니다.

 

결론

구글은 '제미나이(Gemini)'라는 이름으로 AI 기술을 혁신적으로 업그레이드했습니다. 이 기술은 기존의 AI 챗봇들과 비교할 수 없을 정도로 뛰어난 성능을 발휘하게 됐습니다. 오픈AI의 GPT, MS의 코파일럿 빙챗(Bing Chat)과 같은 선두업체들의 AI 서비스에도 제미나이(Gemini)는 뒤지지 않습니다. 제미나이(Gemini)는 인간 전문가보다 더 정확하고 창의적인 답변을 제공한다고 해외에서 호평받고 있습니다. 

 

바드(Bard)에서는 제미나이(Gemini)가 사용자의 요청에 따라 시, 노래, 이야기 등을 자동으로 생성해주고 구글 인스턴스에서는 제미나이(Gemini)가 사용자의 코드, 에세이, 요약 등을 개선하거나 최적화해줄 것입니다. 

 

반응형