Home 전자·IT·통신 Google의 생성 AI 동영상 모델은 비공개 미리보기로 제공됩니다.

Google의 생성 AI 동영상 모델은 비공개 미리보기로 제공됩니다.

36
0


구글이 시작됐다 비공개 액세스 출시 Veo 및 Imagen 3 생성 AI 모델에 적용됩니다. 오늘부터 회사의 Vertex AI Google Cloud 패키지 고객은 다음을 사용할 수 있습니다. 알겠어요 텍스트 프롬프트와 이미지에서 비디오를 생성합니다. 그런 다음 다음 주부터 Google은 동일한 사용자가 사용할 수 있는 최신 텍스트-이미지 프레임워크인 Imagen 3를 만들 예정입니다.

Veo의 출시를 통해 Google은 이미지-비디오 모델을 제공하는 최초의 하이퍼스케일 클라우드 제공업체라고 밝혔습니다. 그런 점에서 OpenAI는 소라 모델은 여전히 ​​일부 예술가, 학자, 연구자에게만 제공되지만 회사에 따라 빠르게 변경될 수 있습니다. 12일간의 제품 데모를 소개합니다 12월 5일부터.

Google Veo 비디오 모델의 예시 영상입니다.

Google은 Veo 모델이 “일관되고 일관적인” 1080p 영상을 생성하고 “1분 이상” 실행할 수 있다고 말합니다. 이 도구는 텍스트 프롬프트와 이미지 모두에 대해 작업할 수도 있습니다. 후자의 경우 AI가 생성한 사진이나 인간이 만든 사진을 비디오의 시작점으로 사용할 수 있습니다.

Google이 공유한 샘플 영상을 보면 모든 AI 모델과 마찬가지로 Veo도 원인과 결과에 어려움을 겪을 수 있다는 것이 분명합니다. 예를 들어, 구운 마시멜로 클립에서 간식은 캠프파이어 불꽃의 열기에 노출되어도 노랗게 변하거나 타지 않습니다. 콘서트 영상에서 손을 자세히 보면 알 수 있듯이 인공물도 문제입니다.

Google Imagen 도구의 출력 예Google Imagen 도구의 출력 예

Google

Imagen 3의 경우 Google은 이 모델이 “세부 사항, 조명 및 아티팩트 감소 측면에서 이전 버전의 Imagen을 능가하는 간단한 텍스트 프롬프트에서 가장 사실적이고 최고 품질의 이미지를 생성”한다고 말합니다. 그러나 여기서도 Google이 해야 할 일이 더 있는지 확인하기 위해 너무 자세히 살펴볼 필요는 없습니다.

자동차 트렁크에 앉아 있는 친구 그룹의 첫 번째 예에서 원래 프롬프트에는 “플래시 사진 촬영”에 대한 언급이 포함되어 있지만 피사체는 분명히 역광을 받고 있습니다. 강렬한 역광을 만들기 위해 플래시가 사용되었다고 주장할 수도 있지만, 그 메시지 뒤에 숨겨진 아이디어가 1960년대 플래시 사진을 대표하는 무언가를 만드는 것이라면 이 이미지는 그렇지 않습니다.

그럼에도 불구하고 Google은 생성 AI를 사용하여 더 많은 기업 고객을 확보하기 위해 노력하고 있습니다. 자체 연구 인용거대 기술 기업인 IBM은 생산에 생성 AI를 사용하는 기업 중 86%가 수익 증가를 보고했다고 밝혔습니다. 그러나 최근 Appen 조사 AI 프로젝트의 투자수익률은 2023년부터 2024년까지 4.6%포인트 감소한 것으로 나타났습니다.

본 글의 링크를 통해 상품을 구매하시면 커미션을 받으실 수 있습니다.



Source link