외계어 남발하던 멍청한 AI는 잊어라! 구글, 나노바나나 프로 정식 공개
본문

(ⓒ 유튜브 Google DeepMind )
구글이 텍스트 구현 능력과 이미지의 디테일을 획기적으로 높인 최신 AI 이미지 생성 모델 '나노 바나나 프로(Nano Banana Pro)'를 21일 공식 공개했다.
이번 모델은 구글의 최신 대규모언어모델(LLM)인 '제미나이 3 프로(Gemini 3 Pro)'를 기반으로 개발되어, 그동안 생성형 AI의 고질적인 약점으로 꼽히던 텍스트 뭉개짐 현상과 캐릭터 일관성 문제를 해결하는 데 방점을 뒀다.

(ⓒ 유튜브 Google DeepMind )
간판 글씨도 완벽하게
'나노 바나나 프로'의 가장 큰 특징은 향상된 텍스트 렌더링(Text Rendering) 능력이다. 기존 이미지 생성 AI들은 "카페 간판에 'Coffee'라고 써줘"라고 명령하면 철자를 틀리거나 외계어처럼 뭉개진 형태를 보여주는 경우가 많았다.
하지만 나노 바나나 프로는 프롬프트(명령어)에 입력된 텍스트를 정확하게 이미지 내에 구현한다. 네온사인, 칠판 글씨, 제품 로고 등 다양한 스타일의 텍스트를 자연스럽게 합성할 수 있어, 디자이너들이 포스터나 홍보물을 제작할 때 별도의 후보정 작업을 거치지 않아도 될 수준으로 진화했다는 평이다.
주인공 얼굴 안 바뀐다
웹툰이나 스토리보드 작가들이 주목할 만한 기능도 추가됐다. 사용자가 참조할 이미지를 업로드하면, 생성되는 결과물에서 해당 인물의 얼굴이나 특정 사물의 특징을 그대로 유지해주는 기능이다.
기존 모델은 컷마다 인물의 생김새가 미묘하게 달라져 연속적인 스토리텔링에 활용하기 어려웠으나, 나노 바나나 프로는 최대 14장의 참조 이미지를 인식해 캐릭터의 정체성을 유지한다. 이를 통해 사용자는 동일한 캐릭터가 다양한 장소에서 다른 행동을 하는 장면을 연속적으로 생성할 수 있게 됐다.
가짜 이미지 식별하는 '신스ID' 탑재
고도화된 AI 이미지의 악용을 막기 위한 안전장치도 마련됐다. 구글은 딥마인드가 개발한 디지털 워터마크 기술인 '신스ID(SynthID)'를 나노 바나나 프로에 기본 탑재했다.
신스ID는 사람의 눈에는 보이지 않지만, 전용 소프트웨어로는 식별 가능한 코드를 이미지 픽셀(화소) 사이에 심는 기술이다. 이미지를 캡처하거나 잘라내도 워터마크가 유지되어, 해당 이미지가 AI로 생성되었음을 명확히 구분할 수 있다. 이를 통해 딥페이크나 가짜 뉴스 유포 등의 부작용을 최소화한다는 방침이다.
제미나이(Gemini)와의 결합으로 접근성 강화
나노 바나나 프로는 구글의 AI 챗봇 '제미나이' 유료 구독 모델(Gemini Advanced)을 통해 우선 제공된다. 사용자는 복잡한 전문 용어 대신 일상적인 대화체로 명령을 내려도 제미나이가 의도를 파악해 최적의 이미지를 생성해준다.
구글 관계자는 "나노 바나나 프로는 단순한 이미지 생성을 넘어 텍스트와 비주얼이 완벽하게 조화되는 경험을 제공할 것"이라며 "창작자들의 작업 시간을 획기적으로 단축시킬 수 있는 도구"라고 강조했다.
- 이전글'기업가치 10조원' 음성 AI 유니콘 일레븐랩스, 한국 상륙... "아시아 AI 음성 허브로 키운다" 25.11.21
- 다음글AI 겸임교수 이종범 - 현존 최강 AI 구글 제미나이 3.0 ... 비개발자도 코딩하는 '안티 그래비티' 혁신 25.11.21
등록된 댓글이 없습니다.
