챗GPT 이미지 2.0 "즐기는 AI 이미지에서 업무용 이미지로" - 디일렉

[AI] 오픈ai | | 💰 할인
#ai 모델 #ai 구독 #chatgpt #chatgpt pro #discount #openai #오픈ai #이용권 종료 #초특가 #초특가 할인 #카카오 선물하기 #혼란
원문 출처: [AI] 오픈ai · Genesis Park에서 요약 및 분석

요약

카카오 선물하기에서 2만9천원에 판매된 ChatGPT Pro 이용권이 3일 만에 판매 중단되어 소비자들 사이에서 혼란이 일고 있습니다. 이는 정상 구독료보다 훨씬 저렴한 초특가 혜택이었기 때문에 더 큰 화제를 모았던 것으로 파악됩니다. 그러나 짧은 기간 만에 서비스가 종료되면서 정당한 환불 절차나 대안 마련에 대한 구체적 후속 조치가 시급한 상황입니다.

본문

오픈AI의 이미지 생성 AI 툴 '챗GPT 이미지 2.0(ChatGPT Images 2.0)'가 공개됐다. 오픈AI에 따르면 사용자의 세부 지시를 정밀하게 반영해 활용도 높은 결과를 제공하는데, 해외 매체들은 멀티모달의 강자 구글에 한발 바짝 다가섰다고 평가하고 있다. 오픈AI는 챗GPT 이미지 2.0이 이미지 내 사물의 위치와 관계를 정교하게 구성하며 작은 글자, 아이콘, UI 요소, 촘촘한 레이아웃, 스타일 제약 등 고난도 영역에서도 향상된 결과를 제공한다고 소개하고 있다. 또한 다양한 화면 비율(최대 3:1~1:3)을 지원하고, 사진·만화·영화 등 여러 스타일을 정밀하게 재현할 수 있다. 해외 매체들의 평가를 종합해 보면 오픈AI가 강조하고 있는 '사고(Thinking) 기능', 바로 실사용 가능한 수준의 완성도 높은 결과물에 대해 호평하고 있다. 오픈AI는 이번 모델이 자사 최초의 '챗GPT 이미지 사고(thinking)' 기반 모델이라고 소개하고 있다. 사고(Thinking) 기능은 이전 모델과의 가장 큰 차이점 중 하나로, 프롬프트가 주어지면 이미지를 즉시 생성하는 게 아니라 프롬프트를 분석하고 어떻게 구성할지 자체적으로 계획한 뒤 이미지를 출력한다. 챗GPT에서 'thinking' 또는 'pro' 모델을 선택하면 해당 모드로 이미지를 만들어내는데, 웹 검색을 통한 정보 탐색, 하나의 프롬프트 기반 복수 이미지 생성, 결과 점검까지 일련의 결정을 반영한 결과물을 도출해내는 기능이다. 해외 매체 테크크런치는 "웹 검색·다중 이미지 생성·자체 검증 기능 등 Thinking 기능이 마케팅 자산이나 멀티패널 만화 제작을 가능하게 한다"고 소개했다. 이런 평가는 벤처비트도 마찬가지로, 벤처비트는 "지도, 인포그래픽, 슬라이드, 만화까지 거의 완벽하게 생성한다"고 평가하면서 챗GPT 이미지 2.0이 실시간 웹 검색으로 시각적 정확도를 보장하는 기능에 특히 주목했다. 오픈AI는 이 모델을 사용해 기획서, 마케팅 소재, 교육 자료, 인포그래픽, 소셜 콘텐츠 등을 바로 활용 가능한 결과물 형태로 생성할 수 있다고 주장하는데, 해외 매체 톰스 가이드(Tom's Guide)는 "프레젠테이션 슬라이드, SNS 그래픽, 배너, 포스터, 제품 목업을 챗GPT 안에서 바로 만들 수 있으며, 디자이너들이 실제로 사용할 수 있는 첫 번째 버전"이라고 평가했다. 이는 실제 디자인 업무에 사용할 수 있는 제품이다. 기존의 AI 이미지 생성 툴들이 주로 초현실적인 몽환적 풍경을 만드는데 사용되는 것과 차별화된다. 기존 AI 이미지 생성 툴들의 한계로, 텍스트가 깨지거나 저수준의 렌더링, 레이아웃 지시를 제대로 따르지 못하는 등의 문제가 있다. 여기에는 챗GPT 이미지 2.0의 다국어 성능 강화도 기여하고 있다. 오픈AI는 한국어, 일본어, 중국어, 힌디어, 벵골어 등 다양한 언어에서 텍스트 렌더링 품질을 개선했다고 소개하고 있다. 또 최대 10개의 이미지를 한 번에 생성할 수 있어 포스터, 설명 자료, 다이어그램, 만화 등에서 언어를 읽히는 문자로 자연스럽게 구현할 수 있다. 톰스 가이드에 따르면 이러한 기능에 따라 디자이너들이 기존에 피그마(Figma), 포토숍의 기능을 사용해 수행했던 작업도 챗GPT 안에서 끝낼 수 있게 됐다는 것이다. 해외 매체 테크레이더는 "오픈AI의 이미지 생성 능력이 구글의 멀티모달 강점에 근접해가고 있다"며 "챗GPT 이미지가 계속 발전되면 구글이 자사 AI 생태계로 사용자를 끌어들이기 어려워질 것"으로 전망했다. 테크레이더에 따르면 구글 제미나이는 텍스트, 이미지, 컨텍스트를 하나의 시스템으로 연결해 디지털 생태계 전반에 걸쳐 연동함으로써 챗GPT의 이미지보다 앞섰지만, 챗GPT 이미지 2.0가 이러한 격차를 좁혔다는 것이다. 특히 텍스트 기반의 추론 성능이 향상되면서 구글 제미나이가 강점을 보여온 구조화된 멀티모달 작업에 강력한 도전자로 떠오르게 됐다고 평가했다. 다만 디지털 프렌드에 따르면 AI 생성 이미지와 실제로 사용할 수 있는 비주얼 사이의 경계를 좁히고 있다고 평가하면서도 복잡한 레이아웃이나 비영어권 텍스트에서 때때로 불일치되는 현상이 일어난다고 지적했다. 챗GPT 이미지 2.0은 챗GPT와 코덱스에서 사용할 수 있다. 챗GPT 이미지의 Thinking 기의 고급 출력 기능은 챗GPT 플러스, 프로, 비즈니스 사용자에게 제공된다. 동일한 기반 모델인 'gpt-image-2'는 API를 통해 제공된다. 출력 품질과 해상도에 따라 가격이 달라지며, 2K를 초과하는 고해상도 출력은 현재 베타로 제공된다.

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →