오픈AI, 실무용 이미지 생성 '챗GPT 이미지 2.0' 공개 - 전자신문
[AI] 오픈ai
|
|
{'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} AI 모델
#ai 모델
#기타 ai
#비주얼 스위트 2.0
#올인원 플랫폼
#인공지능
#하드웨어/반도체
요약
오픈AI가 실무용 디자인 시안 제작이 가능한 AI 이미지 생성 모델 '챗GPT 이미지 2.0'을 공개하며 구글 중심의 시장 판도 변화에 도전장을 내밀었습니다. 이번 모델은 사용자의 세부 지시를 정밀하게 반영하여 사물 위치, 레이아웃 등 고난도 요소의 정확도를 획기적으로 높였습니다. 또한 다양한 화면 비율과 스타일을 지원해 실무 채택률 확대를 기대하고 있습니다.
왜 중요한가
개발자 관점
사용자의 프롬프트를 정밀하게 해석해 레이아웃과 객체 위치를 제어하는 기능이 대폭 강화되어, 단순한 생성을 넘어 실무 시안 제작에 필요한 기술적 완성도와 정교함을 확보했습니다.
연구자 관점
텍스트 기반 공간 제어(Spatial Control)와 고차원적 시각 의도를 반영하는 모델의 해석력을 획기적으로 높여, 생성형 AI의 추론 및 구도 배치 정확도라는 학술적 과제를 실질적으로 해결한 성과입니다.
비즈니스 관점
디자인 실무 진입장벽을 낮춤으로써 기업의 콘텐츠 제작 비용을 절감하고 프로토타이핑 프로세스를 효율화하여, 구글을 위협하는 B2B 시장의 새로운 수익 모델을 제시하는 전략적 무기입니다.
관련 엔티티
오픈AI
챗GPT 이미지 2.0
구글
본문
오픈AI가 디자인 시안까지 만드는 실무에 활용 가능한 인공지능(AI) 이미지 생성 모델 '챗GPT 이미지 2.0'을 21일(현지시간) 공개했다. 작은 텍스트와 복잡한 레이아웃까지 정밀하게 구현할 수 있는 모델이다. 영어뿐 아니라 한국어 등 다국어 텍스트 구현 정확도가 대폭 개선됐다. 구글이 독주해온 AI 이미지 생성 시장 판도 변화를 이끌어낼지 관심이 쏠린다. 오픈AI 이미지 생성 모델은 출시 이후 줄곧 '제미나이·나노바나나' 등 구글 서비스와 비교됐다. 구글 AI가 사진 같은 수준, 업무 프레젠테이션 자료 수준으로 이미지를 생성해주는 반면, 오픈AI의 이미지 생성 정확도가 떨어졌다. 이번 업데이트로 업무용 시장에서도 챗GPT 이미지 채택률이 늘어날 것이라는 게 오픈AI측 기대다. 2.0 모델은 사용자의 세부 지시를 정밀하게 반영, 기존 대비 보다 활용도 높은 결과를 제공한다. 이미지 내 사물 위치와 관계를 정교하게 구성하고 작은 글자, 아이콘, 사용자환경(UI) 요소, 촘촘한 레이아웃, 스타일 제약 등 고난도 영역에서 향상된 결과를 제공한다. 최대 3대 1~1대3의 화면 비율을 지원하고 사진·만화·영화 등 여러 스타일을 정밀하게 재현, 실제 제작 환경에서 활용범위를 넓혔다. 다국어 성능도 강화했다. 챗GPT 이미지 2.0은 한국어와 일본어, 중국어, 힌디어, 벵골어 등 다양한 언어에서 텍스트 렌더링(이미지 텍스트 출력) 품질을 개선했다. 최대 10개 이미지를 한 번에 생성할 수 있다. 포스터, 설명 자료, 다이어그램, 만화 등에서 언어를 읽히는 문자로 자연스럽게 구현할 수 있다. 전자신문이 챗GPT 플러스 서비스 기준으로 확인한 결과, 동일한 프롬프트로 이미지 생성 명령 시 1.5 버전 대비 2.0 버전 결과물의 정확도가 대폭 개선됐다. 한글 맞춤법의 정확성은 물론, 레이아웃과 구성 등이 깔끔해졌다. 특히 프롬프트를 반복할수록 보다 정확하고 만족스러운 결과물을 얻을 수 있다. 오픈AI는 “챗GPT 이미지 2.0을 기반으로 기획서, 마케팅 소재, 교육 자료, 인포그래픽, 소셜 콘텐츠 등을 바로 활용 가능한 결과물 형태로 생성할 수 있다”고 강조했다. 2.0은 오픈AI 최초 싱킹(사고) 기반 이미지 모델이다. 챗GPT에서 싱킹 또는 프로 모델을 선택하면 웹 검색을 통한 정보 탐색, 하나의 프롬프트 기반 복수 이미지 생성, 결과 점검 기능을 지원한다. 아이디어를 단순 생성하는 데서 나아가 검증된 결과물로 구체화하는 과정으로 연결할 수 있다. 챗GPT 이미지 2.0은 챗GPT와 코덱스에서 사용할 수 있으며 챗GPT 이미지 싱킹 기반 고급 출력 기능은 챗GPT 플러스 이상 사용자에 제공된다. 동일한 기반 모델 'GPT-이미지-2'는 API로 사용할 수 있다. 박종진 기자 [email protected]