뉴스피드 큐레이션 SNS 대시보드 저널

"디테일 보소" 챗GPT 이미지 2.0, 군중 묘사 압승…나노 바나나·오푸스 다 밀렸다 - 디지털투데이

[AI] AI 이미지 생성 | | 🔬 연구
#ai 모델 #appsumo #네트워킹 #런칭 #머신러닝/연구 #명함 #스타트업 #프로덕트런치

요약

명함 교환 시 정보 입력의 번거로움과 리드 확보의 어려움을 해결하기 위해 개발된 디지털 명함 솔루션 'Wisery'가 AppSumo에 출시되었습니다. 이 서비스는 별도의 앱 설치 없이 애플과 구글 지갑에 연동되며, QR코드나 링크를 통해 원하는 디자인으로 브랜딩된 명함을 공유할 수 있습니다. 특히 방문자가 원터치로 자신의 정보를 보내면 자동으로 대시보드에 저장되고 CRM으로 내보내기가 가능한 양방향 리드 수집 기능을 핵심적으로 제공합니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

[디지털투데이 홍진주 기자] 오픈AI가 새로운 이미지 생성 기능 '챗GPT 이미지 2.0'(ChatGPT Images 2.0)을 공개한 가운데, 복잡한 군중 일러스트 생성 능력을 비교한 실험에서 경쟁 모델 대비 우수한 완성도를 보였다는 평가가 나왔다. 22일(현지시간) 온라인 매체 기가진에 따르면, 소프트웨어 엔지니어 사이먼 윌리슨(Simon Willison)은 여러 이미지 생성 AI를 대상으로 '월리를 찾아라'(Where's Wally?) 스타일의 그림을 생성하는 실험을 진행했다. 프롬프트는 '군중 속에서 아마추어 무전기를 들고 있는 너구리를 찾아야 하는 장면'을 구현하는 것이었다. 단순한 그림 생성이 아니라, 다수의 인물과 요소 속에 특정 대상을 자연스럽게 숨길 수 있는지를 검증하는 데 초점이 맞춰졌다. 먼저 오픈AI의 기존 모델인 'gpt-image-1'은 전반적인 분위기에서는 원작 스타일을 일부 재현했지만, 세부 묘사에서 한계를 드러냈다. 인물의 얼굴이나 신체 표현이 뭉개지거나 왜곡되는 현상이 나타났고, 핵심 조건인 '무전기를 든 너구리' 역시 명확하게 식별되지 않았다. 실제로 이미지를 자세히 살펴도 해당 대상을 찾기 어려웠다는 평가가 나왔다. 앤트로픽의 클로드 오푸스 4.7(Opus 4.7)도 이미지 분석에 활용됐지만, 결과는 크게 다르지 않았다. 모델은 너구리가 포함됐을 가능성은 언급했지만, 구체적으로 무전기를 들고 있는 개체를 명확히 식별하지 못했다. 이는 단순 생성뿐 아니라 생성 결과의 해석 가능성 측면에서도 한계를 보여준 사례로 지적됐다. 구글 계열 모델들도 비슷한 문제를 보였다. 제미나이 기반 '나노 바나나2'(Nano Banana 2)는 화면 중앙에 '아마추어 무선 클럽' 부스를 배치하고 그 안에 너구리를 등장시켰지만, 군중 속에 자연스럽게 숨기는 데는 실패했다. '나노 바나나 프로'(Nano Banana Pro)는 아예 줄무늬 옷을 입은 큰 너구리를 중앙에 배치해, 숨은그림 찾기보다는 주인공을 강조하는 방식으로 결과를 출력했다. 반면 챗GPT 2.0은 차별화된 결과를 보여줬다. 3840×2160 해상도로 생성된 이미지에서 해당 모델은 아마추어 무전기를 든 너구리를 화면 왼쪽 하단 구석에 자연스럽게 배치했다. 주변 인물과의 크기 비율도 과도하지 않았고, 군중 장면의 맥락을 해치지 않으면서도 실제로 찾아낼 수 있는 수준의 숨김을 구현했다는 평가다. 윌리슨은 이 결과에 대해 "다른 이미지 생성 AI와 비교하면 상당히 높은 완성도"라고 평가하며, 현 시점에서 챗GPT 이미지 2.0이 경쟁 모델을 앞서는 모습을 보였다고 분석했다. 그는 '월리를 찾아라'와 같은 복잡한 구성의 이미지는 모델 성능을 시험하기 위한 다소 까다로운 방식이지만, 텍스트 지시를 얼마나 정교하게 시각적 구조로 옮길 수 있는지를 확인하는 데 유용하다고 덧붙였다. 비용 정보도 함께 공개됐다. 해당 이미지 1장을 생성하는 데 사용된 출력 토큰은 약 1만3342개로, 장당 비용은 약 0.4달러 수준으로 나타났다. 이번 비교는 이미지 생성 AI 경쟁이 단순한 화질이나 스타일 재현을 넘어, 복잡한 지시를 얼마나 정확하게 장면 구조로 구현할 수 있는지로 이동하고 있음을 보여준다. 특히 다수의 객체와 인물이 얽힌 장면에서 특정 요소를 자연스럽게 배치하는 능력이 새로운 평가 기준으로 떠오르면서, 오픈AI의 최신 모델이 초기 경쟁에서 우위를 점했다는 분석이 나온다.

관련 저널 읽기

전체 보기 →