ChatGPT 이미지 2.0과 Claude Design의 등장 - 요즘IT
[AI] Claude
|
|
🤖 AI 모델
#ai 모델
#chatgpt
#claude
#ai 딜
#anthropic
#openai
원문 출처: [AI] Claude · Genesis Park에서 요약 및 분석
요약
과거 AI가 생성하던 한글 텍스트의 오류 문제가 해결되어 실무에서 바로 사용할 수 있는 수준으로 이미지 생성 기술이 발전했습니다. 오픈AI는 차세대 제품 개발을 위해 영상 생성 도구 Sora의 운영을 종료했고, 이미지 생성이 궁극적인 개인 비서 구현을 위해 동영상보다 더 핵심적인 요소임을 강조했습니다.
본문
아마 다들 AI에게 “이런 이미지 만들어줘”라고 한 번쯤 시켜본 적이 있을 겁니다. 그런데 예전에는 “카페 메뉴판을 만들어줘”라고 하면 ‘아메리카노’는 ‘아메맄카노’가 되고, ‘딸기 라떼’는 ‘딿기 랃떼’되는 등 정체를 알 수 없는 글자로 뭉개지곤 했죠. 한국어 간판이나 포스터를 부탁해도 결과는 비슷했습니다. 결국 텍스트는 빼고 만들거나, 나중에 사람이 다시 얹어야 했습니다. 그런데 이제는 꽤 달라졌습니다. 같은 프롬프트를 넣어도, 카페에 바로 걸어둘 수 있을 만큼 자연스러운 한글 메뉴판이 나옵니다. 이는 최근 한 달 사이에 AI 업계에 많은 일이 벌어졌기 때문인데요. 하나씩 살펴보면, AI가 코딩을 넘어, 디자인 영역에 본격적으로 들어오려는 움직임을 볼 수 있었는데요. 이번 글에서는 이 흐름을 살펴보고, 실무 관점에서 이야기해 보려고 합니다. 이야기는 오픈AI의 Sora 셧다운에서 시작됩니다. 오픈AI는 3월 24일 AI 영상 생성 도구 Sora를 운영 종료를 결정했습니다. 이에 샘 올트먼은 "차세대 제품에 컴퓨팅 자원과 역량을 집중하기 위해"라고 밝혔죠. 동영상은 접되, 이미지는 계속 개발하겠다는 건데요. 또 다른 오픈AI 관계자는 "이미지 생성은 궁극적인 개인 비서를 만드는 데 핵심적인 요소"인 반면 "동영상에 대한 수요는 아직 그 정도가 아니었다"고 덧붙여 설명했습니다. Sora가 닫힌 지 11일 뒤인 4월 4일, 아레나 AI에 낯선 이름 세 개가 공개됐습니다. 마스킹테이프-알파, 가퍼 테이프, 팩킹 테이프. 이는 우리가 ‘덕트테이프’라 알고 있는 모델의 코드 네임입니다. 아레나 AI는 두 개의 익명 AI 모델이 같은 프롬프트로 이미지를 만들면, 사용자가 블라인드로 투표하는 비교 플랫폼입니다. 2026년 4월 기준 54개 모델이 등록돼 있고, 체스의 엘로(Elo) 레이팅 방식으로 순위가 매겨지죠. 세 모델은 얼마 지나지 않아 사라졌지만, 수백 장의 비교 스크린샷은 이미 퍼진 뒤였습니다. 이 패턴은 처음이 아니었거든요. 지난해 12월에도 익명 모델이 아레나 AI에 잠깐 떴다가 사라졌고, 몇 주 뒤 GPT 이미지 1.5가 출시됐습니다. 구글의 제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image) 모델도 "나노바나나"라는 코드네임으로 아레나 AI에 먼저 등장했었죠. 결국 4월 21일, 오픈AI가 챗GPT 이미지 2.0을 공식 발표하면서 덕트테이프의 정체가 확인됐습니다. OpenAI는 이 모델을 이미지 생성의 새로운 시대라고 소개했습니다. 제가 생각하는 핵심 변화는 세 가지는 아래와 같습니다. 첫째, 텍스트 렌더링이 잘된다. 이전 모델들의 가장 큰 약점이 텍스트 렌더링이었습니다. 포스터에 글자를 넣으면 뭉개지고, 한국어는 특히 처참했죠. 챗GPT 이미지 2.0은 OpenAI 스스로 "텍스트 처리에서 전작 대비 큰 진전"이라고 밝힐 만큼 개선됐습니다. 한국어, 일본어, 중국어, 힌디어, 벵골어 등 비라틴 문자 렌더링이 대폭 개선됐고, 벤처비트가 공개한 샘플에는 한글로 물의 순환을 설명하는 교육 다이어그램에서 복잡한 한글 텍스트가 레이아웃 안에 자연스럽게 들어가 있었습니다. 둘째, "생각"하고 그린다. 인스턴트(Instant) 모드와 씽킹(Thinking) 모드 두 가지가 있습니다. 인스턴트는기존처럼 빠르게 결과를 내놓고, 씽킹은 OpenAI의 추론 기능을 결합해 웹 검색을 하고, 자기가 만든 결과물을 검증하고, 한 프롬프트에서 최대 8장의 이미지를 캐릭터 일관성을 유지하면서 생성할 수 있습니다. 만화 시퀀스나 브랜드 캠페인처럼 여러 장에 걸쳐 인물이 일관되게 나와야 하는 작업에 써봄직한 기능입니다. 참고로 씽킹 모드는 ChatGPT Plus($20/월)~Pro($200/월) 등 유료 구독자에게만 제공되며, Instant 모드는 무료 사용자를 포함한 모든 사용자가 이용할 수 있습니다. 셋째, 무료 사용자도 쓸 수 있다. 인스턴트 모드는 무료 계정을 포함한 모든 ChatGPT 사용자에게 공개되어 있습니다. API(gpt-image-2)로도 접근할 수 있고, 2K 해상도와 3:1에서 1:3까지의 유연한 비율을 지원합니다. 다만 한계도 지적되는 점도 있는데요. 와튼스쿨의 AI 연구자 Ethan Mollick은 "1~2번 정도의 수정은 잘 되지만, 그 이후부터는 진전이 멈추는 전형적인 이미지 생성 모델의 문제"가 있다고 지적했습니다. 그의 우회법은 이미지를 새 대화창에 넣어 맥락을 리셋하는 것이라고 합니다. 그리고 모델의 지식 기준일이 2025년 12월이라, 최신 브랜드 로고나 제품 디자인을 정확히 재현하는 데는 한계가 있다고 하는데 이 부분은 금방 해결될 거라 봅니다. 한편 OpenAI가 이미지 품질로 디자인 영역에 들어오는 동안, 앤트로픽은 다른 방향을 택했습니다. 4월 17일 공개된 Claude Design은 AI와 대화하면서 프로토타입, 슬라이드, 랜딩 페이지 같은 시각물을 만드는 도구입니다. Claude Opus 4.7이 구동하며, 유료 구독자에게 리서치 프리뷰로 제공됩니다. 챗GPT 이미지 2.0과 클로드 디자인은 디자인이라는 같은 영역에 진입하면서도 다른 곳을 겨냥합니다. 챗GPT 이미지 2.0은 명령에 따른 더 정확한 이미지를 만드는 데 집중하지만, Claude Design은 비디자이너가 디자인 결과물을 만드는 워크플로우에 집중합니다. 팀의 코드베이스와 디자인 파일에서 디자인 시스템(색상, 타이포그래피, 컴포넌트)을 자동으로 추출하고, 이후 프로젝트에 자동 적용합니다. 디자인이 끝나면 클로드 코드(Claude Code)로 넘겨서 바로 코드로 만들 수 있습니다. 머릿속 아이디어를 시안으로 뽑고, 그 시안을 코드로 옮기는 과정을 전부 자사 생태계 안에서 완결시키려는 구조입니다. 앤트로픽은 "기존 디자인 도구를 대체하려는 게 아니라 보완하려는 것"이라고 했습니다. 하지만 아이디어 탐색부터 시안, 프로덕션 코드까지 하나의 생태계 안에서 끊기지 않고 이어지는 도구는 지금까지 없었죠. 보완이라고 말하기엔, 기존 도구들이 담당하던 영역을 꽤 넓게 건드리는 구조라고 생각합니다. Claude Design이 바꾸는 건 디자인 도구가 아니라, 디자인을 할 수 있는 사람의 범위입니다. 그리고 챗GPT 이미지 2.0은 그 사람들이 만드는 결과물의 품질 천장을 끌어올리고 있죠. 한국 디자이너에게 그 품질 변화 중 가장 체감이 큰 부분이 따로 있습니다. 바로 텍스트 렌더링인데요. 그동안 AI 이미지 모델에 한국어를 넣으면 결과가 처참했습니다. 도입부의 카페 메뉴판이 단적인 예죠. 글자가 뭉개지거나 자모가 뒤섞여서, AI가 만든 이미지에 한글이 들어가면 텍스트를 전부 다시 얹는 후보정이 당연한 절차였습니다. AI 결과물은 레퍼런스가 아니라 "위에 다시 작업할 밑판" 정도의 수준이었죠. 챗GPT 이미지 2.0에서 그 부분이 눈에 띄게 개선되었습니다. OpenAI는 공식적으로 한국어를 포함한 비라틴 문자 렌더링의 개선을 발표했고, Arena 테스트 단계에서 커뮤니티는 텍스트 렌더링 정확도가 99%를 넘는다고 보고했습니다. 공식 벤치마크는 아니지만, 이전 모델과 차원이 다른 결과죠. 솔직히 이 모델이 실무에서 바로 최종 결과물로 쓸 수 있는 수준인지는 아직 모르겠습니다. 브랜드 가이드라인이 엄격한 에이전시나 대기업 디자인팀이라면 자간, 서체 규정, 컬러 코드까지 맞춰야 하니 아직 한참 부족할 수 있습니다. 하지만 디자인 인력이 없는 자영업자가 카페 메뉴판을 만들거나, 소규모 스타트업이 SNS 광고 소재를 빠르게 돌려야 하는 상황이라면 그냥 쓸 수도 있겠다는 생각입니다. 또, 프로토타입이나 초기 시안 단계에서는 충분히 쓸 수 있는 수준 정도도 된 것 같습니다. 지금까지 AI가 디자인 영역으로 이동하는 움직임을 함께 살펴봤습니다. 그러면 실무자들은 지금 뭘 하면 될까요? 거창한 커리어 전략대신, 당장 실천해볼 수 있는 것들을 정리해봤습니다. 챗GPT 이미지 2.0은 무료입니다. ChatGPT에 접속해서 본인이 실무에서 하는 작업. 포스터 레이아웃, 앱 UI 목업, 인포그래픽, 광고 배너를 프롬프트로 넣어보세요. 남이 정리해준 기사를 읽는 것과 직접 프롬프트를 넣어보는 건 해상도가 전혀 다릅니다. 글로벌 IT 리뷰 매체인 Tom's Guide는 챗GPT 이미지 2.0 리뷰에서, "디자이너가 실제로 쓸 수 있는 첫 번째 AI 이미지 모델"이라고 평가했습니다. 하지만 AI가 초안을 뽑아주고, 나는 그걸 다듬는 편집자 역할에 안주하면 AI 성능이 올라갈 때마다 내 가치가 줄어듭니다. 대신 나의 프로젝트에서 풀어야 할 시각적 문제가 무엇인지 정의하고, AI에게 방향을 지시하고, 결과물이 브랜드·사용자 맥락에 맞는지 판단하는 "디렉터" 역할을 가져가야 합니다. AI가 속도를 내고, 디자이너가 방향을 잡는 구조가 지금 가장 현실적인 협업 형태입니다. Claude Design의 핵심 기능이 코드베이스에서 디자인 시스템을 자동 추출하는 것이라는 점이 시사하는 바가 있습니다. 앤트로픽 자체 가이드에서도 "디자인 시스템 없이 Claude Design을 쓰면 기능적이지만 범용적인 결과물이 나온다"고 명시하고 있죠. AI가 아무리 발전해도, 디자인 시스템을 처음 설계하고 유지하는 건 사람의 몫입니다. 색상, 타이포그래피, 컴포넌트 패턴, 스페이싱 규칙을 체계적으로 만들고 관리할 수 있는 디자이너는 AI 시대에 오히려 더 필요해집니다. AI가 빠르게 결과물을 찍어낼수록, 일관성을 잡아주는 시스템의 가치는 올라가니까요. 챗GPT 이미지 2.0과 Claude Design은 같은 AI 디자인"이라는 이름 아래 전혀 다른 도구입니다. 하나는 더 정확한 이미지를 만들고, 하나는 비디자이너도 디자인 결과물을 만들 수 있게 합니다. 둘 다 써보면 각각의 강점과 한계가 보이고, 어떤 작업에 어떤 도구를 쓸지 판단할 수 있게 됩니다. 이 판단력을 기르는 것이 스스로의 경쟁력이 되어줄 거라 생각합니다. AI가 아직 못 하는 걸 정확히 짚어보면 이렇습니다. 이 화면이 왜 이렇게 디자인 되어야 하는지를 설명하는 일. 사용자가 이 버튼을 누른 뒤 어떤 감정을 느낄지 예측하는 일. 브랜드가 이 시장에서 어떤 인상을 남겨야 하는지 판단하는 일. 이는 우리 서비스의 고객과 비즈니스를 깊이 이해해야만 가능한 영역입니다. AI가 실행 속도를 올려주는 만큼, 디자이너가 "무엇을 만들 것인가"의 판단에 더 많은 시간을 쓸 수 있게 되는 건 오히려 기회입니다. 최근 몇 주 사이에 AI 디자인 모델에 많은 변화가 있었습니다만, 결국 도착점은 같습니다. 더 많은 사람이 더 빠르게 시각물을 만들 수 있는 세계. 그 세계에서 만드는 속도의 가치는 내려갈 수밖에 없습니다. 도구가 평준화되면 누구나 비슷한 퀄리티의 시안을 뽑을 수 있으니까요. 이를 대신해 올라가는 것은, 만들어진 열 개 중에서 맞는 하나를 고르는 능력(판단력). 나머지 아홉 개가 왜 안 되는지를 설명할 수 있는 능력(도메인 지식)입니다. 사용자가 화면을 어떤 순서로 훑는지 아는 건, 사용성 테스트를 수없이 지켜본 사람이 아는 겁니다. 이 레이아웃이 전환율을 깎아먹을 거라는 직감은, 비슷한 실수를 직접 겪어본 사람에게서 나오죠. 앞으로 도구는 계속 바뀔 겁니다. 3개월 뒤면 지금보다 더 좋은 모델이 나오겠죠. 하지만 이 능력이 있는 사람은 도구가 바뀌어도, 하는 일은 변하지 않을 겁니다. ©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유