DeepMind, Vision Banana 출시: Frontier Generalist 이미지 모델

hackernews | | 📰 뉴스
#deepmind #vision banana #시멘틱 세그멘테이션 #이미지 모델 #일반 모델
원문 출처: hackernews · Genesis Park에서 요약 및 분석

요약

딥마인드는 프롬프트에 따라 앉은 사람, 걷거나 서 있는 사람, 바다, 가로등 등 다양한 객체를 서로 다른 색상으로 분류하는 시각적 의미 분할이 가능한 '비전 바나나' 모델을 출시했습니다. 이 모델은 이미지 내 요소를 색상 코드로 명시하여 클래스별로 정밀하게 구분하는 최첨단 범용 이미지 모델로 평가받습니다.

본문

Prompt: Conduct per-class semantic segmentation for the given image. The sitting person are represented by (255, 255, 0). The standing and walking people are represented by (255, 192, 128). The ocean is depicted in (64, 192, 64). The street lights are in (128, 0, 64). The sky is in (255, 0, 192). The fence is in (0, 0, 255). The backpack is in (255, 0, 0).

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →