구글, 8세대 TPU 발표…전작 대비 전성비 2배·훈련 성능 3배 향상 - 네이트

[AI] TPU | | 💰 할인
#하드웨어/반도체 #5원 #ai과장광고 #ai회의론 #discount #firetiger #네이버페이 #상품권 #할인
원문 출처: [AI] TPU · Genesis Park에서 요약 및 분석

요약

본문 | ID | 구분 | 제목 | 글쓴이 | 추천 | 조회 | 날짜 | |---|---|---|---|---|---|---| | 103281 | 상품권 | [알리익스프레스] 4월 새로고침 세일 (4월13일(월)~4월19일(일)) (6) | _핫딜관리자 | 6 | 22073 | 2026.04.12 | | 103123 | 상품권 | [롯데온] 온쇼페 (4월6일(월)~4월15일(수)) (4) | _핫딜관리자 | 21 | 63268 | 2026.04.06 | | 38542 | 공지 | 루리웹 핫딜/예판 유저게시판 통합 공지 | _핫딜관리자 | 252 | 2718860 | 2020.03.28 | | BEST | [스팀] Upload Labs (무료) (4) | 39 | 8047 | 09:16 | || | BEST | [대형마트] 홈플러스&롯데마트&이마트 이번주 전단행사 (4/16~22) (18) | 11 | 10576 | 08:39 | || | BEST | [네이버페이] 라방 5원 (2) | 24 | 4572 | 08:38 | || | BEST | [오늘의집] 하겐다즈, 벤앤제리스, 나뚜루, 끌레도르바, 티코 아이스크림...

본문

[디지털데일리 김문기기자] 구글 클라우드가 23일(현지시간) 개최된 '구글 클라우드 넥스트(Google Cloud Next)' 행사에서 AI 모델 훈련과 추론에 각각 최적화된 8세대 맞춤형 텐서 처리 장치(TPU)인 'TPU 8t'와 'TPU 8i'를 공개했다. 이번 8세대 TPU는 구글 딥마인드와 협력하여 설계되었으며, 자율적인 AI 에이전트가 추론, 계획, 실행, 학습을 반복하는 '에이전트 시대'의 복잡한 요구사항을 충족하도록 개발됐다. 특히 구글은 이번 세대에서 처음으로 훈련용(8t)과 추론용(8i) 아키텍처를 이원화해 효율성을 극대화했다. 훈련 전용 칩인 'TPU 8t'는 대규모 모델 개발 주기를 단축하는 데 집중했다. 단일 슈퍼포드 기준 9,600개의 칩과 2페타바이트(PB)의 공유 고대역폭 메모리(HBM)를 지원하며, 이전 세대 대비 포드당 연산 성능이 약 3배 향상됐다. 또한 '버고 네트워크(Virgo Network)'를 통해 단일 논리 클러스터에서 최대 100만 개의 칩까지 선형적인 확장이 가능하다. 추론 전문 엔진인 'TPU 8i'는 지연 시간(Latency)에 민감한 에이전트 간 상호작용을 처리하도록 설계됐다. 전작 대비 3배 늘어난 384MB의 온칩 SRAM을 탑재해 메모리 병목 현상을 해결했으며, 이전 세대 대비 달러당 성능이 80% 개선되어 동일 비용으로 약 2배의 고객 요청을 처리할 수 있다. 두 칩 모두 구글이 자체 설계한 암(Arm) 기반 CPU인 '액시온(Axion)'을 호스트로 사용해 시스템 전반의 효율을 높였다. 또한 구글의 4세대 액체 냉각 기술을 적용해 공랭식으로는 불가능한 고밀도 성능을 유지하며, 전작 대비 와트당 성능(전성비)을 최대 2배까지 끌어올렸다. 아민 바닷(Amin Vahdat) 구글 클라우드 부사장은 "TPU 8t와 8i는 10년 이상의 TPU 개발 역량이 집약된 결과물"이라며 "단순한 칩 공급을 넘어 맞춤형 하드웨어와 오픈 소프트웨어가 결합된 'AI 하이퍼컴퓨터'를 통해 에이전트 기반 컴퓨팅의 새로운 지평을 열 것"이라고 밝혔다. 신형 TPU는 올해 말 정식 출시될 예정이다.

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →