뉴스피드 큐레이션 SNS 대시보드 저널

구글 에이전트 개발 키트 사용기

ITWorld Korea | | 🤖 AI 모델
#review #ai 모델

요약

사이버보안 기업 휴먼 시큐리티의 보고서에 따르면, 2025년 AI와 봇이 생성하는 자동화 트래픽의 증가 속도가 인간 사용자 트래픽을 약 8배나 앞서며 인터넷 생태계의 패러다임이 전환되고 있습니다. 특히 대형언어모델(LLM)의 확산으로 전체 AI 트래픽은 187% 증가했고, 로그인과 결제까지 직접 수행하는 ‘에이전틱 AI’는 무려 7851% 폭발적인 성장을 기록했습니다. 그러나 정상적인 AI와 악의적인 공격 봇의 행동 패턴 차이가 0.5%에 불과해, 이를 식별할 새로운 보안 체계 마련이 시급한 상황입니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

구글 에이전트 개발 키트(ADK)는 AI 에이전트를 개발하고 배포하기 위한 유연하고 모듈화된 오픈소스 프레임워크다. 제미나이와 구글 생태계에 맞춰 최적화됐지만 모델과 배포 환경 모두 무엇을 사용하든 가리지 않으며, 다른 프레임워크와의 호환성도 고려해 만들어졌다. ADK는 소프트웨어 개발과 비슷한 느낌으로 에이전트 개발을 할 수 있도록 설계됐다. 개발자가 에이전트 아키텍처를 좀더 쉽게 만들고 배포하고 오케스트레이션할 수 있게 해준다. 구글은 자사 버텍스 AI 에이전트 엔진 런타임에 ADK 에이전트를 배포할 것을 권장한다. 버텍스 AI 에이전트 엔진 런타임은 ADK와 같은 프레임워크를 사용해 구축된 AI 에이전트를 배포, 관리, 확장하기 위해 설계된 완전 관리형 구글 클라우드 서비스다. 또는 에이전트를 컨테이너화해서 구글 클라우드 런을 비롯해 거의 모든 곳에 배포할 수도 있다. ADK와 직접적으로 경쟁하는 제품으로는 아마존 베드록 에이전트코어, 애저 AI 파운드리 에이전트, 데이터브릭스 에이전트 브릭스가 있다. 그 외에 오픈AI 에이전트 SDK, 랭체인/랭그래프, 크루AI, 스미스OS와도 경쟁한다. 파이썬, 고, 자바, 타입스크립트를 위한 ADK 현재 구글 ADK 언어는 파이썬, 고, 자바, 타입스크립트까지 4개다. 개발자 UI인 웹용 ADK에 대해서는 나중에 살펴볼 예정이다. 커밋 기록에 따르면 4개 언어 중 파이썬 ADK가 가장 오래됐고 샘플도 가장 많다. 파이썬 ADK의 특징은 풍부한 툴 생태계, 코드 우선 개발, 에이전트 config(코딩 없이 ADK 워크플로우 구축), 툴 승인 절차(HITL), 모듈형 멀티 에이전트 시스템, 그리고 거의 범용적인 배포 등이다. 최신 기능으로는 맞춤형 서비스 등록, 이전 호출 전으로 세션을 되돌리는 기능, 그리고 버텍스 AI 코드 실행 샌드박스 API를 사용해 에이전트가 생성한 코드를 실행하도록 지원하는 클래스가 포함된다. 원격 에이전트 간 통신을 위한 A2A 프로토콜을 지원한다. 자신의 파이썬 설치 환경에 따라 pip 또는 pip3를 사용해 최신 안정화 버전의 파이썬 ADK를 설치할 수 있다. pip install google-adk 종속 항목이 상당히 많으며, 일부 샘플에서 볼 수 있듯이 uv를 사용해 ADK를 설치할 수도 있다. 가급적 가상 환경을 사용하는 것이 좋다. 고 ADK는 파이썬 ADK와 본질적으로 동일한 기능에 관용적인 고의 특성을 더했다. 다음을 실행해서 프로젝트에 ADK 고를 추가할 수 있다. go get google.golang.org/adk 자바 ADK의 기능, 개발 UI, 인터페이스는 파이썬 ADK와 동일하다. 설치하려면 메이븐 종속 항목에 google-adk를 추가해야 한다. 타입스크립트 ADK의 기능, 개발 UI, 인터페이스도 파이썬 ADK와 동일하다. 설치하려면 다음을 실행하면 된다. npm install @google/adk ADK 퀵스타트 ADK에는 5개 이상의 퀵스타트가 있다. 1개는 파이썬과 버텍스 AI SDK용이고, 나머지 4개는 예상하겠지만 파이썬, 고, 자바, 타입스크립트용이다. 이 4개는 동일한 패턴을 따른다. 기본적으로 ADK를 설치하고, ADK를 사용해 에이전트 프로젝트를 만들고, 에이전트 프로젝트에 얼마간의 코드를 추가하고, 제미나이 API 키를 설정하고, 에이전트를 CLI로, 그리고 웹 인터페이스를 사용해 실행한다. 샘플 ADK 에이전트를 CLI로 실행하기. 샘플에서 시간 값이 하드-와이어(모의)로 구현된 것을 볼 수 있다.Foundry 샘플 ADK 에이전트를 웹 UI로 실행하기.Foundry ADK 웹 : 로컬 개발 환경 ADK 웹은 내장된 개발 UI로, 개발과 디버깅을 더 쉽게 하기 위해 ADK와 함께 제공된다. 선행 요건은 npm, 노드JS, 앵귤러 CLI, google-adk(파이썬), google-adk(자바)다. 설치하려면 ADK 웹 리포지토리를 복제하고 노드 종속 항목을 설치한 다음 각각 별도의 터미널에서 ADK 웹 서버와 ADK API 서버를 모두 실행한다. 모든 부분이 제대로 실행되면 UI는 localhost:4200에 위치한다. UI는 이벤트, 트레이스, 아티팩트, 평가를 보여주며 에이전트 빌더와 어시스턴트를 제공한다. ADK 웹 에이전트 빌더와 어시스턴트.Foundry 핵심 ADK 개념과 기능 ADK 에이전트는 언어 모델을 사용할 수도 있고, 결정론적인 워크플로우 에이전트, 또는 임의의 오케스트레이션 로직 정의가 가능한 맞춤형 에이전트가 될 수도 있다. 에이전트는 툴을 호출해서 외부 API와 상호작용하거나 검색하거나 코드를 실행하며 아티팩트를 로드하고 저장할 수도 있다. 개발자는 에이전트 프로세스의 특정 지점에서 실행되는 콜백을 제공할 수 있다. ADK가 세션의 컨텍스트, 이벤트, 그리고 에이전트의 단기 상태를 처리하는 방식은 웹 서버가 웹 애플리케이션을 지원하는 것과 거의 비슷하다. 또한 ADK는 여러 세션에 걸친 장기 메모리를 지원한다. 계획은 목표를 달성하기 전에 세부 단계로 나누는 방법이고, 러너는 실행 흐름을 관리하고 에이전트 상호작용을 오케스트레이션한다. ADK는 상호작용이 가능한 여러 개의 특화된 에이전트로 구성된 애플리케이션을 지원한다. ADK에는 에이전트를 실행하고 실행 단계(이벤트, 상태 변화)를 조사하고 상호작용을 디버깅하고 에이전트 정의를 시각화하기 위한 명령줄 인터페이스(CLI)와 개발자 UI가 포함된다. 프레임워크에는 멀티턴 평가 데이터 세트를 생성하고 평가를 실행하기 위한 툴이 포함된다. 또한 개방성과 확장성을 지향한다. 앞서 언급했듯이 ADK는 제미나이와 구글 생태계에 최적화돼 있지만 어떤 모델이나 배포 환경에서도 작동하며, 다른 프레임워크와 호환된다. 에이전트 스킬 에이전트 스킬은 에이전트에 새로운 역량과 전문성을 부여하기 위한 단순하고 개방적인 형식으로, 지침과 스크립트, 리소스로 구성된 폴더이며 이를 에이전트가 찾아서 사용할 수 있다. 스킬은 에이전트가 실제 작업을 수행하는 데 필요한 컨텍스트를 제공한다. 스킬을 통해 분야별 전문 지식, 새로운 역량, 반복 가능한 워크플로우, 상호 운용성이 가능해진다. 에이전트 스킬 형식은 앤트로픽이 개발해 개방형 표준으로 출시했으며 ADK 외에도 비주얼 스튜디오 코드, 깃허브, 프론티어 LLM, 에이전틱 코딩 툴, 그리고 스노우플레이크와 데이터브릭스 등의 AI 지원 데이터베이스 등 많은 AI 개발 툴에서 지원된다. 에이전트 런타임 ADK는 개발과 테스트를 위해 다음을 포함한 여러 가지 에이전트 실행 방법을 제공한다. adk web : 브라우저 기반 인터페이스 시작 adk run : 터미널에서 에이전트와 상호작용 가능 adk api_server : RESTful API를 통해 에이전트 노출 ADK 샘플과 커뮤니티 리포지토리 ADK 샘플 리포지토리에는 지원되는 4개 언어에 대한 ADK 샘플 에이전트가 포함돼 있지만 대부분은 파이썬 에이전트다. ADK 파이썬 커뮤니티 리포지토리는 커뮤니티에서 기여한 툴, 서드파티 서비스 통합, ADK의 핵심 기능을 확장하는 배포 스크립트로 구성된 생태계의 중심으로, 현재 활발하게 성장 중이다. 고객 서비스 샘플 살펴보기 ADK 샘플 고객 서비스 예시는 주택 리모델링, 정원 관리와 관련 용품을 전문적으로 다루는 가상의 대형 소매업체를 위한 대화형 멀티모달 파이썬 에이전트다. 필자는 아마존 베드록 에이전트코어 리뷰에서 사용했던 고객 서비스 에이전트와 가장 비슷한 샘플로 이 샘플을 선택했다. 에이전트의 흐름도는 다음과 같다. 고객 서비스 에이전트는 모의 툴을 사용하는 만큼 모든 기능이 정확히 예상대로 작동하지는 않는다. 이 에이전트를 실제 백엔드 통합과 함께 구현하려면 현재 모든 에이전트 툴이 고정된 응답의 모의 형태로 구현돼 있는 customer_service/tools/tools.py를 편집해서 모의 부분을 API 호출로 대체해야 한다. customer_service/tools/agent.py는 이러한 툴을 가져와서 Agent생성자의 일부인 root_agent/tools 배열에 모두 나열한다. tools/config.py 로직은 이 에이전트를 us-central 지역의 버텍스 AI에 배포 가능하도록 정의하며, deployment/deploy.py는 버텍스 AI 버킷과 에이전트 휠 파일을 정의한다. 필자가 느끼기에는 아마존 베드록 에이전트코어 샘플과 비교해 전반적으로 이 ADK 샘플이 더 유능하다. 에이전트코어의 기능 중 ADK에는 없는 한 가지는 프레임워크에서 구현되는 에이전트 외부의 정책이다. ADK 예시에서 할인 한도는 파이썬 코드로 구현돼 있는데, 필자도 그렇지만 아마 대부분의 프로그래머에게 이 방식이 더 합리적으로 느껴질 것이다. ADK 샘플 리포지토리의 ADK 고객 서비스 예시에서 핵심인 cymbal_retail_agent의 워크플로우 다이어그램.Foundry 결론 구글 에이전트 개발 키트는 에이전트 개발을 위한 강력하고 거의 완전한 프레임워크로, LLM 에이전트 외에도 워크플로우 에이전트와 맞춤형 에이전트를 구축할 수 있고 멀티 에이전트 아키텍처를 지원하며, AI 모델, 아티팩트, 툴, 통합, 플러그인, 스킬, 콜백을 통해 에이전트 기능을 확장할 수 있게 해준다. ADK 에이전트는 모델 컨텍스트 프로토콜(MCP) 클라이언트 역할을 할 수 있고, 개발자는 MCP 서버를 통해 ADK 툴을 노출할 수 있다. 이러한 모든 기능에 따르는 단점은 프레임워크를 익히는 데 그만큼 많은 시간과 노력이 필요하다는 점 정도다. 전반적으로는 구글 ADK가 마음에 든다. 아키텍처가 아마존 베드록 에이전트코어보다 더 합리적으로 느껴지며, 에이전트코어보다 프로그래밍 언어 옵션이 더 많고 개발 툴도 더 우수하다. 이번 리뷰에서는 파이썬 ADK와 고객 서비스 예시만 심층적으로 살펴봤기 때문에 다른 3개의 언어 ADK에 예시가 부족하다는 점 외의 다른 단점이 있다 해도 파악할 수 없었다. 비용 구글 ADK 프레임워크는 무료 오픈소스이며, 버텍스 AI 에이전트 엔진 가격은 주로 사용량에 따라 결정된다. 플랫폼 개발을 위해서는 파이썬, 타입스크립트, 고 또는 자바 환경이 필요하다. 버텍스 AI 에이전트 엔진, 구글 클라우드 런, 구글 쿠버네티스 엔진 또는 기타 컨테이너나 쿠버네티스 환경에 배포할 수

관련 저널 읽기

전체 보기 →