데이터스트림즈 ‘AI-Ready Data’ 전략… 에이전트 AI 시대 데이터 신뢰성 부상 - Korea IT Times
[AI] ai 데이터 관리
|
|
🧠 기타 AI
#ai-ready data
#datastreams
#korea it times
#데이터 신뢰성
#에이전트 ai
#ai 모델
#ai 에이전트
#databricks
#llama
#기타 ai
원문 출처: [AI] ai 데이터 관리 · Genesis Park에서 요약 및 분석
요약
생성형 AI 도입 확대에도 기업 현장에서는 데이터 불일치나 출처 불명확 등 기초 데이터 문제로 성과가 저조한 경우가 많습니다. 이에 데이터스트림즈는 AI가 정제되고 통제된 상태의 데이터를 활용할 수 있도록 돕는 ‘AI-Ready Data’ 전략을 확대하고 있습니다. 특히 판단과 실행을 수행하는 에이전트 AI 시대에는 데이터의 정합성과 신뢰성 확보가 모델 성능만큼 중요해지고 있습니다.
본문
생성형 AI 도입이 빠르게 확산되는 가운데, 기업 현장에서는 기대만큼 성과를 내지 못하는 사례도 나타나고 있다. 지능형 데이터 플랫폼 전문기업 데이터스트림즈는 이러한 한계의 주요 원인 중 하나로 데이터 불일치, 출처 불명확, 최신성 부족 등 기초 데이터 문제를 제시하며 ‘AI-Ready Data’ 전략을 확대하고 있다고 밝혔다. 데이터스트림즈가 정의하는 AI-Ready Data는 AI가 활용할 수 있도록 정제·연결·통제된 데이터다. 이는 단순한 데이터 보유량보다 AI가 일관된 기준으로 데이터를 해석하고 활용할 수 있는 상태를 만드는 데 초점을 둔다. 최근 확산되는 에이전트 AI(Agentic AI)는 단순 질의응답을 넘어 판단과 실행까지 수행하는 구조로 발전하고 있다. 이에 따라 AI가 활용하는 데이터의 정합성과 신뢰성은 모델 성능과 함께 중요한 검토 요소로 떠오르고 있다. 기업 AI 프로젝트가 실제 활용 단계에서 한계를 보이는 배경에도 데이터 관리 문제가 있다. 데이터가 부서별로 분산돼 있거나, 같은 항목이 서로 다른 기준으로 관리되거나, 출처와 변경 이력이 명확하지 않으면 AI 결과의 정확성과 설명 가능성을 확보하기 어렵다. AI 활용의 전제, 데이터 준비 상태 AI-Ready Data 구현을 위해서는 기존의 데이터 저장·통합 중심 접근을 넘어 데이터의 흐름, 의미, 품질을 함께 관리하는 구조가 필요하다. 데이터스트림즈는 데이터 가상화 기반 통합 접근과 메타데이터 중심 거버넌스를 결합한 데이터 패브릭(Data Fabric) 아키텍처를 통해 AI-Ready Data 구현을 추진하고 있다. 이 구조는 분산된 데이터를 물리적으로 이동하지 않고 실시간으로 연결해 데이터 사일로를 줄이는 데 초점을 둔다. 기업 내 여러 시스템에 흩어진 데이터를 하나의 활용 환경에서 접근할 수 있도록 해 AI 프로젝트 초기의 데이터 준비 부담을 낮추는 방식이다. 동시에 메타데이터를 기반으로 데이터의 비즈니스 의미와 관계를 정의한다. 이는 AI가 데이터 항목을 보다 일관된 기준에서 해석하도록 지원하는 요소로, 조직마다 같은 데이터를 다르게 이해하는 문제를 줄이는 데 활용될 수 있다. 연결·의미·통제로 구성되는 데이터 패브릭 전략 데이터스트림즈의 AI-Ready Data 전략은 연결, 의미, 통제 세 가지 요소로 구성된다. 연결(Connectivity)은 분산된 데이터를 물리적 이동 없이 실시간으로 연결해 데이터 사일로를 줄이고 통합 접근 환경을 구현하는 영역이다. 의미(Semantics)는 메타데이터를 기반으로 데이터의 비즈니스 의미와 관계를 정의하는 과정이다. 이를 통해 AI가 데이터의 맥락을 보다 일관된 기준에서 이해할 수 있도록 지원한다. 통제(Governance)는 데이터 계보(Lineage)와 품질 규칙을 기반으로 데이터 흐름과 상태를 지속적으로 관리하는 체계다. AI 입력 데이터의 신뢰성을 높이고, 데이터가 어디에서 생성돼 어떤 과정을 거쳐 활용됐는지 추적할 수 있도록 하는 데 목적이 있다. 데이터스트림즈는 가상화 엔진 SuperQuery와 메타데이터 플랫폼 MetaStream을 기반으로 이러한 구조를 구현하고 있다고 설명했다. 회사 측은 이 구조가 AI가 사용하는 데이터의 출처, 변환 과정, 품질 상태를 추적하는 데 활용될 수 있으며, AI 결과의 설명 가능성(Explainability) 확보에도 기여할 수 있다고 밝혔다. 에이전트 AI 시대의 데이터 인프라 과제 이 같은 전략은 최근 한국지능정보사회진흥원 세미나 등에서도 공유되며, 에이전트 AI 시대의 데이터 인프라 방향과 관련해 논의되고 있다. AI가 사람의 보조 도구를 넘어 업무 판단과 실행 단계에 관여할수록, 데이터 품질과 통제 구조는 기업 AI 도입 과정에서 중요한 과제로 부상할 가능성이 크다. 데이터스트림즈는 현재 금융권 중앙회, 공공기관, 대형 서비스 기업 등을 중심으로 AI-Ready Data 기반 데이터 거버넌스 체계 적용을 확대하고 있다고 밝혔다. 이는 AI 프로젝트가 실험 단계를 넘어 실제 업무와 의사결정 체계로 들어가는 과정에서 데이터 기반 신뢰 체계에 대한 수요가 커지고 있음을 보여준다. 데이터스트림즈 이영상 대표는 “AI가 기대만큼 성과를 내지 못하는 이유는 대부분 데이터가 준비되지 않았기 때문”이라며 “앞으로 AI 경쟁력은 모델이 아니라 AI-Ready Data를 얼마나 빠르게 구축하느냐에 의해 결정될 것”이라고 말했다. 데이터스트림즈는 AI-Ready Data를 에이전트 AI 시대의 데이터 인프라 전략으로 삼고, 기업의 AI 활용이 실제 업무 수행과 의사결정 체계로 확장되는 과정에 맞춰 데이터 거버넌스와 통합 플랫폼 사업을 강화할 계획이다.
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유