PARA/03_Resources/R001_개발_레퍼런스(참고문서)/AI 강의/AI 도입 시 마주하는 Legacy Data의 벽 (Encore).md

AI 도입 시 마주하는 Legacy Data의 벽 (Encore)

요약

1. 문제 제기: AI 시대의 데이터 현실 (00:23-03:09)

기업 데이터의 복잡성

Legacy 시스템의 규모

  • 대기업: 수백~수천 개의 시스템 보유
  • 시스템당: 수천 개의 테이블
  • 테이블당: 수십만 개의 칼럼
  • 문제: 어디에 무엇이 있는지 아무도 모름

AI 에이전트가 직면한 벽

AI에게 일을 시키려면...

  • ❌ 데이터가 어디 있는지 모름
  • ❌ 데이터 품질이 좋은지 나쁜지 모름
  • ❌ 접근 권한이 있는지 없는지 모름
  • 컨텍스트(맥락) 정보가 없음

→ 이런 상태에서는 AI가 작동할 수 없음


2. Legacy Data의 핵심 문제들 (03:09-06:08)

AI-Ready 데이터의 조건

AI가 데이터를 사용하려면 필요한 것들:

  1. 식별 가능성: 데이터가 무엇인지 알 수 있어야
  2. 분류 가능성: 종류와 용도 파악 가능
  3. 맥락 이해: 의미와 관계 파악
  4. 품질 확보: 신뢰할 수 있는 정확한 데이터
  5. 접근 가능성: 실제로 사용할 수 있는 권한

AI 에이전트의 두 가지 요구사항

  1. 정확도: 올바른 답 제공
  2. 보안 준수: 규정과 권한 준수

핵심 비유:

아무리 좋은 슈퍼카(AI 모델)가 있어도, 비포장도로(Legacy 데이터)에서는 제대로 달릴 수 없다


3. Legacy 시스템의 현실적 장애물 (06:08-07:45)

기업이 직면한 Legacy 문제들

인프라 측면

  • 온프레미스 제약: 보안 문제로 클라우드 접근 불가
  • 레거시 시스템: 20~30년 전 개발된 오래된 시스템
  • 데이터 사일로: 곳곳에 분산된 데이터

데이터 측면

  • 식별 불가: 테이블/칼럼이 무엇을 의미하는지 불명확
  • 품질 문제: 일관성 없는 데이터
  • 암묵적 지식: 담당자만 아는 관계와 규칙

과거의 해결책: 데이터 거버넌스

전통적으로 관리했던 메타데이터:

  • 데이터 표준
  • 데이터 식별 정보
  • 데이터 모델
  • 데이터 품질 규칙

4. 해결책의 핵심: 메타데이터의 재발견 (07:45-09:46)

메타데이터 = Legacy Data의 열쇠

과거: 시스템 신뢰성 확보를 위한 관리 도구 현재: AI가 데이터를 이해하는 필수 자원

좋은 소식: AI 기반 자동화

과거의 우려

  • "메타데이터 만들기 너무 어렵고 비싸다"
  • 수작업으로 시간과 비용 많이 듦

현재의 해결

  • ✅ AI가 메타데이터를 자동으로 생성
  • ✅ Legacy 시스템도 자동 분석 가능
  • ✅ 시간과 비용 대폭 절감

MCP: 산업 표준 인터페이스

Claude가 제시한 MCP (Model Context Protocol)

  • AI 에이전트가 데이터를 찾고 접근하는 표준 방법
  • 어떤 에이전트든 동일한 방식으로 데이터 접근 가능

핵심 조합:

메타데이터 + MCP = AI-Ready Data


5. 실행 프로세스 (09:46-10:30)

단계별 접근법

1단계: 인벤토리화

  • 분산된 DB와 파일 목록 작성
  • 전체 데이터 자산 파악

2단계: 품질 확보

  • 데이터 품질 검증 프로세스
  • 표준화 작업

3단계: 보안 정책

  • 접근 권한 설정
  • 통제 레벨 정의

4단계: MCP 연결

  • 확보된 메타데이터를 MCP로 연결
  • AI가 사용 가능하도록 전환

기대 효과

  • ✅ AI 정확도 향상
  • ✅ 컴플라이언스 준수
  • ✅ 업무 자동화 실현
  • ✅ AI 프로젝트 성공률 증가

6. 다른 접근법들과 비교 (10:30-15:30)

방법 1: 데이터 패브릭 (Data Fabric)

개념: 분산된 데이터를 한곳으로 모으기

  • 예: Snowflake, Databricks
  • 장점: 중앙 집중 관리
  • 치명적 단점:
    • 💰 비용이 매우 높음
    • 📊 원본 데이터 식별이 선행되어야 함
    • ⏱️ Legacy 데이터는 이동조차 어려움

방법 2: 데이터 메시 (Data Mesh)

개념: 부서/주제별로 데이터 분산 관리

  • 각 팀이 자기 데이터에 책임
  • 데이터 패브릭과 유사한 문제점
  • 여전히 Legacy 식별 문제 존재

방법 3: 지식 그래프 (Knowledge Graph)

개념: 데이터 관계를 시각적으로 표현

  • 노드(점)와 엣지(선)로 연결
  • 예: Neo4j
  • 장점: 비전문가도 이해하기 쉬움
  • 단점: 역시 기본 데이터 정리 필요

비용과 현실의 벽

모든 방법의 공통 문제

  • Legacy 데이터가 방대할 경우 전체 전환 불가능
  • 비용 부담
  • 실패 위험

7. 추천 전략: 단계적 접근 (14:39-17:25)

1단계: 메타데이터 우선 확보 ⭐ (최우선)

가장 먼저 해야 할 것

  • Legacy 원본 데이터에 대한 메타데이터 생성
  • AI 자동화 도구 활용
  • 인벤토리, 표준, 품질, 보안 정보 정리
  • 비용 효율적이고 실패 위험 낮음

2단계: AI 에이전트 구축

메타데이터 기반 에이전트 개발

  • MCP로 연결
  • 플랫폼 활용 (예: M8L, Encoa의 AIPP)
  • 하드코딩보다 오케스트레이션 도구 사용

3단계: 선택적 고도화 (필요시)

특정 도메인에 특화가 필요할 때

  • 데이터 패브릭 구축
  • 데이터 메시 도입
  • 지식 그래프 추가
  • 중요: ROI 충분히 검토 후 진행

왜 이 순서인가?

  1. 메타데이터 없이는 어떤 방법도 불가능
  2. 전체를 한번에 바꾸려다 실패
  3. 작게 시작해서 성과 확인 후 확장

8. 실제 구현 방안 (17:25-19:24)

Legacy Data에서 AI-Ready Data로

데이터 소스 (있는 그대로)

다양한 Legacy 저장소들:

  • Oracle, PostgreSQL 등 전통 RDBMS
  • 온프레미스 시스템
  • 클라우드 리소스
  • 업무 문서들 (비정형 데이터)

메타데이터 자동 생성 (AI 활용)

과거: 사람이 수작업

  • 표준 정의
  • 모델 관리
  • 품질 규칙 작성
  • → 매우 어렵고 시간 많이 걸림

현재: AI 에이전트가 자동화

  • 데이터 모델 자동 분석
  • 표준화 자동 적용
  • 품질 규칙 자동 생성
  • → 빠르고 정확하게 메타데이터 확보

전통적 관리 (사람의 역할)

여전히 필요한 사람의 개입:

  • 품질 최종 검증
  • 표준 승인
  • 데이터 구조 변경 승인
  • 정책 결정

AI용 메타데이터 제공

AI 에이전트가 필요로 하는 정보:

  • 📍 데이터 위치
  • ✅ 데이터 품질 상태
  • 📄 데이터 출처
  • 🔐 접속 정보와 권한

9. 핵심 메시지: 메타데이터 for AI (19:24-끝)

Legacy Data의 벽을 넘는 열쇠

문제:

  • 20~30년 된 Legacy 시스템
  • 복잡하고 분산된 데이터
  • 식별 불가능한 구조

해결책:

  • 메타데이터 자동 생성
  • MCP 표준 연결
  • 단계적 접근

결과:

  • ✅ AI 정확도 향상
  • ✅ 보안 준수
  • ✅ AI 프로젝트 성공

두 마리 토끼: "메타데이터 for AI"

  1. 전통적 데이터 관리 (기존 시스템 유지)
  2. AI-Ready 데이터 (미래 준비)

→ 하나의 메타데이터로 두 가지 목적 달성!


전체 요약

Legacy Data의 벽이란?

  1. 오래되고 복잡한 시스템
  2. 분산되고 식별 불가능한 데이터
  3. 품질과 표준이 없는 데이터
  4. AI가 접근할 수 없는 구조

벽을 넘는 방법

  1. 메타데이터 우선: AI로 자동 생성
  2. MCP 연결: 표준 인터페이스
  3. 단계적 접근: 작게 시작, 점진 확장
  4. 비용 고려: ROI 기반 의사결정

핵심 교훈

"Legacy Data는 AI의 장애물이 아니라, 메타데이터로 전환하면 AI의 자산이 된다"

Encore의 메시지: 완벽한 시스템을 기다리지 말고, 지금 있는 Legacy Data부터 메타데이터로 정리하면 AI 시대를 준비할 수 있다!

스크립트

잠실동 3
2025.11.04 화 오후 4:20 ・ 20분 10초
이두헌

참석자 1 00:23
예 안녕하십니까 앵커 송동건입니다. 오늘 여러분들과 함께할 얘기 자체는 여러분들이 가지고 있는 이 기업의 다양한 데이터들 RDB를 비롯한 어떤 정형 데이터일 수도 있겠고요.
또 여러분들이 가지고 있는 여러 가지 다양한 종류의 문서들 이런 비정형 데이터들도 있겠죠.
AI가 어쨌든 지금은 AI 에이전트 시대고 AI 에이전트의 시대고 AI 에이전트가 여러분들의 이제 업무를 이제 대신하기 시작을 합니다.
자동화를 시작을 하죠. 그동안에 여러분들이 다양한 업무를 진행을 하면서 고객들이 다양한

참석자 1 01:10
RDB라고 하는 데이터 저장소에 많이 들어가 있고 또 문서에도 들어가 있습니다.
예를 들어서 여러분들이 뭔가 AI 에이전트를 만든다고 생각을 했을 때 그 AI 에이전트가 여러분들이 가지고 있는 여러 가지 다양한 어떤 시스템의 데이터 저장소를 쓴다고 하게 된다면 하게 된다면 과연 여러분들이 그러한 어떤 데이터들에 대해서 AI 에이전트가 접근하기 전에 식별을 할 수가 있는가라는 겁니다.
예를 들어서 우리 계열사 중에 SK하이닉스 혹은 SK 들어가는 데도 있겠고 다른 기업들도 있을 수 있겠죠.
그 기업들에는 수많은 어떤 어떤 수백 개의 어떤 시스템들 혹은 수천 개의 시스템들이 존재합니다.
그리고 하나의 시스템 안에는 예를 들어서 RDB로 따지게 되면 수천 개의 테이블이 존재를 하게 되고 그 수천 개의 테이블 안에 수십만 개의 어떤 칼럼들이 존재를 하게 됩니다.
각자 중요한 정보들을 담고 있죠.

참석자 1 02:15
이 AI 에이전트가 이런 것들을 동작을 같이 한다고 했을 때 반대로 AI가 접근하기 이전에 여러분들이 그 데이터를 관리하거나 수정을 한다고 했을 때도 그 데이터를 특별한 어떤 담당자들 개발자 혹은 데이터 관리자가 아니라면은 그 데이터가 어떤 데이터인지 어디에 위치한지 그것들을 식별하기 어렵죠.
이러한 상태에서 AI 에이전트를 동작을 시킨다라는 것 자체는 굉장히 어려운 얘기입니다.
그럼 우리가 그냥 아주 쉬운 말로 AI 에이전트에게 너희가 어떤 일을 시킬 건데 니가 데이터를 찾아서 그 데이터가 품질에 맞는지 확인이 되지도 않은 상태에서 또 니가 접근할 수 있는지 없는지 그런 정보들 우리는 그걸 콘텍스트라고 부를 수 있을 것 같아요.

참석자 1 03:09
그런 컨텍스트라는 것들이 없는 상태에서 우리가 사실상 수많은 요새 AI 인프라도 얘기를 하고 있지만 AI 에이전트 정말 진정한 AI 에이전트를 여러분들의 어떤 업무에 적용을 시켜서 생산성을 높이자 라고 했을 때 그 AI 엔터가 쓸 수 있는 그 데이터는 과연 식별이 가능하냐 그리고 그 데이터들이 식별된 데이터들이 분류가 가능하고 이해가 가능하고 또 혹은 어떤 맥락의 데이터를 가질 수 있는지 그걸 판단할 수가 있느냐 이런 그런 판단을 할 수 있는 환경이 되어야지 AI가 그 데이터를 쓸 수 있는 AI 레드 데이터가 된다는 거죠.
AI 저희가 수많은 고객들을 만나서 얘기를 해보면 AI 에전트를 여러 가지 툴을 써서 만드는 경우도 있고요.
혹은 SI 형태의 어떤 인하우스 형태로 뭔가 개발을 하는 경우도 있습니다.

참석자 1 04:06
그러한 AI 에이전트들이 접근하는 데이터가 관리되고 있는 데이터가 맞나 품질이 확보된 데이터가 맞는가 그 AI 에이전트가 그 데이터를 썼을 때 그 데이터의 어떤 출처가 무엇인가라는 것들 서로 다른 AI 에이전트가 뭔가 동일한 데이터를 가져오는 것 같은데 서로 다른 답을 내놨을 때 어떤 것이 과연 맞는가 그리고 여러분들이 뭔가 아주 SI 형태로 AI 에이전트의 어떤 예를 들어서 TV 접속 정보를 하드 코드에 넣지 않는 한 뭔가 외부의 어떤 데이터의 관리 정책에 대해서 계속적으로 접속 정보를 바꾸고 있는 상태에서 AI 에이전트는 과연 그런 접속 정보를 또 어디서 얻어야 할 것인가 여러 가지 사실상 어떤 구현에 대해서 현실적인 문제에 부닥칠 수밖에 없습니다.

참석자 1 04:58
AR 에이전트를 예전에는 데이터를 소비하는 것들이 사람이었고 우리가 애플리케이션을 했다면 이거는 이제 데이터를 소비하는 주체가 AI라고 생각을 해본다면 AI 입장에서 내가 원하는 데이터가 과연 어디에 있는가 그 데이터가 품질이 맞는가 그리고 그 데이터가 내가 믿을 수 있는 데이터고 내가 접근 가능한 데이터입니다.
내가 이 데이터를 접근을 했을 때 누군가 어떤 컴플라이언스에 대응을 해주기 위해서 이것을 누군가가 기록을 해주는가라는 부분도 있을 수가 있겠죠.
결국은 기업 내에 수많은 데이터들은 아주 기업 내에 수많은 다양한 데이터의 저장소에 있는 데이터를 접근을 하게 될 건데 이 AI 에이전트의 어떤 정확도와 그리고 어떤 보안 준수가 가장 큰 두 마리 토끼라는 겁니다.
그래서 이러한 AI 에이전트가 데이터를 활용했을 때 내놓는 답들, 그러한 부분들이 정확한가 보안 준수를 할 수 있는가 이 두 마리 꼭지를 가지고 AR 레디 데이터를 준비를 해야 된다라고 볼 수 있을 것 같습니다.

참석자 1 06:08
지금 보시는 그림처럼 아주 그냥 아주 그냥 비포장 도로에 우리가 아무리 좋은 AI 모델이 있다 하더라도 데이터들이 준비가 되어 있지 않다면 그 AI는 성능을 제대로 발휘를 할 수가 없겠죠.
그래서 우리는 AI가 잘 작동할 수 있는 좋은 환경 그중에 하나가 원 오브 데이 데이터인 겁니다.
이 데이터들을 잘 마련해줘서 AI가 잘 동작할 수 있도록 해줘야 되는데 우리의 현실은 그렇습니다.
예를 들어서 어떤 보안 문제로 인해서 어떤 클라우드가 접근이 불가능한 온프레미스, 또 20년 30년 전에 개발됐던 레거시 시스템 그리고 수많은 분산돼 있는 여러 가지 데이터 데이터 사일로에 이런 것들이고요.

참석자 1 06:50
하나의 시스템 내에서도 도대체 이 테이블이 무엇을 의미하는지, 칼럼이 무엇을 의미하는지 이거 자체를 또 모르고 있는 데이터에 대한 식별 문제, 그리고 데이터의 어떤 품질이 일관성을 가지지 않고 이러한 부분들, 품질에 대한 부분들, 우리가 가지고 있는 그런 부분이라는 우리가 조금 더 과거로 보게 되면 AI가 데이터를 소비하는 이전에 우리가 기존의 시스템의 어떤 연속성 신뢰성을 확보를 하기 위해서 우리가 데이터 관리를 했었었죠.
그때 가장 많이 썼던 방법이 데이터 거버넌스입니다.
데이터 거버넌스에서는 소위 말해서 다양한 종류의 메타 데이터를 관리를 했죠.
예를 들어서 데이터의 표준이 무엇이고 데이터의 식별 데이터가 무엇이고 데이터의 어떤 모델이 어떻고 데이터의 품질 구축이 됐어 이런 부분들을 관리를 하고 있었습니다.

참석자 1 07:45
하지만 우리가 예전에 전통적인 데이터 관리를 하기 위해서 만들었던 관리를 했던 이러한 메타 데이터 자체가 AI한테는 데이터를 식별하고 이해하고 맥락을 이해할 수 있는 중요한 원천이 되는 겁니다.
그런데 이제 혹자는 또 그런 얘기를 합니다. 저러한 메타 데이터 만드는 것조차도 수많은 사람들이 인력에 의해서 시간과 비용을 들여서 많은 어떤 부담이 생깁니다 라고 얘기를 하죠.
하지만 이제는 저런 어떤 메타 데이터를 여러분들이 가지고 있는 아주 오래된 시스템에도 불구하고 여러분들이 가지고 있는 다양한 종류의 데이터들을 실제적으로 식별 가능한 메타 데이터까지 끌어당기는 그런 또 AI 기반의 자동화도 이미 나왔죠.
그런 부분은 상당수는 모를 수도 있을 것 같은데 그런 부분들은 이미 나왔습니다.

참석자 1 08:37
그러면 우리가 저 메타 데이터라는 것이 AI가 데이터를 소비하기 위한 굉장히 중요한 어떤 자원인데 즉 메타 데이터를 또 만들었던 그 과정도 이제는 또 AI를 통해서 AI 데이터를 위한 좋은 환경을 만들어 갈 수가 있네라고 볼 수가 있겠죠.
그렇다면 내가 뭔가 AI가 데이터를 소비를 하기 위해서 갈 수 있었던 그 상황에 대해서 메타 데이터가 중요한 어떤 하나의 꼭지가 되었다면 이제는 이제는 산업이 사실상 표준이 되고 있는 AI가 데이터를 소비하는 과정들 데이터를 탐색하여 가는 과정에 MCP 클로드가 내놨죠.
클로드가 내놨던 그 MCP가 사실상 산업계의 표준이 되고 어떤 에이전트든지 만들었을 때 그 에이전트들이 표준된 인터페이스로 내가 원하는 데이터를 찾고 접근할 수 있는 방법을 제시하는 인터페이스가 MCP라는 겁니다.
그러면 지금까지 조합 자체가 내가 AR 레디 데이터를 위해서 메타 데이터라는 것이 굉장히 중요하고 메타 데이터와 MCP와의 어떤 결합들이 나오게 되는 것들이죠.

참석자 1 09:46
당연히 여러분들이 가지고 있는 다양한 데이터들을 어떤 이제 AI까지 어떤 전이를 위해서 당연히 여러분들이 가지고 있는 어떤 분산된 어떤 DB라든가 파일 이런 것들을 소위 말해서 인벤토리화를 먼저 합니다.
그리고 나서 이 데이터들이 정말 품질적으로 좀 확보를 할 수 있는 그 프로세스를 좀 거칠 거고요.
그리고 이 데이터들이 누구든지 접근할 수 있는 또 누가 어떻게 통제가 돼야 되는지 어떤 보안 정책에 대한 것들을 레벨을 쌓고 그다음에 이렇게 확보된 메타 데이터를 가지고 MCP를 통해서 AI로 가져가는 그런 과정들을 이러한 과정들을 여러분들께 쉽게 만들 수 있을 것 같습니다.

참석자 1 10:30
그러면 이러한 메타 데이터와 MCP와의 어떤 결합은 결합은 여러분들이 쉽게 상상할 수 있듯이 결국은 이 데이터를 활용할 수 있는 AI 에이전트 입장에서는 정확도의 향상 또 컴플라이언스에 대한 준수 당연히 업무 자동화가 될 것 같고요.
투자 위험 여러분들 AI 어떤 프로젝트를 진행하면서 지금도 굉장히 많이 실패를 하고 계시는데 근본적으로 저런 어떤 체계를 조금 더 저희가 정비를 해서 가져간다면 AI 어떤 프로젝트에 대한 어떤 성공으로 더 많은 히트율을 높일 수 있지 않을까 그렇게 생각을 하고 있습니다.
그런데 알겠어 메타 데이터와 MC파의 결합 굉장히 좋은 얘기 같고 그냥 의미 있는 얘기 같아 그럼 또 다른 데 AI l 데이터를 다룬 데가 많다 보니까 또 다른 사례들도 잠깐 좀 보도록 할게요.
첫 번째 여러분들 이제 데이터 패브릭 굉장히 이제 분산돼 있는 데이터들을 한쪽으로 모으는 현상입니다.

참석자 1 11:32
데이터 레이크하고 비슷한 개념일 수도 있어 이렇게 이제 데이터 패브릭으로 이제 데이터를 한쪽으로 이제 몰아놓고 나서 이 데이터들을 AI한테 소비의 어떤 주체로 만드는 겁니다.
그렇게 돼버리면은 이제 데이터 패브리가 어떤 어떤 기술을 가진 기업이라든가 어떤 어떤 솔루션 벤더들이 이러한 형태로 많이 제시를 하게 됩니다.
어떻게 보면 여러분들이 쉽게 접하고 있는 이제 스노 플래크라든가 데이터 브릭스도 이런 어떤 하나의 또 원오브뎀의 어떤 전략이라고 볼 수 있을 것 같아요.
그런데 문제는 그 비용입니다. 비용입니다. 그리고 더 나아가서 원본 데이터가 굉장히 식별이 되지 않은 상태에서 이렇게 데이터 패브릭을 또 쉽게 만들기에는 굉장히 어렵죠.

참석자 1 12:12
우리가 불과 2~3년 전만 뒤로 와서 우리가 DT 시절에 뭔가 데이터 링크 너도 나도 막 만든다고 했을 때 원본에 있는 데이터 분산돼 있는 원본 데이터들을 이렇게 옮기는 것조차도 식별이 쉽지 않아서 옮기기 조차도 쉽지 않았기 때문에 이 데이터 패브릭이라는 전략은 좋은 전략이긴 하지만 여전히 그런 문제를 동일하게 안고 있습니다.
또 다른 각도로 볼 수 있는 것이 데이터의 어떤 매입니다.
이것은 데이터 패블릿과 다르지는 않습니다. 물론 이런 거 자체가 하나의 데이터의 어떤 오너 형태로 어떤 예를 들어서 부서 형태 데이터의 어떤 주체 형태로 데이터를 나눠서 접근했고 각자가 원하는 어떤 AI 레디 데이터를 이제 별도로 만들어버리는 이제 그런 전략을 폈었었죠.
그다음에 요새 이제 많이 뜨고 있는 것이 이제 날리지 그래프입니다.

참석자 1 12:58
여러분들 잘 아시겠지만 데이터 페이 됐든 데이터 매시가 됐든 아니면 원본의 어떤 정형 데이터가 됐든 그런 데이터들은 개발자들 혹은 어떤 시스템 관리자들이 잘 알 수 있는 데이터를 알고 있습니다.
즉 하지만은 일반 소비자들이 봤을 때 그러니까 담당자가 아닌 다른 사람이 봤을 때 도대체 이게 무슨 테이블인가 무슨 칼럼인가를 모르죠.
암묵적인 관계를 갖고 있다는 거 근데 이거에 관해서 이 데이터들을 그냥 한눈에 봐서 알 수 있도록 해놓은 것이 일종의 난리지 그래프 즉 노드와 엣지를 연결해서 만들어놓은 것이 일종의 난리지 그래프고요.
요새는 네오포지와 같은 그런 어떤 그래프 리뷰를 형태를 통해서 내가 가지고 있는 데이터들을 이렇게 난리지 그래프로 만들어서 AI로 연결하는 그런 또 시도들도 굉장히 많습니다.

참석자 1 13:46
그렇게 돼버리면 우리가 제가 지금까지 얘기했던 것처럼 그럼 원본에 내가 여러 가지 다양한 어떤 분산돼 있는 데이터 셋들이 있지만 데이터 셋들이 있지만 그러한 데이터들을 가지고 내가 직접적으로 메타 데이터를 연결을 해서 그다음에 MCP를 연결하는 기법도 있었겠지만 더 나아가서 지금 우리가 옆에 다른 사례들을 보게 되면은 뭔가 데이터 백으로 이렇게 연결을 하거나 데이터 메쉬 혹은 여러 가지 액티브 메타 데이터를 연결하는 그런 정보들도 가지고 있죠.
그런데 그런데 우리가 가만히 생각을 해야 되는 게 저도 그렇고 여러분들도 그렇고 비용이라는 것이 한계가 있습니다.
여러분도 비용의 한계 시간의 한계라는 것이 분명히 있죠.
데이터 패블릭은 어떤 경우는 굉장히 좋습니다. 데이터 매치도 좋고요.
날리지 그래프도 좋고 그런 것들이 없이 난 바로 메타 데이터를 MCP로 연결하겠다.
이것도 굉장히 좋은 전략 중에 하나입니다.

참석자 1 14:39
다만 다만 데이터 패브릭이라든가 어떤 데이터 메쉬 같은 경우는 원본의 데이터들이 굉장히 방대한 경우에 그 모든 데이터들을 내가 메시로 만들겠다 혹은 데이터 패브릭으로 만들겠다 이런 거 자체가 비용에 대한 부담들 또 실패에 대한 부담들이 분명히 있기 때문에 가장 첫 번째 단계는 여러분들이 가지고 있는 원본에 대해서 메타 데이터를 먼저 확보를 하는 겁니다.
메타 데이터를 확보를 하는 방법에 대해서 AI로 자동화할 수 있는 방법도 있다고 제가 말씀드렸고요.
이 메타 데이터를 확보를 해서 그다음에 MCP로 연결하는 것이 첫 번째 더 나아가서 그러면 내가 특정한 주제에 뭔가 조금 더 스페셜라이즈하게 뭔가 AI를 연결하겠다 그런 경우에는 내가 필요 시에 특정한 도메인별로 데이터 빼버리는 거지 데이터 메시를 만들든지 난리지 그래프를 만들어서 그렇게 해서 조금 더 더 심화된 AR 레디데이트를 만들어주겠다라는 부분 하시면 좋을 것 같습니다.

참석자 1 15:30
그다음에 이제 데이터를 뭔가 원천에서 변하는 데이터를 내가 이쪽으로 이제 계속 동기화하는 것들은 또 다른 얘기지만 그것도 전체적으로 비용에 대한 부분들 ROI를 충분히 좀 고민을 해서 진행할 필요가 있다라는 겁니다.
그래서 우리가 단계적인 접근을 좀 볼 수가 있을 것 같은데 첫 번째 같은 경우는 뭔가 이제 메타 데이터 여러분들이 가지고 있는 데이터에 대해서 인벤토리 표준 품질 보안 이런 부분들을 먼저 해서 메타 데이터의 관리로 인해서 ARA 데이터를 먼저 가져갈 수 있는 방법을 첫 번째 그다음에 두 번째 아까 그러면 내가 이제 메타 데이터 패브릭을 다 같이 포함하는 얘기입니다.
그런 부분들이 있었을 때 결국은 데이터 소비자가 지금 이제 AI죠 AI죠 이제 애플리케이션이 아니나 어떤 사람이 아닌 이제 AI로 넘어가는 겁니다.

참석자 1 16:20
AI가 이 데이터를 소비하기 위한 그 방안 자체로 여러 가지 AI 에이전트를 만드실 건데 이 AI 에이전트도 실제적으로 여러분들이 이나운스 형태로 직접적으로 뭔가 하드 코딩해서 개발할 수도 있겠지만 뭔가 플랫폼을 통해서 m8l이라든지 또 엔코아의 뭔가 aipp라든지 그런 솔루션을 또 통해서 이렇게 만들 수 있는 그런 오케스트레이션 그다음 이제 두 번째 단계 세 번째 단계가 여러분들이 그렇게 하나의 데이터 부분과 AI 레디 데이터와 그리고 AI 에이전트 영역들이 같이 이제 콜라보가 됐을 때 클로바가 됐을 때 조금 더 AR 레게이트를 조금 더 고도화를 하자 그때는 뭔가 도메인 스페시픽하게 데이터 백업이라든가 데이터 매쉬 이런 부분들을 같이 좀 고민을 해서 조금 더 고도화해 나가는 그런 방법이 좋지 않을까 싶습니다.
제가 좀 빨리 왔는데요. 빨리왔는데 여러분들이 하나의 상상을 해보면 상상을 해보면 여러분들이 수많은 어떤 시스템들을 관리를 하고 있다.

참석자 1 17:25
데이터의 담당자일 수도 있고요. 또 혹은 내가 aix를 가고자 하는 aix의 담당자일 수도 있습니다.
이제 그러한 부분을 가져간다고 했을 때 그렇다면은 AI가 다시 한 번 말씀드리지만 AI가 데이터의 소비자입니다.
그럼 데이터들은 품질이 좋아야겠죠 식별이 좋아야 됩니다.
이해가 돼야 됩니다. 그래서 그걸 하기 위해서 가장 좋은 방법은 제가 전통적으로 이미 내려왔던 데이터 거버넌스 메타 데이터 관리가 가장 최적의 방법일 것 같아요.
글을 통해서 먼저 AI가 써야 될 데이터의 재료 이것들을 품질을 확보를 하고 MCP로 연결을 해 주는 겁니다.
그러면은 내가 메타 데이터 4 AI라는 이제 두 마리 토끼 그런 부분들을 가져갈 수가 있겠죠.
이제 지금 보시는 그림처럼 여러분들이 가지고 있는 다양한 저장소 오라클 포스그램 요샌 클라우드 리소스까지 많이 쓰죠.
다양한 환경에 어떤 다양한 타입의 고 적용 데이터 타입이 있습니다.
그리고 여러분들이 가지고 있는 업무 문서들 이런 부분들이 있죠.

참석자 1 18:29
부분들이 있는데 이러한 데이터들을 내가 이제 메타 데이터를 관리를 하는 거 물론 정형 데이터와 비정형 데이터들은 데이터의 어떤 기술적인 특성 때문에 메타 데이터를 관리하는 수준들이 분명히 다를 수밖에 없어요.
하지만 이런 어떤 메타 데이터를 이제 관리를 하게 될 건데 예전에는 이러한 데이터를 메타 데이터까지 올리는 데도 굉장히 어려웠어요.
사람이 일일이 어떤 표준이라든가 모델을 다 관리를 해야 되기 때문에 하지만 요새는 데이터의 어떤 모델이라든가 표준화 모든 품질 규칙까지 마련하는 AI 에이전트까지 나오고 있습니다.
나오고 있기 때문에 여러분들이 가지고 있는 이미 가지고 있는 이 데이터에 대해서 뭔가 자동화로 메타 데이터까지 먼저 끌어당기고 이렇게 끌어당기게 되면은 당연히 이제 전통적인 데이터 관리 이때는 이제 사람이 개입을 하겠죠.
내가 품질도 관리하고 표준도 관리하고 데이터 구조 변경에 대한 승인도 관리를 할 거예요.

참석자 1 19:24
이런 전통적인 데이터 관리 부분들은 여전히 동작을 할 거고 이거에 대한 역할 자체가 이제는 또 메타 데이터 AI 라이브 쪽으로 즉 AI 에이전트가 내가 어떠한 동작을 하기 위해서 동작을 하기 위해서 내가 필요한 데이터가 어디에 있는지 그리고 그 품질은 맞는지 그 데이터의 출처는 어디서 오는 건지 그리고 내가 그 데이터를 접속하기 위한 정보가 어디 있는지 이거를 관리가 되기 시작을 한다면 AI가 조금 더 더 정확도에 대한 향상과 보안 준수를 하기 위한 아주 필수적인 기반이 되지 않을까 싶습니다.
네 고맙습니다.

clovanote.naver.com

댓글

첫 번째 댓글을 남겨보세요.