PARA/03_Resources/R001_개발_레퍼런스(참고문서)/AI 강의/AI Readable 데이터와 활용 체계 (SKT).md

AI Readable 데이터와 활용 체계 (SKT)

2025년 11월 4일

요약

발표자 배경 및 문제의식 (01:12-03:06)

발표자의 경력

개인정보 담당자 → 데이터 서비스 기획/운영

개인정보 보호와 데이터 활용의 균형 고민
현장에서 직접 실행하며 시행착오 경험

데이터의 역설

문제 인식

"데이터는 가치 있다고 생각했는데..."

시장에서 데이터 가치가 인정받지 못하는 경우 多
왜일까?

깨달음

데이터 ≠ 금 (본원적 가치 없음)

누가, 어떤 목적으로, 어떻게 쓰느냐에 따라 가치 결정
사용 방식에 따라 가치 천차만별

"데이터 = 21세기 원유" 비유의 이해

원유의 특성

원유 자체는 쓸모없음

최종 소비자에게 원유 줘도 사용 불가
정제 → 석유화학 제품 → 소비재 (의류, 페트병 등)
많은 사람이 옷이 원유에서 나온 줄 모름

데이터도 마찬가지

정제와 가공이 핵심

원유(데이터) → 정제 필요
석유화학 제품 → 중간재 생산
소비재 → 최종 사용자에게 전달

→ 각 단계의 가공이 있어야 가치 창출

1. 기존 방식의 한계 (03:06-04:57)

전통적 데이터 상품 개발 프로세스

문제점

데이터 분석가가 유스케이스 상상
- 고객 니즈와 간격 큼
- 실제 요구사항과 불일치
딜리버리 시간 과다
- 개발 → 테스트 → 배포
- 고객 대응 느림
결과
- 데이터 가치 체감 어려움
- 시장에서 인정받지 못함

게임 체인저: LLM의 등장

AI 모델 (LLM) = 게임 체인저

역할 변화

과거:

데이터 조직 = 분석 + 상품화 + 딜리버리

현재:

AI 에이전트/LLM = 최종 상품 딜리버리
고객 요구사항에 맞춰 실시간 제품 생성
데이터 조직 = AI가 잘 일하도록 데이터 선별/전달

→ 역할이 완전히 바뀜

2. 시행착오 1: 도메인 특화 모델의 한계 (04:57-05:56)

많은 기업의 시도

도메인 특화 모델 학습

전문가가 데이터 만들기
LLM 모델 학습시키기
특화된 모델 공급

문제점

기존 프로세스와 차이 없음

딜리버리 시간 여전히 오래 걸림
비용 많이 듦
유연성 부족

발표자의 접근

추론 단계에서 데이터 활용

학습이 아닌 추론 시점에 데이터 제공
더 빠르고 유연함

타이밍의 행운

2024년 핵심 기술 등장

MCP (Model Context Protocol)
Claude Skills
A2A (Agent-to-Agent)
RAG 기술 발전

→ 추론 단계 데이터 활용 가능해짐

결론

범용 LLM + 좋은 데이터 = 도메인 특화 LLM 수준

3. 시행착오 2: 위키 형태 데이터 (05:56-07:43)

통신사의 강점

개인정보의 보고

가장 긴 컨텍스트/맥락 데이터 보유
서비스 구애 없이 통합 데이터
데이터 기업 중 최강자

가설: LLM은 위키를 좋아한다

근거

LLM 학습 데이터

나무위키, 위키피디아 등 위키 형태 대량 사용
양질의 학습 데이터 확보 위해

추측

"위키 형태 데이터를 LLM이 가장 잘 이해하고 활용할 것"

실험: 박찬호 테스트

질문: "박찬호 선수의 경력을 표로 정리해줘"

결과:

Claude, ChatGPT 모두 잘 작동
RAG 추론 근거 확인 시 → 나무위키, 위키피디아

→ 가설 확인!

데이터 구조 변경

기존: 스코어 기반 데이터 변경: 위키 형태 문서

위상과 체계를 가진 구조
개인 간 관계도 링크로 연결
위키피디아 스타일 구조화

적용 사례

퍼스널 AI 에이전트 서비스

개인 맞춤형 서비스 제공
100~200명 규모에서 잘 작동

결정적 단점: 스케일 문제

문제 발생

소규모 (100~200명): ✅ 잘 작동 대규모 (10만~1000만 명): ❌ 문제 발생

원인:

데이터 양이 어마어마하게 증가
유스케이스가 나오지 않음
집계/분석 불가능

한계:

퍼스널 서비스에만 유용
유스케이스 너무 제한적
훌륭하지만 활용도 낮음

4. 시행착오 3: 벡터 DB & 지식 그래프 (07:43-08:36)

새로운 시도

벡터 DB + 지식 그래프

개인 프로파일 검색 최적화
다른 발표에서도 많이 소개된 방법

기대

"이번엔 검색이 잘 되겠지!"

실제 결과

한계 발견

잘 되는 데이터 도메인 있음
개인 프로파일은 안 맞음

왜 안 될까?

실험: 청중 테스트

질문 1: "나중에 QnA에서 손 들어보세요" → 거의 손 안 듦

질문 2: "Claude Skills 써보신 분?" → 거의 손 안 듦

이유:

"우리나라 사람들 대부분 샤이하거든요"

문제점

프로파일이 비슷비슷함

특성이 두드러지지 않음
검색으로 필요한 데이터 잘 안 나옴
차별화된 데이터 추출 어려움

→ 벡터 검색도 실패

5. 해결책: MCP (Model Context Protocol) (08:36-10:01)

전환점

팀원의 제안: "MCP 적용해보면 어떨까?" 결과:

"핏이 제일 잘 맞았어요!"

MCP의 3가지 핵심 특징

1. 표준화된 프로토콜

장점: 중복 개발 불필요

한 번 만들면 어디서나 사용
다양한 AI 에이전트와 호환

2. AI 모델 컨텍스트 반영

임팩트가 가장 컸던 부분

LLM 추론 시 적절한 맥락 제공
정확도 대폭 향상

3. 다양한 데이터 조합 가능

유연성

필요한 데이터 선별
조합해서 사용
고객에게 최적화된 딜리버리

MCP의 혁명적 변화

과거:

고객 요구사항 1개 = 분석가 1명 필요
결과물 1회용
재사용 불가

현재 (MCP):

한 번 만든 MCP = 모든 곳에서 사용
Claude 사용자 ✅
Cursor 사용자 ✅
사내 AI 에이전트 ✅
다양한 유스케이스에 조합 가능 ✅

→ 재사용성 극대화

6. AI Readable 데이터의 조건 (10:01-11:49)

현장에서 체득한 요건

이론이 아닌 실전 경험

1. 신뢰할 수 있는 품질

데이터 선별이 핵심

중요한 깨달음:

"AI 시대에도 데이터 분석가/엔지니어 역할은 사라지지 않는다"

역할 변화:

과거: 분석 + 상품화 + 딜리버리
현재: 신뢰할 수 있는 좋은 데이터 선별 + 공급

→ 공급자로 역할 전환

2. 최신성 담보

추론용 데이터의 핵심

논리:

과거 데이터 = 학습에 사용
최신 데이터 = 추론에 사용
과거 데이터로 추론? → 차라리 학습시키기

장점:

실시간성
현재 상황 반영
경쟁 우위

3. 상세하고 구조화된 명세

LLM이 알아서 선택하도록

필요 요소:

디테일한 설명
다양한 도메인 커버
명확한 구조

문제점:

설명 부실 → LLM 헤맴
특정 도메인 누락 → 업무 수행 실패

4. 액션 가능한 결과

최종 목표

분석으로 끝나면 안 됨
실제 행동으로 연결되어야

결론

범용 LLM + AI Readable 데이터 = 도메인 특화 LLM

맥락과 의미 파악 가능
특화된 도메인 역할 수행

7. 기존 vs 현재 프로세스 비교 (11:49-13:45)

기존 프로세스

1단계: 데이터 수집

SKT 보유 데이터

위치 데이터
통화 데이터
앱 이용 데이터

2단계: 후보 도메인 선정

산업 조사
기업 인터뷰
고객사 요청

3단계: API 상품 개발

데이터 상품화
API로 제공

4단계: 피드백 & 개선

사용 후 피드백
반영 → 재개발
루프 반복

영업 구조

1대 1 영업

영업사원 필요
개별 대응
API 형태 판매

기존 방식의 한계

문제 1: 고객이 모름

"고객이 본인 요구사항을 잘 몰라요"

데이터를 어떻게 써야 할지
무엇을 요청해야 할지

문제 2: 개발자 필수

API 사용 = 개발자 필요

기획자/마케터는 사용 어려움
GPTS에 API 연결도 어려움
데이터 가치 측정 전에 허들

→ 데이터 가치 체감 불가

기존 유스케이스 예시

서울교통공사 지하철 혼잡도

열차 혼잡도 안내
앱 서비스
전광판 안내
종합 안내판

공통점: 모두 개발자 필요

MCP 적용 후 변화

혁명적 개선

MCP로 도메인별 데이터 제공

고객 질의에 자동 대응
MCP가 자동으로 조합
대답 경우의 수 폭발적 증가

결과:

"저희도 상상 못한 유스케이스들이 마구 나옵니다"

기존 유스케이스도 해결

지역 축제 방문객 분석

가장 많이 구매하는 데이터 상품
유동인구 통계
방문객 분석

새로운 유스케이스:

방문객 정보로 다양한 분석
예상 못한 활용 사례 속출

→ 활용도 극대화

8. 사내 적용 및 검증 (13:45-15:10)

단계적 접근 전략

왜 사내부터?

경험 부족 문제

보안 처리
접근 인증/인가
외부 출시 전 검증 필요

목표:

활용도 확인
문제점 발견
해결 방법 마련

사내 MCP 데이터 구축

구축한 데이터 종류

구매 데이터: 고객 구매 이력
상담 데이터: 고객 상담 내역
프로파일: 개인 정보
통계 데이터:
- 지하철 혼잡도
- 장소 혼잡도
- 음식점 인기도
- 학원 인기도
- 통화 기반 통계
- 위치 기반 통계
- 앱 방문 기반 통계

연동 AI 에이전트

A. (에이다): SKT AI 서비스
폴라리스 AI: 사내 서비스
기타 다양한 AI 에이전트

→ 다양한 서비스에서 활용 가능

서비스 구조

3단계 아키텍처

MCP 카탈로그
- 사용 가능한 MCP 목록
에이전트 서비스
- 카탈로그의 MCP 조합
- 불러서 사용
워크플로우 빌더
- 에이전트를 다시 조합
- 복잡한 워크플로우 구성

→ 계층적이고 유연한 구조

9. 실제 활용 사례 1: 축제 분석 (15:10-18:19)

기존 방식: 축제 분석

지자체의 요구사항

데모그래픽 분석

성별 분포
연령 분포
지역별 방문자
피크 타임
총 방문객 수
다른 축제와 비교
작년 대비 비교

문제점:

복잡한 분석 요청
전문가 필요
시간 많이 걸림

MCP 방식: 축제 분석

구현 과정

1단계: MCP 생성

방문객 수 통계 MCP
장소 잡기 MCP

2단계: 스킬 생성

Claude에 요청: "축제 분석 스킬 만들어줘"
발표자가 직접 프롬프트 작성 안 함
Claude가 더 잘 만듦!

3단계: 분석 요청

"송파 석촌호수 벚꽃축제와 여의도 벚꽃축제를 비교해줘"

기존 퍼즐지도 서비스의 한계

서비스 기획자의 의도와 불일치

최근 30일 데이터만 제공
축제 기간 데이터 보고 싶은데...
다른 기간 보려면? → API 구매하라고 나옴
포기!

MCP + Claude Skills 결과

놀라운 성과

전문가 수준 리포트 자동 생성

실제 데이터 기반
전문가가 만든 수준
즉시 생성

가장 마음에 들었던 점

유연한 수정 가능

기존 프로세스:

보고서 받음
수정 필요 발견
SK텔레콤 영업사원 연락
"비용 얼마 더 드릴게요"
"2주 기다려주세요"
분석가 작업
딜리버리

MCP 프로세스:

"페르소나 3개 말고 6개로 만들어줘"
즉시 업데이트
스킬 자동 수정

→ 실시간 대응 가능!

데모 사이트

실제 작동 예시 제공

링크로 확인 가능
직접 돌려볼 수는 없지만
예시로 도움됨

10. 실제 활용 사례 2: 페르소나 생성 (18:19-18:55)

요금제 설계 시나리오

필요성

새 요금제 출시 전 검증

영 고객 타겟 요금제
시장 반응 예측 필요

기존 방식

설문 조사 진행
시간과 비용 소요
표본 한계

MCP 활용

프로세스

고객 프로파일 데이터 MCP 활용

페르소나 자동 생성
가상 설문 실시
반응 예측

대상 사용자

요금제 기획자
마케터

효과

빠른 검증

실제 출시 전 테스트
수정 사항 미리 파악
실패 위험 감소

11. 실제 활용 사례 3: 세일즈 프로모션 분석 (18:55-20:11)

비즈니스 도메인 활용

"돈이 될 만한 걸 고민해보자"

배경: 신규 단말 출시

기존 프로세스

아이폰/갤럭시 신규 출시

사전 예약 프로모션
실적 대시보드로 관리
지역 마케터/팀/본부에서 확인

기존 대시보드의 문제

문제 1: 니즈 불일치

어떤 팀: 대시보드 잘 활용 ✅ 다른 팀: 대시보드 안 맞음 ❌

문제 2: 엑셀로 회귀

대시보드 못 쓰는 팀의 해결책

영업 전산 시스템에서 데이터 다운로드
엑셀로 수작업 관리

결론:

"대시보드를 아무리 잘 만들어도 니즈 안 맞으면 못 쓰신다"

MCP 솔루션

구현

기본 대시보드 포맷 + MCP

대리점 실적 데이터 MCP
신규 구매 데이터 MCP
기타 필요 데이터 MCP

사용 방식

질문으로 대시보드 변경

기본 대시보드 제공
사용자가 질문 입력
보고서가 자동으로 변경
원하는 형태로 커스터마이징

효과

유연한 대응

다양한 유스케이스 대응
개인별 맞춤 대시보드
엑셀 작업 불필요

→ 모든 팀이 활용 가능

전체 요약

데이터 가치 실현의 여정

출발점: 문제 인식

데이터 ≠ 금 (본원적 가치 없음)

사용 방식에 따라 가치 결정
원유처럼 정제 필요

게임 체인저: LLM

역할 대전환

AI가 최종 상품 딜리버리
데이터 조직은 공급자로

시행착오와 학습

시도 1: 도메인 특화 모델

❌ 시간과 비용 과다
❌ 기존 방식과 차이 없음

시도 2: 위키 형태 데이터

✅ 소규모에서 작동
❌ 스케일 문제 (대규모 불가)

시도 3: 벡터 DB & 지식 그래프

❌ 개인 프로파일에 부적합
❌ 차별화 어려움

성공: MCP

✅ 표준화
✅ 컨텍스트 반영
✅ 데이터 조합
✅ 재사용성

AI Readable 데이터 4대 조건

✅ 신뢰할 수 있는 품질
✅ 최신성 담보
✅ 상세하고 구조화된 명세
✅ 액션 가능한 결과

실제 성과

축제 분석

전문가 수준 리포트 자동 생성
실시간 수정 가능
2주 → 즉시

요금제 설계

페르소나 자동 생성
가상 설문 실시
빠른 검증

세일즈 분석

유연한 대시보드
개인별 맞춤화
엑셀 작업 불필요

핵심 인사이트

데이터 조직의 미래

사라지지 않는다, 진화한다

과거: 분석 + 개발 + 딜리버리
현재: 품질 좋은 데이터 선별 + 공급

성공 공식

범용 LLM + AI Readable 데이터 = 도메인 특화 LLM

MCP의 혁명

1회용 → 재사용

한 번 만들면 어디서나
조합해서 새로운 가치
상상 못한 유스케이스 속출

발표자의 메시지

"데이터는 원유입니다. 정제하고 가공해야 가치를 발합니다. MCP는 그 정제 과정을 표준화하고, AI는 최종 소비자에게 맞춤형 제품을 즉시 전달합니다."

결론: AI 시대에 데이터 조직은 사라지는 게 아니라, 더 중요한 역할(공급자)로 진화한다!