AI Readable 데이터와 활용 체계 (SKT)
요약
발표자 배경 및 문제의식 (01:12-03:06)
발표자의 경력
개인정보 담당자 → 데이터 서비스 기획/운영
- 개인정보 보호와 데이터 활용의 균형 고민
- 현장에서 직접 실행하며 시행착오 경험
데이터의 역설
문제 인식
"데이터는 가치 있다고 생각했는데..."
- 시장에서 데이터 가치가 인정받지 못하는 경우 多
- 왜일까?
깨달음
데이터 ≠ 금 (본원적 가치 없음)
- 누가, 어떤 목적으로, 어떻게 쓰느냐에 따라 가치 결정
- 사용 방식에 따라 가치 천차만별
"데이터 = 21세기 원유" 비유의 이해
원유의 특성
원유 자체는 쓸모없음
- 최종 소비자에게 원유 줘도 사용 불가
- 정제 → 석유화학 제품 → 소비재 (의류, 페트병 등)
- 많은 사람이 옷이 원유에서 나온 줄 모름
데이터도 마찬가지
정제와 가공이 핵심
- 원유(데이터) → 정제 필요
- 석유화학 제품 → 중간재 생산
- 소비재 → 최종 사용자에게 전달
→ 각 단계의 가공이 있어야 가치 창출
1. 기존 방식의 한계 (03:06-04:57)
전통적 데이터 상품 개발 프로세스
문제점
-
데이터 분석가가 유스케이스 상상
- 고객 니즈와 간격 큼
- 실제 요구사항과 불일치
-
딜리버리 시간 과다
- 개발 → 테스트 → 배포
- 고객 대응 느림
-
결과
- 데이터 가치 체감 어려움
- 시장에서 인정받지 못함
게임 체인저: LLM의 등장
AI 모델 (LLM) = 게임 체인저
역할 변화
과거:
- 데이터 조직 = 분석 + 상품화 + 딜리버리
현재:
- AI 에이전트/LLM = 최종 상품 딜리버리
- 고객 요구사항에 맞춰 실시간 제품 생성
- 데이터 조직 = AI가 잘 일하도록 데이터 선별/전달
→ 역할이 완전히 바뀜
2. 시행착오 1: 도메인 특화 모델의 한계 (04:57-05:56)
많은 기업의 시도
도메인 특화 모델 학습
- 전문가가 데이터 만들기
- LLM 모델 학습시키기
- 특화된 모델 공급
문제점
기존 프로세스와 차이 없음
- 딜리버리 시간 여전히 오래 걸림
- 비용 많이 듦
- 유연성 부족
발표자의 접근
추론 단계에서 데이터 활용
- 학습이 아닌 추론 시점에 데이터 제공
- 더 빠르고 유연함
타이밍의 행운
2024년 핵심 기술 등장
- MCP (Model Context Protocol)
- Claude Skills
- A2A (Agent-to-Agent)
- RAG 기술 발전
→ 추론 단계 데이터 활용 가능해짐
결론
범용 LLM + 좋은 데이터 = 도메인 특화 LLM 수준
3. 시행착오 2: 위키 형태 데이터 (05:56-07:43)
통신사의 강점
개인정보의 보고
- 가장 긴 컨텍스트/맥락 데이터 보유
- 서비스 구애 없이 통합 데이터
- 데이터 기업 중 최강자
가설: LLM은 위키를 좋아한다
근거
LLM 학습 데이터
- 나무위키, 위키피디아 등 위키 형태 대량 사용
- 양질의 학습 데이터 확보 위해
추측
"위키 형태 데이터를 LLM이 가장 잘 이해하고 활용할 것"
실험: 박찬호 테스트
질문: "박찬호 선수의 경력을 표로 정리해줘"
결과:
- Claude, ChatGPT 모두 잘 작동
- RAG 추론 근거 확인 시 → 나무위키, 위키피디아
→ 가설 확인!
데이터 구조 변경
기존: 스코어 기반 데이터 변경: 위키 형태 문서
- 위상과 체계를 가진 구조
- 개인 간 관계도 링크로 연결
- 위키피디아 스타일 구조화
적용 사례
퍼스널 AI 에이전트 서비스
- 개인 맞춤형 서비스 제공
- 100~200명 규모에서 잘 작동
결정적 단점: 스케일 문제
문제 발생
소규모 (100~200명): ✅ 잘 작동 대규모 (10만~1000만 명): ❌ 문제 발생
원인:
- 데이터 양이 어마어마하게 증가
- 유스케이스가 나오지 않음
- 집계/분석 불가능
한계:
- 퍼스널 서비스에만 유용
- 유스케이스 너무 제한적
- 훌륭하지만 활용도 낮음
4. 시행착오 3: 벡터 DB & 지식 그래프 (07:43-08:36)
새로운 시도
벡터 DB + 지식 그래프
- 개인 프로파일 검색 최적화
- 다른 발표에서도 많이 소개된 방법
기대
"이번엔 검색이 잘 되겠지!"
실제 결과
한계 발견
- 잘 되는 데이터 도메인 있음
- 개인 프로파일은 안 맞음
왜 안 될까?
실험: 청중 테스트
질문 1: "나중에 QnA에서 손 들어보세요" → 거의 손 안 듦
질문 2: "Claude Skills 써보신 분?" → 거의 손 안 듦
이유:
"우리나라 사람들 대부분 샤이하거든요"
문제점
프로파일이 비슷비슷함
- 특성이 두드러지지 않음
- 검색으로 필요한 데이터 잘 안 나옴
- 차별화된 데이터 추출 어려움
→ 벡터 검색도 실패
5. 해결책: MCP (Model Context Protocol) (08:36-10:01)
전환점
팀원의 제안: "MCP 적용해보면 어떨까?" 결과:
"핏이 제일 잘 맞았어요!"
MCP의 3가지 핵심 특징
1. 표준화된 프로토콜
장점: 중복 개발 불필요
- 한 번 만들면 어디서나 사용
- 다양한 AI 에이전트와 호환
2. AI 모델 컨텍스트 반영
임팩트가 가장 컸던 부분
- LLM 추론 시 적절한 맥락 제공
- 정확도 대폭 향상
3. 다양한 데이터 조합 가능
유연성
- 필요한 데이터 선별
- 조합해서 사용
- 고객에게 최적화된 딜리버리
MCP의 혁명적 변화
과거:
- 고객 요구사항 1개 = 분석가 1명 필요
- 결과물 1회용
- 재사용 불가
현재 (MCP):
- 한 번 만든 MCP = 모든 곳에서 사용
- Claude 사용자 ✅
- Cursor 사용자 ✅
- 사내 AI 에이전트 ✅
- 다양한 유스케이스에 조합 가능 ✅
→ 재사용성 극대화
6. AI Readable 데이터의 조건 (10:01-11:49)
현장에서 체득한 요건
이론이 아닌 실전 경험
1. 신뢰할 수 있는 품질
데이터 선별이 핵심
중요한 깨달음:
"AI 시대에도 데이터 분석가/엔지니어 역할은 사라지지 않는다"
역할 변화:
- 과거: 분석 + 상품화 + 딜리버리
- 현재: 신뢰할 수 있는 좋은 데이터 선별 + 공급
→ 공급자로 역할 전환
2. 최신성 담보
추론용 데이터의 핵심
논리:
- 과거 데이터 = 학습에 사용
- 최신 데이터 = 추론에 사용
- 과거 데이터로 추론? → 차라리 학습시키기
장점:
- 실시간성
- 현재 상황 반영
- 경쟁 우위
3. 상세하고 구조화된 명세
LLM이 알아서 선택하도록
필요 요소:
- 디테일한 설명
- 다양한 도메인 커버
- 명확한 구조
문제점:
- 설명 부실 → LLM 헤맴
- 특정 도메인 누락 → 업무 수행 실패
4. 액션 가능한 결과
최종 목표
- 분석으로 끝나면 안 됨
- 실제 행동으로 연결되어야
결론
범용 LLM + AI Readable 데이터 = 도메인 특화 LLM
- 맥락과 의미 파악 가능
- 특화된 도메인 역할 수행
7. 기존 vs 현재 프로세스 비교 (11:49-13:45)
기존 프로세스
1단계: 데이터 수집
SKT 보유 데이터
- 위치 데이터
- 통화 데이터
- 앱 이용 데이터
2단계: 후보 도메인 선정
- 산업 조사
- 기업 인터뷰
- 고객사 요청
3단계: API 상품 개발
- 데이터 상품화
- API로 제공
4단계: 피드백 & 개선
- 사용 후 피드백
- 반영 → 재개발
- 루프 반복
영업 구조
1대 1 영업
- 영업사원 필요
- 개별 대응
- API 형태 판매
기존 방식의 한계
문제 1: 고객이 모름
"고객이 본인 요구사항을 잘 몰라요"
- 데이터를 어떻게 써야 할지
- 무엇을 요청해야 할지
문제 2: 개발자 필수
API 사용 = 개발자 필요
- 기획자/마케터는 사용 어려움
- GPTS에 API 연결도 어려움
- 데이터 가치 측정 전에 허들
→ 데이터 가치 체감 불가
기존 유스케이스 예시
서울교통공사 지하철 혼잡도
- 열차 혼잡도 안내
- 앱 서비스
- 전광판 안내
- 종합 안내판
공통점: 모두 개발자 필요
MCP 적용 후 변화
혁명적 개선
MCP로 도메인별 데이터 제공
- 고객 질의에 자동 대응
- MCP가 자동으로 조합
- 대답 경우의 수 폭발적 증가
결과:
"저희도 상상 못한 유스케이스들이 마구 나옵니다"
기존 유스케이스도 해결
지역 축제 방문객 분석
- 가장 많이 구매하는 데이터 상품
- 유동인구 통계
- 방문객 분석
새로운 유스케이스:
- 방문객 정보로 다양한 분석
- 예상 못한 활용 사례 속출
→ 활용도 극대화
8. 사내 적용 및 검증 (13:45-15:10)
단계적 접근 전략
왜 사내부터?
경험 부족 문제
- 보안 처리
- 접근 인증/인가
- 외부 출시 전 검증 필요
목표:
- 활용도 확인
- 문제점 발견
- 해결 방법 마련
사내 MCP 데이터 구축
구축한 데이터 종류
- 구매 데이터: 고객 구매 이력
- 상담 데이터: 고객 상담 내역
- 프로파일: 개인 정보
- 통계 데이터:
- 지하철 혼잡도
- 장소 혼잡도
- 음식점 인기도
- 학원 인기도
- 통화 기반 통계
- 위치 기반 통계
- 앱 방문 기반 통계
연동 AI 에이전트
- A. (에이다): SKT AI 서비스
- 폴라리스 AI: 사내 서비스
- 기타 다양한 AI 에이전트
→ 다양한 서비스에서 활용 가능
서비스 구조
3단계 아키텍처
-
MCP 카탈로그
- 사용 가능한 MCP 목록
-
에이전트 서비스
- 카탈로그의 MCP 조합
- 불러서 사용
-
워크플로우 빌더
- 에이전트를 다시 조합
- 복잡한 워크플로우 구성
→ 계층적이고 유연한 구조
9. 실제 활용 사례 1: 축제 분석 (15:10-18:19)
기존 방식: 축제 분석
지자체의 요구사항
데모그래픽 분석
- 성별 분포
- 연령 분포
- 지역별 방문자
- 피크 타임
- 총 방문객 수
- 다른 축제와 비교
- 작년 대비 비교
문제점:
- 복잡한 분석 요청
- 전문가 필요
- 시간 많이 걸림
MCP 방식: 축제 분석
구현 과정
1단계: MCP 생성
- 방문객 수 통계 MCP
- 장소 잡기 MCP
2단계: 스킬 생성
- Claude에 요청: "축제 분석 스킬 만들어줘"
- 발표자가 직접 프롬프트 작성 안 함
- Claude가 더 잘 만듦!
3단계: 분석 요청
"송파 석촌호수 벚꽃축제와 여의도 벚꽃축제를 비교해줘"
기존 퍼즐지도 서비스의 한계
서비스 기획자의 의도와 불일치
- 최근 30일 데이터만 제공
- 축제 기간 데이터 보고 싶은데...
- 다른 기간 보려면? → API 구매하라고 나옴
- 포기!
MCP + Claude Skills 결과
놀라운 성과
전문가 수준 리포트 자동 생성
- 실제 데이터 기반
- 전문가가 만든 수준
- 즉시 생성
가장 마음에 들었던 점
유연한 수정 가능
기존 프로세스:
- 보고서 받음
- 수정 필요 발견
- SK텔레콤 영업사원 연락
- "비용 얼마 더 드릴게요"
- "2주 기다려주세요"
- 분석가 작업
- 딜리버리
MCP 프로세스:
- "페르소나 3개 말고 6개로 만들어줘"
- 즉시 업데이트
- 스킬 자동 수정
→ 실시간 대응 가능!
데모 사이트
실제 작동 예시 제공
- 링크로 확인 가능
- 직접 돌려볼 수는 없지만
- 예시로 도움됨
10. 실제 활용 사례 2: 페르소나 생성 (18:19-18:55)
요금제 설계 시나리오
필요성
새 요금제 출시 전 검증
- 영 고객 타겟 요금제
- 시장 반응 예측 필요
기존 방식
- 설문 조사 진행
- 시간과 비용 소요
- 표본 한계
MCP 활용
프로세스
고객 프로파일 데이터 MCP 활용
- 페르소나 자동 생성
- 가상 설문 실시
- 반응 예측
대상 사용자
- 요금제 기획자
- 마케터
효과
빠른 검증
- 실제 출시 전 테스트
- 수정 사항 미리 파악
- 실패 위험 감소
11. 실제 활용 사례 3: 세일즈 프로모션 분석 (18:55-20:11)
비즈니스 도메인 활용
"돈이 될 만한 걸 고민해보자"
배경: 신규 단말 출시
기존 프로세스
아이폰/갤럭시 신규 출시
- 사전 예약 프로모션
- 실적 대시보드로 관리
- 지역 마케터/팀/본부에서 확인
기존 대시보드의 문제
문제 1: 니즈 불일치
어떤 팀: 대시보드 잘 활용 ✅ 다른 팀: 대시보드 안 맞음 ❌
문제 2: 엑셀로 회귀
대시보드 못 쓰는 팀의 해결책
- 영업 전산 시스템에서 데이터 다운로드
- 엑셀로 수작업 관리
결론:
"대시보드를 아무리 잘 만들어도 니즈 안 맞으면 못 쓰신다"
MCP 솔루션
구현
기본 대시보드 포맷 + MCP
- 대리점 실적 데이터 MCP
- 신규 구매 데이터 MCP
- 기타 필요 데이터 MCP
사용 방식
질문으로 대시보드 변경
- 기본 대시보드 제공
- 사용자가 질문 입력
- 보고서가 자동으로 변경
- 원하는 형태로 커스터마이징
효과
유연한 대응
- 다양한 유스케이스 대응
- 개인별 맞춤 대시보드
- 엑셀 작업 불필요
→ 모든 팀이 활용 가능
전체 요약
데이터 가치 실현의 여정
출발점: 문제 인식
데이터 ≠ 금 (본원적 가치 없음)
- 사용 방식에 따라 가치 결정
- 원유처럼 정제 필요
게임 체인저: LLM
역할 대전환
- AI가 최종 상품 딜리버리
- 데이터 조직은 공급자로
시행착오와 학습
시도 1: 도메인 특화 모델
- ❌ 시간과 비용 과다
- ❌ 기존 방식과 차이 없음
시도 2: 위키 형태 데이터
- ✅ 소규모에서 작동
- ❌ 스케일 문제 (대규모 불가)
시도 3: 벡터 DB & 지식 그래프
- ❌ 개인 프로파일에 부적합
- ❌ 차별화 어려움
성공: MCP
- ✅ 표준화
- ✅ 컨텍스트 반영
- ✅ 데이터 조합
- ✅ 재사용성
AI Readable 데이터 4대 조건
- ✅ 신뢰할 수 있는 품질
- ✅ 최신성 담보
- ✅ 상세하고 구조화된 명세
- ✅ 액션 가능한 결과
실제 성과
축제 분석
- 전문가 수준 리포트 자동 생성
- 실시간 수정 가능
- 2주 → 즉시
요금제 설계
- 페르소나 자동 생성
- 가상 설문 실시
- 빠른 검증
세일즈 분석
- 유연한 대시보드
- 개인별 맞춤화
- 엑셀 작업 불필요
핵심 인사이트
데이터 조직의 미래
사라지지 않는다, 진화한다
- 과거: 분석 + 개발 + 딜리버리
- 현재: 품질 좋은 데이터 선별 + 공급
성공 공식
범용 LLM + AI Readable 데이터 = 도메인 특화 LLM
MCP의 혁명
1회용 → 재사용
- 한 번 만들면 어디서나
- 조합해서 새로운 가치
- 상상 못한 유스케이스 속출
발표자의 메시지
"데이터는 원유입니다. 정제하고 가공해야 가치를 발합니다. MCP는 그 정제 과정을 표준화하고, AI는 최종 소비자에게 맞춤형 제품을 즉시 전달합니다."
결론: AI 시대에 데이터 조직은 사라지는 게 아니라, 더 중요한 역할(공급자)로 진화한다!
댓글
첫 번째 댓글을 남겨보세요.