본문 바로가기
반응형

실무형리터러시2

Data literacy - 비정형 데이터 5장 3절.숫자보다 더 중요한 ‘비정형 데이터’ 다루기“데이터 분석하겠습니다!”그리고 숫자만 꺼낸다. 매출, 전환율, 이탈률, 클릭 수, 반응률, 평균 시간…그런데 뭔가 이상하다.분석은 했는데, 정작 고객이 왜 떠났는지는 모르겠다.리포트는 잘 만들었지만, “그래서 우리 팀 분위기는 요즘 어떤가요?”라는 질문엔 대답을 못 한다.왜일까? 숫자에 없는 이야기들이, 더 중요한 경우가 많기 때문이다. 숫자는 결과를 말하고, 비정형 데이터는 이유를 말한다한 가지 예를 들어보자.어떤 앱의 하루 사용자 수가 줄었다. 숫자로는 ‘문제 상황’이다.하지만 왜 줄었는지는 숫자가 말해주지 않는다.그걸 알려주는 건,고객 문의에 남긴 불만의 문장앱 리뷰의 댓글설문 응답 중 자유서술형고객센터 통화 내용직원 간 이메일, 회의 메모, .. 2025. 4. 22.
Data literacy - 정제되지 않은 데이터 5장 1절.정제되지 않은 데이터가 말하는 진짜 이야기“이 데이터, 좀 지저분한데요?”“빈칸도 많고, 숫자도 이상해요.”“정제 먼저 하고 분석합시다.”데이터 분석을 하자고 하면, 가장 먼저 나오는 말들이다. 하지만 정작 진짜 이야기는, 그런 ‘이상한 데이터’ 속에 있다. 현실 데이터는 깨끗하지 않다. 그리고 그게 정상이다. 실제 데이터를 처음 열어보면 이런 생각이 든다.“왜 이름이 두 개씩 있는 사람이 있지?”“날짜가 2021년, 2022년, 1022년? 오타인가?”“빈칸이 이렇게 많은데, 뭘 분석하라는 거지?”“이건 숫자고, 저건 문자열이고… 정리가 안 돼 있다.”그리고 곧 이런 말이 따라붙는다.“이건 못 써요.”“다시 받아오죠.”“클렌징부터 해야겠네요.”맞다. 정제는 중요하다. 하지만 우리는 너무 쉽게.. 2025. 4. 20.
반응형