본문 바로가기
반응형

분류 전체보기103

Data literacy - 누적과 막대 그래프 2장 2절 | 누적 그래프와 막대 그래프 사이의 간극“사용자 수가 매년 증가하고 있습니다.”“누적 다운로드 수 1,000만 돌파!”“누적 가입자 수 200% 증가!” 이런 말, 어디서 많이 들어봤지?앱 서비스 소개 페이지, 스타트업 보도자료, 투자 피칭, 유튜브 크리에이터 홍보 페이지…누적 숫자는 늘 멋있어 보이고, 안정감 있어 보이고, 성공의 증거처럼 느껴진다. 근데 질문 하나 해보자.“최근엔 얼마나 늘었나요?”그게 누적의 함정이다.‘지금’이 아니라, ‘지금까지’를 보여주는 숫자즉, 과거가 현재를 덮고 있는 구조다. 누적 그래프는 절대 줄지 않는다 — 그래서 착각이 시작된다누적(N累積) 그래프의 본질은 이거야:사용자가 한 명만 추가돼도 그래프는 올라간다신규 유입이 전혀 없어도, 탈퇴자가 표시되지 않으.. 2025. 4. 8.
How to Visualize Cherry Blossom Paths in Tableau How to Visualize Cherry Blossom Paths in Tableau( 🌸 서울 벚꽃길 Tableau 지도 시각화 가이드)   오늘은 앞에서 살펴본 지도에 선 그리는 방법에 대해서 정리해 보려고 합니다.약간에 coding이 있어야 해서 그 부분도 간략하게 설명 드리겠습니다.STEP1Prepare Cherry Blossom Spot Data (데이터 수집)서울의 주요 벚꽃 명소 10곳의 좌표 데이터를 수집합니다.  알고있는 명소명을 작성하고 GPT를 이용해 대략적인 위도, 경도를 뽑아내도록 합니다.번호명소명위도 (Latitude)경도 (Longitude)1여의도 윤중로37.5281126.91852석촌호수37.5117127.10063서울숲37.5443127.03774남산공원37.55121.. 2025. 4. 7.
Data literacy - Y축 자르기 2장 1절 | Y축만 깎았을 뿐인데 매출이 폭등했다그래프는 우리에게 말없이 많은 걸 말해준다.숫자 하나하나를 따로 읽지 않아도, 선 하나가 올라가면 “오, 성장했구나”,막대가 크게 솟아 있으면 “이 제품이 압도적이네”라고 믿는다.직관적이고, 빠르고, 한눈에 들어오니까.그런데 너무 ‘빠르다’는 건,그만큼 속기도 쉽다는 뜻이다. 그래프는 숫자보다 더 ‘설득력 있는 거짓말’을 할 수 있다 [예]어떤 기업이 투자 유치를 앞두고 IR 자료를 만든다.매출을 보여주는 그래프를 이렇게 꾸민다:2021년: 1.1억2022년: 1.2억2023년: 1.35억성장 폭은 숫자만 보면 아주 크진 않다.하지만 Y축의 시작점을 1.0억으로 설정하고, 눈금을 0.05억 간격으로 자르면?그래프는 이렇게 보인다:📈 1.1 → 1.2 .. 2025. 4. 6.
Data literacy - 비응답 편향 1장 4절 | 표본, 샘플, 응답률 — 누구 말을 믿을까?뉴스 헤드라인을 보다가 이런 문장 본 적 있을 거야.“전국 20~30대 남녀 1,000명 대상으로 조사한 결과…”“직장인 87%가 재택근무를 긍정적으로 평가했다.”“2030 여성의 65%가 MZ 감성 브랜드에 호감을 보였다.”“20~30대 직장인 80%가 이직을 고려 중이다” “2030 여성의 65%가 ‘비혼이 낫다’고 응답”“직장인 10명 중 7명, 퇴사 후 창업 고려” 이런 수치를 보면 사실처럼 느껴지고, 꽤 신뢰감도 생기지?근데 여기엔 꼭 따져봐야 할 질문들이 있어.“그 1,000명, 도대체 누구?” 모든 조사는 ‘표본’이라는 선택의 결과다 세상 모든 사람을 대상으로 조사할 수는 없어.그래서 우리는 일부만 뽑아서 조사하고,그걸 전체의 의견처럼.. 2025. 4. 5.
Data literacy - 자기 선택 편향 1장 3절 | 97%가 만족? 그 3%가 될 수 있는 나“사용자 97%가 만족한 토너!”“체험단 전원이 피부 개선 효과를 봤어요”“리뷰 평점 ★★★★★ 4.9점, 믿고 사는 제품!”…근데 정작 내가 써보면?"어? 그냥 그렇던데?", 심하면 "이거 왜 이렇게 피부 뒤집어져?"분명 만족도 97%라는데 왜 나만 별로일까?문제는 제품이 아니라, 그 ‘97%’가 어떻게 만들어졌는가에 있어. 만족도는 ‘사실’이 아니라 ‘구성된 수치’다 예를 들어볼게.어떤 화장품 브랜드에서 신제품 테스트를 진행했어.총 30명이 참여했고, 그중 29명이 “만족”이라고 답했대.→ 97% 만족도!근데 그 30명은 누구였을까?기존 VIP 회원체험단으로 뽑힌 사람들제품 무료로 받았거나 뷰티 커뮤니티 활동 중인 사람들“솔직한 후기 남겨주시면.. 2025. 4. 5.
Data literacy - 평균의 함정 1장 2절 | 평균의 함정: 내 월급은 왜 항상 평균보다 낮을까?“대한민국 20대 평균 연봉은 3,050만 원”“30대는 평균 4,850만 원”“직장인 평균 퇴근 시간은 18시 40분”이런 기사를 보면 기분이 이상해진다.‘어… 나만 못 버는 건가? 나만 퇴근 늦나?’뭔가 자꾸 뒤처지는 기분, 나만 예외인 것 같은 찜찜함.그런데 진짜 평균이 ‘보통의 우리’를 말해주는 걸까? 평균은 늘 착해 보이지만, 현실은 그렇지 않다 ‘평균’이라는 단어는 왠지 공정하고 과학적인 느낌이 있다.하지만 현실에서는 '평균값'이 오히려 우리를 속이기도 한다.예를 들어 이런 상황을 보자.[예] 사람연봉 A2,500만 원B2,700만 원C2,600만 원D3,000만 원E2억 원위 다섯 사람의 평균 연봉은?→ 2,960만 원 갑자기.. 2025. 4. 5.
반응형