Jamovi 튜토리얼 및 AI 입력 프롬프트

t검정, 회귀분석, 구조방정식모형, 다층모형 등 심리학 및 사회과학 연구에 사용되는 모든 통계분석 기법을 다룹니다. 

Explorationjamovi(자모비) 기술통계(Descriptives) : 입력부터 결과 해석까지 - SNS 셀카 횟수와 나르시시즘?

2026-02-20
조회수 109


FREE ESSENTIAL

jamovi 기술통계(Descriptives) : 데이터 탐색과 시각화의 기초

SNS 셀카 횟수와 나르시시즘? 무작정 분석을 돌리기 전에 '데이터의 민낯'부터 확인하자

 📂 실습용 csv 파일 및 jamovi 분석 파일: 본문 하단 참조

우리는 종종 SNS에 과시용(Show-off) 사진을 자주 올리는 사람을 보며 나르시시즘을 의심한다. 이 가설을 검증하기 위해 50명의 데이터를 수집했다. 자, 이제 바로 T-검정이나 분산분석(ANOVA)을 돌려서 p값을 확인하면 될까? 절대 아니다.

"내 데이터에 극단적인 '관종(이상치)'이 숨어 평균을 왜곡하고 있지는 않은가? 빈칸(결측치)은 없는가?"

분석을 건물을 짓는 과정에 비유한다면, 기술통계는 지반이 튼튼한지 확인하는 사전 안전 진단과 같다. 데이터의 분포와 특성을 먼저 파악하지 않고 분석을 강행하면 결국 쓰레기 같은 결과(Garbage In, Garbage Out)를 얻게 된다.

이 글에서는 SNS 이용 목적과 성별, 나르시시즘 점수를 활용해 jamovi의 기술통계 기능으로 데이터를 훑어보고(빈도와 쏠림 확인), 상자 그림(Box plot)으로 시각화하여 그룹 간의 차이를 직관적으로 파악하는 법을 배운다. 더불어 입력 패널의 다양한 옵션들이 각각 어떤 기능을 하는지 사전식으로 총정리하여 jamovi 툴 자체를 완벽하게 마스터하는 것을 목표로 한다.

💡 핵심요약
  • 기술통계 분석의 목적: 본격적인 추론통계 전에 결측치(빈칸)와 이상치를 점검하고, 데이터가 한쪽으로 쏠려 있는지(왜도) 파악하여 분석의 방향성을 결정하는 것이다.
  • 기능 사전 제공: 분석에 직접 쓰이지 않는 옵션(Shapiro-Wilk, Q-Q Plot 등)까지 모두 짚어주어 툴의 활용도를 극대화한다.
  • 분석 결과 (수치 및 시각 해석): 
    • 평균의 함정: 과시용(Show-off) 집단의 나르시시즘 점수가 압도적으로 높으며, 왜도(Skewness) 수치를 통해 일부 극단적인 유저가 점수를 끌어올리고 있음을 확인했다.
    • 시각화의 힘: 상자 그림(Box plot)을 통해 그룹 간 데이터 분포의 차이를 직관적으로 파악했다.
  • 필수 점검 사항 (경고창 방지):
    • 성별이나 집단처럼 순서가 없는 데이터는 반드시 '명목형(Nominal)'으로, 숫자로 된 데이터는 '연속형(Continuous)'으로 지정해야 그래프를 그릴 때 에러(경고창)가 발생하지 않는다.

아래의 설명은 jamovi 2.6.44.0 버전으로 작성되었다. 

※ jamovi(자모비) 버전 확인은 jamovi 화면 오른쪽 상단의 삼선표시(⋮)를 클릭하면 화면 맨 아래에서 확인할 수 있다.

jamovi 버전 확인 안내하는 화면

※ 데이터 파일과 실제 jamovi 실행파일은 화면 맨 아래에 첨부되어 있음


01. 논문 사례

1-1. SNS 셀카와 나르시시즘: 진실은 무엇인가?

인스타그램 등 SNS에 자신의 셀카를 자주 올리거나, 값비싼 물건을 자랑하는(Show-off) 게시물을 업로드하는 사람들을 보며 우리는 흔히 "자기애(나르시시즘)가 강할 것"이라고 추측한다. 최근 심리학 및 경영학계에서도 디지털 발자국(Digital Footprint)을 통해 개인의 성격 특성을 예측하려는 연구가 활발히 진행되고 있다.

본 튜토리얼에서는 SNS 유저 50명을 대상으로 수집한 가상의 데이터를 활용한다. 본격적인 상관분석이나 그룹 간 차이 검증(추론통계)에 들어가기 앞서, 수집된 데이터 자체가 과연 분석하기에 적합한 상태인지 점검하는 과정을 거칠 것이다.

데이터에 극단적인 이상치(Outlier)가 숨어 있지는 않은지, 결측치(빈칸)는 없는지 확인하고, 시각화 도구를 통해 전체적인 밑그림을 그리는 것이 이 단계의 핵심이다.

1-2. 데이터 탐색 질문

이 단계에서는 가설을 '검증'하는 것이 아니라, 데이터를 '관찰'하는 것에 집중한다.

  • 탐색 질문 1: 수집된 50명의 참가자는 성별과 SNS 이용 목적에 따라 어떻게 분포되어 있는가?
  • 탐색 질문 2: 나르시시즘 점수와 셀카 업로드 횟수 데이터는 한쪽으로 쏠려 있지 않은가? (왜도 확인)
  • 탐색 질문 3: SNS 이용 목적에 따라 나르시시즘 점수의 분포 차이가 시각적으로 뚜렷하게 나타나는가? (상자 그림 활용)
1-3. 연구 방법 (변수 정의)

SNS 유저 50명을 대상으로 수집된 데이터를 사용하여 데이터 탐색을 수행한다. 주요 변수는 다음과 같다.

  • 참가자 특성 변수 (명목형 데이터)
    1) Gender: 성별 (Female / Male)
    2) SNS_Purpose: SNS 주 이용 목적 (Communication: 소통, Information: 정보 탐색, Show-off: 과시 및 자랑)
  • 심리 및 행동 변수 (연속형 데이터)
    3) Selfie_Count: 최근 일주일간 업로드한 셀카 사진의 개수
    4) NPI_Score: 나르시시즘 성격 검사(Narcissistic Personality Inventory) 점수 (점수가 높을수록 자기애가 강함)



02. 기술통계(Descriptive Statistics)란?

2-1. 왜 '평균'만 믿으면 안 될까?

초보 연구자들이 가장 흔히 하는 실수는 데이터를 수집하자마자 바로 평균을 내고 가설을 검증하려 드는 것이다. 하지만 평균은 '극단적인 값(이상치)'에 매우 취약하다는 치명적인 단점이 있다.

예를 들어, 9명의 월급이 200만 원인데, 1명의 월급이 2,000만 원이라면 이 10명의 평균 월급은 380만 원이 된다. 이 '평균 380만 원'이라는 숫자가 집단의 현실을 제대로 대변한다고 볼 수 있을까?

이처럼 분석을 본격적으로 시작하기 전, 데이터가 한쪽으로 심하게 쏠려 있지는 않은지(왜도), 비정상적으로 튀는 값은 없는지 전체적인 '건강 상태'를 점검하는 과정이 반드시 필요하다. 이것이 바로 기술통계(Descriptive Statistics)의 핵심 역할이다.

2-2. 핵심 개념: 기술통계의 3가지 목적

기술통계는 크게 세 가지 목적으로 수행된다.

  • 데이터 정제: 결측치(빈칸)나 입력 오류(예: 1~5점 척도인데 55로 잘못 입력된 값)를 잡아낸다.
  • 데이터 요약: 빈도, 평균, 표준편차 등을 통해 방대한 데이터를 한눈에 들어오는 표기법으로 압축한다.
  • 시각적 탐색: 히스토그램이나 상자 그림(Box plot) 등을 그려 집단 간의 패턴을 직관적으로 확인한다.

본 튜토리얼에서는 jamovi의 `Exploration` 메뉴를 활용하여 이 3가지 목적을 어떻게 한 번에 달성할 수 있는지 단계별로 살펴본다.





03. 분석 수행 전 필수 확인 사항 (변수 유형의 비밀)

3-1. 변수 아이콘 맞추기 (Measure Type)

분석의 첫 단추는 변수의 성격을 jamovi에게 정확히 알려주는 것이다. 프로그램은 데이터 열의 맨 위에 있는 '아이콘'을 보고 이 데이터가 평균을 낼 수 있는 숫자인지, 아니면 집단을 나누는 이름표인지 판단한다.

  • 명목형 (Nominal, 겹쳐진 원 3개 아이콘): 크기나 서열의 의미가 없는 '이름표' 데이터다. Gender(성별), SNS_Purpose(이용 목적)가 여기에 해당한다. 숫자로 1(남), 2(여)라고 입력되어 있어도 절대 평균(1.5)을 내면 안 되는 데이터다.
  • 연속형 (Continuous, 눈금자 아이콘): 덧셈, 뺄셈, 평균 계산이 가능한 진짜 수치 데이터다. Selfie_Count(셀카 횟수), NPI_Score(나르시시즘 점수)가 여기에 해당한다.

⚠️ 경고창 방지 팁:

이 아이콘 설정을 틀리면, 나중에 상자 그림(Box plot)을 그릴 때 "해당 변수는 숫자가 아니라서 그래프를 그릴 수 없습니다"라는 에러 메시지를 마주하게 된다. 분석 전 변수명을 더블클릭하여 데이터 성격에 맞게 아이콘이 설정되어 있는지 반드시 확인해야 한다.


04. jamovi로 분석/해석하기

4-1. 데이터 열기

① 파일 불러오기
  • 본 튜토리얼은 기술통계 실습을 위한 가상 데이터를 제공한다. 실습을 위해 아래 파일을 다운로드한다.
    실습 데이터: data_sns_narcissism.csv
  • jamovi 실행 ➡ 메뉴(≡) ➡ Open ➡ This PC ➡ browse ➡ 저장된 폴더에서 파일 선택.
jamovi 데이터 파일 여는 화면파일 불러오기 경로 선택 화면
② 변수 확인
  • 데이터가 열리면 총 50명의 사례(Rows)와 함께 변수들이 올바르게 들어왔는지 확인한다.
    Gender: 성별 (Nominal) ➡ 비교 집단 변수
    SNS_Purpose: SNS 이용 목적 (Nominal) ➡ 비교 집단 변수
    Selfie_Count: 셀카 업로드 횟수 (Continuous) ➡ 분석 대상 변수
    NPI_Score: 나르시시즘 점수 (Continuous) ➡ 분석 대상 변수

데이터 변수 확인 화면

③ 변수 유형(Measure Type) 설정
  • 기술통계 분석을 정확히 수행하기 위해 각 변수의 속성을 지정한다.
  • 집단을 구분하는 GenderSNS_Purpose는 반드시 Nominal(겹쳐진 원 모양)로 설정한다.
  • 수치 데이터를 다루는 Selfie_CountNPI_Score는 반드시 Continuous(자 모양)여야 한다.
  • 아이콘이 데이터 성격과 맞지 않으면 변수명을 더블 클릭하여 Measure Type을 변경한다.
변수 유형 설정 화면


4-2. 분석 설정하기 (메뉴 사전 및 핵심 세팅)

① 메뉴 진입
상단 메뉴에서 Exploration (탐색)을 클릭 ➡ Descriptives (기술통계)를 선택한다. 입력 패널이 열리면 본격적인 세팅을 시작한다.

jamovi 기술통계 메뉴 선택 화면

jamovi 설정 패널

↳ 4-2-1. 옵션 총정리 (jamovi 기술통계 메뉴 사전)

jamovi의 기술통계 패널에 있는 모든 옵션의 기능을 완벽히 숙지해 두면 어떤 데이터를 만나도 당황하지 않는다. 각 항목이 어떤 역할을 하는지 꼼꼼히 짚고 넘어간다.

[Variables] 및 [Options] 기본 설정
  • Variables (변수 상자): 분석할 대상 변수를 넣는 곳이다.
  • Split by (분할 상자): 명목형 변수(예: 성별, 목적)를 넣어 데이터를 그룹별로 쪼개서 볼 때 사용한다.
  • Descriptives:결과표의 레이아웃을 결정한다.
    • Variables across columns: 변수를 열에 배치한다. 가독성이 좋아 기본값으로 쓰인다.
    • Variables across rows: 변수를 행(세로)에 배치한다. 분석할 변수가 아주 많아서 표가 옆으로 너무 길어질 때 사용하면 깔끔하다.
  • Frequency tables: 명목형(Nominal) 및 순서형(Ordinal) 변수의 각 항목별 인원수(N)와 비율(%)을 표로 만들어 준다.
[Statistics] 통계량 세부 옵션
  • Sample Size (표본 크기): N(정상 입력된 데이터 개수)과 Missing(빈칸/결측치 개수)을 확인한다. 결측치 확인은 필수다.
  • Percentile Values (백분위수): Cut points for를 통해 데이터를 원하는 등분으로 자르는 기준점을 보거나, Percentiles로 특정 백분위(기본 25%, 50%, 75%)에 해당하는 값을 확인한다.
  • Central Tendency (중심경향치): 데이터의 중심을 나타낸다. Mean(평균), Median(중앙값), Mode(최빈값), Sum(합계)을 선택할 수 있다. 이상치가 심할 땐 평균보다 중앙값이 현상을 더 정확히 반영한다.
  • Dispersion (산포도): 데이터가 흩어진 정도다. Std. deviation(표준편차), Variance(분산), Range(범위: 최댓값-최솟값), Minimum(최솟값), Maximum(최댓값), IQR(사분위수 범위)을 제공한다. 최솟값과 최댓값은 코딩 오류(예: 5점 만점인데 55 입력)를 잡아낼 때 유용하다.
  • Distribution (분포): Skewness(왜도)는 데이터가 좌우로 얼마나 쏠렸는지, Kurtosis(첨도)는 분포가 위아래로 얼마나 뾰족한지를 알려준다.
  • Normality (정규성): Shapiro-Wilk 검정을 통해 데이터가 정규분포를 따르는지(p값 확인) 통계적으로 검증한다. (보통 50명 미만의 소표본에서 사용)
  • Mean Dispersion (평균 산포): Std. error of Mean(평균의 표준오차)Confidence interval for Mean(평균의 95% 신뢰구간)을 도출한다. 수집한 데이터(표본)의 평균이 실제 전체 대상(모집단)의 진짜 평균을 얼마나 잘 대표하는지, 즉 도출된 평균값을 얼마나 믿을 수 있는지 통계적으로 평가할 때 쓰인다. 오차가 작고 신뢰구간이 좁을수록 평균의 정확도가 높다는 뜻이다.
  • Outliers (이상치): Most extreme을 체크하면 가장 값이 크거나 작은 극단적인 N개의 값을 리스트업해 준다.
[Plots] 시각화 도표 옵션
  • Histograms (히스토그램): Histogram은 막대 형태로, Density는 부드러운 곡선 형태로 연속형 데이터의 분포 모양을 보여준다.
  • Box Plots (상자 그림): 집단 간 비교에 가장 탁월하다. Box plot(사분위수 기반 상자), Label outliers(이상치에 ID 라벨 표시), Violin(밀도까지 둥글게 표현), Data(실제 데이터 점 표시 - Jittered(흩뿌리기), Stacked(쌓기)), Mean(평균 위치 점 표시) 옵션을 정교하게 조합할 수 있다.
  • Bar Plots (막대 그래프): Bar plot을 통해 주로 명목형 변수의 빈도나 범주별 요약값을 나타낸다.
  • Q-Q Plots: Q-Q 도표를 그려 데이터 점들이 대각선에 가깝게 모이는지 확인하여 정규성을 시각적으로 평가한다.

↳ 4-2-2. 본 실습을 위한 핵심 세팅 (선택과 집중)

모든 기능을 다 켜면 결과창이 너무 길어지고 해석에 방해가 된다. SNS 나르시시즘 분석의 목적에 맞게, 숲을 먼저 보고 나무를 보는 순서로 꼭 필요한 기능만 취사선택하여 세팅한다.

STEP 1: 전체 데이터 훑어보기 (Split by 비우기)
  • Variables: Gender, SNS_Purpose, Selfie_Count, NPI_Score 4개의 변수를 모두 넣는다.
  • Split by: 비워둔다. (처음부터 집단을 쪼개면 전체 결측치나 쏠림을 파악하기 어렵다.)
  • Options: Frequency tables를 체크하여 성별과 목적별 인원수를 표로 뽑는다.
  • Statistics: 기본값에 더해, Distribution 하위의 Skewness(왜도)를 체크하여 나르시시즘 점수가 한쪽으로 치우쳤는지 확인한다.
STEP 2: 집단별 시각화 (Split by 채우기)

전체 데이터에 이상이 없음을 확인했다면, 이제 집단 간 차이를 눈으로 직접 확인하기 위해 변수 배치를 수정한다.

  • Variables: 그래프를 그릴 연속형 숫자 변수인 Selfie_Count, NPI_Score 딱 2개만 남긴다. (명목형을 남겨두면 경고창이 뜬다.)
  • Split by: 집단을 쪼갤 기준이 되는 명목형 변수인 SNS_Purpose를 이곳에 넣는다.
  • Plots: Box Plots 하위의 Box plotData (Jittered)를 체크한다. (상자 그림 위에 50명의 실제 데이터 점이 겹치지 않게 뿌려진다.)


4-3. 분석 결과 해석하기

jamovi가 출력한 결과표를 순서대로 살펴보며 데이터의 상태를 점검한다. 해석의 순서는 [전체 데이터 확인] → [평균과 대푯값 비교] → [데이터 쏠림 파악] → [상자 그림 시각화] 순으로 진행한다.

▼ jamovi 분석 결과 화면 기술통계 결과표 및 그래프 전체
① 전체 데이터 및 결측치 확인 (Sample Size)

가장 먼저 데이터가 분석에 온전히 투입되었는지 점검해야 한다.

  • N (표본 수): 세 집단(Communication 24명, Information 15명, Show-off 11명)을 합쳐 총 50명의 데이터가 입력되었다.
  • Missing (결측치): 모든 집단에서 0으로 나타났다. 즉, 누락되거나 빈칸으로 남겨진 데이터가 하나도 없는 아주 깨끗한 상태임을 의미한다. (실제 연구에서는 다를 수 있음)
② 평균(Mean) 비교

집단별 나르시시즘(NPI_Score)과 셀카 업로드 횟수(Selfie_Count)의 차이를 확인한다.

  • 과시형(Show-off) 집단: 나르시시즘 평균 35.55점, 셀카 업로드 14.55회로 다른 두 집단에 비해 압도적으로 높은 수치를 기록했다.
  • 정보탐색형(Information) 집단: 나르시시즘 9.47점, 셀카 업로드 0.33회로 수치가 가장 낮게 나타났다.
③ 상세 해석 : 데이터 쏠림 (Skewness) ★핵심

단순히 평균만 보는 것을 넘어, 데이터가 점수대 안에서 어떻게 쏠려 있는지(왜도) 파악하는 것이 중요하다.

구분 (집단)Skewness해석 (Interpretation)
NPI_Score
(Show-off)
-0.44왜도가 음수(-)인 것은, 점수가 낮은 쪽에 꼬리가 길고 대다수의 인원이 높은 점수대에 뭉쳐 있음을 뜻한다. 즉, 과시형 유저는 대부분 자기애 점수가 높다.
NPI_Score
(Information)
0.08왜도가 0에 가깝다. 이는 이 집단의 나르시시즘 점수가 한쪽으로 심하게 치우치지 않고 비교적 대칭을 이루며 고르게 분포함을 의미한다.
Selfie_Count
(Show-off)
0.50왜도가 양수(+)이다. 대다수가 낮은 수치에 몰려 있고 일부 극단적으로 셀카를 많이 올리는 유저에 의해 오른쪽으로 꼬리가 생겼음을 의미한다.
④ 참고: 상자 그림(Box plot) 시각적 해석

복잡한 숫자 표보다 더 직관적이고 강력한 도구가 바로 시각화이다. 위에서 확인한 전체 결과의 그래프를 살펴보자.

  • 분포의 분리: 과시형(Show-off) 집단의 상자(Box)가 다른 두 집단과 전혀 겹치지 않고 확연히 높은 곳에 둥둥 떠 있다. 이는 통계적 검정을 하기 전부터 이미 집단 간 뚜렷한 차이가 존재함을 눈으로 보여주는 확실한 증거이다. 
  • 실제 데이터 점(Jittered): 상자 위에 뿌려진 개별 유저들의 점(Data)을 보면, 과시형 유저들은 상단에 촘촘하게 모여 있는 반면 정보탐색형(Information) 유저들은 바닥에 밀집해 있는 패턴을 바로 확인할 수 있다. 


4-4. 결론

본 기술통계 실습은 SNS 이용 목적과 나르시시즘, 셀카 업로드 횟수 간의 관계를 본격적으로 파헤치기 전에, 데이터의 전반적인 건강 상태를 진단하기 위해 수행되었다.

분석 결과, 전체 50명의 데이터 중 결측치(Missing)는 존재하지 않았으며 데이터 코딩에 이상이 없음을 확인했다. 특히 SNS를 '과시 및 자랑(Show-off)' 목적으로 사용하는 집단이 타 집단에 비해 나르시시즘 평균 점수가 압도적으로 높았으며, 왜도(Skewness) 분석을 통해 대다수 인원의 점수가 상위권에 쏠려 있음을 수치로 입증했다.

가장 주목할 점은 상자 그림(Box plot)을 통한 시각화 결과이다. 각 집단의 데이터 분포 상자가 확연히 다른 높이에 위치해 있음이 확인되었다. 이러한 데이터 탐색(Exploration) 과정은 앞으로 진행될 추론통계(T-검정, 분산분석 등)에서 매우 유의미한 차이가 도출될 것임을 예측하게 해준다. 이제 완벽하게 상태가 확인된 데이터를 들고 본격적인 가설 검증 단계로 넘어갈 준비를 마쳤다.




05. 퀴즈

다음은 본 실습의 기술통계표 해석 내용이다. 통계적으로 틀린 주장은?

[분석 조건] jamovi Exploration - Descriptives 활용

  1. 결측치: Missing 항목이 0인 것으로 보아 누락된 데이터(빈칸)는 없다.
  2. 평균: 과시형(Show-off) 집단의 나르시시즘 평균 점수가 세 집단 중 가장 높다.
  3. 분포 형태: 정보탐색형(Information) 집단의 나르시시즘 점수는 왜도가 -0.44로 나타나 높은 점수에 심하게 쏠려 있다.
  4. 시각화: 상자 그림(Box plot)을 통해 집단 간 데이터의 분포와 중앙값(Median)의 차이를 직관적으로 비교할 수 있다.
✨ 정답 및 해설

정답: 3번

왜도가 -0.44로 음수(-)를 띠며 높은 점수대에 인원이 쏠려 있는 집단은 '과시형(Show-off)'이다. 결과표를 보면 정보탐색형의 왜도는 0.08로 상대적으로 0에 가까워 점수가 비교적 고르게 분포해 있음을 알 수 있다. 따라서 3번 설명은 틀렸다.



06. 참고문헌

  • Casale, S., & Banchi, V. (2020). Narcissism and problematic social media use: A systematic literature review. Addictive Behaviors Reports, 11, Article 100252. https://doi.org/10.1016/j.abrep.2020.100252  
    • 본 튜토리얼의 실습에 사용된 데이터는 jamovi 학습을 위해 생성된 가상 데이터(Simulated Data)입니다.
  • Navarro, D. J., & Foxcroft, D. R. (2025). learning statistics with jamovi.
ⓒ 르네의 심리통계 | jamovi.ai All Rights Reserved.
본 콘텐츠의 무단 복제 및 배포를 금지합니다.



※ 아래의 자료가 다운로드 안 되면 새로고침을 하거나 게시판에 다시 들어와 주세요. 그래도 안 되신다면 댓글을 남겨주세요. 확인 후 처리해드리겠습니다.

0