sol’s blog

Kaggle - Predict the Introverts from the Extroverts

sol-commits
sol-commits Aug 12, 2025
 

데이터

Extrovert vs. Introvert Behavior Data 설문조사 데이터를 기반으로 딥러닝 생성 모델을 통해 합성된 것(원본 설문을 학습한 딥러닝 생성모델이 “원본과 비슷하게 보이도록 원본 분포를 모사해” 새로 뽑아낸 합성 데이터

  • 설문조사 데이터는 2,900행 정도
  • 대회에서 제공된 합성된 데이터 train shape은 (18524, 9)
    • test shape 6,175행
1.time_spent_alone
하루 중 혼자 보내는 시간(시간 단위)
- 0 ~ 11
2. stage_fear
무대 공포증 존재 여부
- yes / no
3. social_event_attendance
사회적 모임/행사 참석 빈도
- 0 ~ 10
4. going_outside
외출 빈도
- 0 ~ 7
5. drained_after_socializing
사교 활동 후 피로감 여주
- yes / no
6. friends_circle_size
친구 범위 규모(친구 숫자)
- 0 ~ 15
7. post_frequency
SNS 게시물 포스팅 빈도
- 0 ~ 10
8. personality
종속변수
- extrovert / introvert
9. id
각 행의 식별자

간단 EDA

종속변수(personality) 구성비율

Time Spent Alone

Drained after socializing

Friends circle size

Post frequency

introvert이면서 Post frequency가 6이상인 사람들은 drained after socializingsocial fear 이 No 인 것으로 나타마

Social event attendance

Going outside

stage fear

 

간단 모델링

NaN 값 허용하는 catboost로 돌려봤을 때..

  • 캐글 제출 결과

Feature importance

 

추천 글

BlogPro logo