sol’s blog

MAR, EAR, gaze yaw, pitch feature 스케일링 적용 여부 결정

sol-commits
sol-commitsJun 2, 2025
MAR, EAR, gaze yaw, pitch feature 스케일링 적용 여부 결정

    MAR / EAR 특징의 스케일링 여부

    MAR(Mouth Aspect Ratio), EAR(Eye Aspect Ratio)는 얼굴 랜드마크 기반으로 정의된 비율형 특징 → 값 자체가 0-1 사이로 비교적 제한적이며 졸음 탐지 등의 응용에서 절댓값 임계치로 활용되는 경우가 많음

    • EAR의 경우 특정 임계값 이하로 떨어지면 눈 깜빡임 또는 감김 상태로 간주하는 식으로 사용되는 경우가 많음

    이러한 특성 때문에 이 피처들을 정규화할지 여부는 논의의 여지

    하지만 딥러닝은 패턴을 학습하고, 절댓값 의미가 적기 때문에 스케일링을 해도 상관 없음. 오히려 전체적 균형을 위해 하는 게 좋음

    일부 피처만 정규화하는 경우의 영향

    일부 피처만 정규화하면 가중치 학습이 한쪽으로 치우쳐 전체적인 학습 성능이 저하될 우려가 있음

    특히 MAR/EAR 처럼 값 범위가 0 ~ 0.3 정도인 피처와, 정규화되어 0 ~ 1 범위를 갖는 피처를 함께 넣으면, 초기 가중치가 동일하다는 가정 하에 상대적으로 큰 범위의 값이 모델 출력에 더 크게 기여할 가능성이 높음. 그 결과, 작은 값 범위의 MAR/EAR 신호가 모델에 충분히 반영되지 못하거나, 반대로 가중치를 키우는 과정에서 다른 피처에 과민한 반응을 일으킬 수 있음

    💡
    일부러 부분 스케일링을 채택하는 특수한 경우

    범주형 / 서열형 변수처럼 스케일보다 의미 자체가 중요한 피처는 원-핫 인코딩

    → MAR/EAR 나 gaze와 같은 연속 수치 피처에는 해당하지 않음

    왜 피처 간 값 크기 차이가 모델에서 중요도 왜곡을 일으키는가?

    신경망에서 각 feature는 다음처럼 처리됨

    z=w1x1+w2x2++wnxn+b z = w_1 x_1 + w_2 x_2 + \cdots + w_n x_n + b

    xix_i : 입력값, wiw_i : 가중치

    학습은 오차에 따라 wiw_i를 업데이트하는데, 이 때 입력값 xix_i의 크기가 클수록 wiw_i의 변화량도 커짐

    즉, 값이 큰 피처는 자동적으로 모델의 학습 과정에서 더 큰 영향력을 가지게 됨

    MAR, EAR에 스케일링 적용한 다른 예시