본문 바로가기

study/영상처리 & opencv

[논문 요약] A computational approach to body mass index prediction from face images

A computational approach to body mass index prediction from face images

얼굴 이미지로부터 체질량 지수 예측에 대한 계산적 접근법

 

 

 

< 논문 요약>

통계적 방법으로 얼굴 이미지를 통해 BMI를 예측할 수 있다.

 

0. BMI

 

BMI : 개인의 키와 몸무게를 기준으로 한 체지방의 척도

단위에 따라 계산 식이 나눠진다.

BMI를 기준으로 저체중, 정상, 과체중, 비만으로 나눠진다.

출처 : 논문

 

1. 데이터  : MORPH-II database

 

MORPH-II는 약 55000개의 얼굴 이미지.

이 데이터에서 연령, 성별, 민족 분포 등의 불균형때문에

약 96%에 해당되는 White and Black faces image만을 연구에서 사용한다.

또한 성별과 연령대 분포를 고려하여 얼굴 이미지의 일부를 선택하여 2가지 세트로 나누어서 사용한다.

세트 1 : 7273개 (ID : 4591개)

세트 2 : 7323개 (ID : 4590개)

 

출처 : 논문

 

데이터의 target 값인 BMI의 분포는 주로 15-35 사이의 범위에 있다.

 

출처 : 논문

 

 

2. Face image로 BMI를 예측하는 과정

 

 

출처 : 논문

 

 

2.1. Face detection, alignment, and fitting

 

1. 얼굴과 두 눈 감지

 

2. 검출된 각 면이 검출된 눈 좌표를 기준으로 정규화

: 기본적으로 모든 얼굴 이미지를 공통 눈 좌표로 정렬할 수 있도록 얼굴의 화전, 변환 및 스케일링 수행

 

3. ASM(the active shape model)

: 얼굴 이미지의 여러 기준점을 탐지하는 역할

얼굴 구성요소의 위치(눈, 코, 입술, 얼굴 윤곽 등)에 주성분 분석(PCA) 적용 후

포즈, 조명, 표정 변화등을 고려하여(?) 다양한 수동 라벨 이미지로부터 연결된 포인트 분포로 ASM 제시

 

 

 

옆의 사진 : ASM 적용 예시 (출처 : 논문)

76개의 점이 탐지됨

 

 

 

 

 

 

 

 

 

 

 

ASM 모델을 다양한 크기의 얼굴 및 머리 회전이 포함된 원본이미지 대신 정규화된 얼굴 이미지에 적용

: 기준점 검출 보다 강력하고 정확하게 해준다.

 

2.2 Facial feature

 

7가지 얼굴 특징을 자동 감지 및 추정된다. 앞에서 구한 ASM의 점들 중 20개의 점(사진에서 P점들)과 ASM 방법에 의해 검출된 기준점을 기준으로 4개의 점(N)의 위치를 추정하여 총 24개의 점을 사용하여 7가지 얼굴 특징을 계산한다.

 

--> 광대뼈 대 턱 너비(CJWR), 너비 대 상부 얼굴 높이 비율(WHR), 둘레 대 면적 비율(PAR), 눈 크기(ES), 얼굴 대 얼굴 높이 비율(LF/FH), 얼굴 너비 대 얼굴 높이 비율(FW/LFH), 눈썹 높이 평균(MEH) 

 

7가지 얼굴 특징

 

2.3 Normalization

 

 

μ is the mean value and σ is the standard deviation, computed from the training data along each feature dimension.

BMI를 더 잘 예측하기 위해 특징 정규화가 중요하다는 것을 발견

 

 

2.4 Statistical learning (통계적 학습)

(3개의 모델을 각각 사용한 것으로 생각됨)

 

1. Support vector regression (SVR)

 

 

출처 : 논문

 

 

2. Least squares regression

 

출처 : 논문

 

 

3. Gaussian process regression

 

 

3. facial feature과 BMI의 상관관계

 

Pearson's correlation 이용

: 두 변수 집합의 상관관계를 측정하는 데 사용됨

 

출처 : 논문

 

r은 -1 <= r <= 1 

r < 0 이면 X와 Y 사이 음의 상관관계

r > 0 이면 X와 Y 사이 양의 상관관계

r = 0 이면 상관관계 X

-1과 1에 가까울수록 강한 상관관계

 

위의 Pearson's 상관계수는 관측된 표본으로부터 계산된다.

표본 수가 많다고 하더라도 전체 모집단에서 측정한 상관관계와 같지 않다.

모집단으로 확장하기 위해 통계량을 사용하여 가설 검정을 수행한다.

 

p-value는 특정 가설이 참인 방법을 설명한다.

p-value를 사용하여 계산된 얼굴 특징이 BMI 사이의 유의한 상관관계가 존재하는지 여부를 나타낸다.

p-value가 작을수록 상관관계가 높다고 생각되어진다.

따라서 p-value가 임계값(ex)0.001, 0.01, 0.05)과 같거나 작으면 얼굴 특징과 BMI 사이에 유의한 상관 관계가 있음을 나타낸다.

 

4. Experiments

 

p-value<= 0.05일 때 유의한 상관관계로 간주한다.

 

 

facial features과 BMI 사이의 상관관계 측정 (출처 : 논문)

 

Table3에서 보면 모든 상관관계는 두 데이터 집합의 p-value가 매우 작다는 것을 알 수 있다.

이는 추출된 얼굴 특징이 BMI와 상관관계가 있음을 나타낸다.

 

 

나이 - facial features과 BMI 사이의 상관관계 측정 (출처 : 논문)

 

 

 

출처 : 논문

 

위 그래프에서 보듯이 전반적으로 SVR 방법이 GP 및 LSE 방법보다 더 잘 수행된다는 것을 관찰할 수 있다.

성능 예측은 MAE(mean absolute error)를 사용한다.

 

출처 : 논문

 

위 그래프는 저채중, 정상, 과체중, 비만 등 다양한 BMI 범주에 속하는 SVR, GP, LSE의 MAE를 보여준다.

세가지 방법 모두 정상과 과체중 BMI 범주에서 잘 수행된다는 것을 알수있다.

정상 BMI 범주가 전체 중 55%, 과체중이 30% 정도 포함되어 이 두 범주는 전체 집합의 약 85%를 차지한다.

따라서 더 나은 BMI 성능을 예측하기 위해서는 많은 수의 훈련예제가 필요하다는 것을 암시한다.

SVR은 저체중 및 정상에서 더 나은 반면, GP는 과체중 및 비만에서 더 나아 보인다.

SVR의 오차가 전반적으로 가장 작다.

 

5. 결론

 

대형 데이터베이스의 상관계수와 p-value 측정은 계산된 얼굴 특징과 BMI간의 상관관계를 통계적으로 의미 있는 방식으로 보여준다.