본문 바로가기

728x90

study/영상처리 & opencv

(11)
[논문 요약] Face-to-BMI: Using Computer Vision toInfer Body Mass Index on Social Media Face-to-BMI: Using Computer Vision to Infer Body Mass Index on Social Media Face-to-BMI: 소셜 미디어에서 체질량 지수를 추론하기 위한 컴퓨터 비전 활용 0. Introdution 본 논문에서, 프로필 사진과 같은 소셜 미디어 이미지에서 개인의 BMI를 추론하기 위해 최첨단 컴퓨터 비전 기술을 사용하는 새로운 파이프라인을 제안한다. 주어진 데이터 이미지 쌍을 구별하는 성능이 더 과체중인 사람일수록 인간의 성능과 비슷하다는 것을 보여준다. 1. Related Work 아래의 논문에서의 데이터 set은 배경이 깨끗한 여권 스타일의 전면 사진만 구성했기 때문에 노이즈가 많은 소 셜 미디어 사진의 경우 BMI 예측 모델의 성능이..
[논문 요약] A computational approach to body mass index prediction from face images A computational approach to body mass index prediction from face images 얼굴 이미지로부터 체질량 지수 예측에 대한 계산적 접근법 통계적 방법으로 얼굴 이미지를 통해 BMI를 예측할 수 있다. 0. BMI BMI : 개인의 키와 몸무게를 기준으로 한 체지방의 척도 단위에 따라 계산 식이 나눠진다. BMI를 기준으로 저체중, 정상, 과체중, 비만으로 나눠진다. 1. 데이터 : MORPH-II database MORPH-II는 약 55000개의 얼굴 이미지. 이 데이터에서 연령, 성별, 민족 분포 등의 불균형때문에 약 96%에 해당되는 White and Black faces image만을 연구에서 사용한다. 또한 성별과 연령대 분포를 고..
[opencv] 3개의 사진 Panorama(image stitching) Panorama 구현 과정 1. Image stitching을 수행할 이미지들을 획득한 후 로드 한다. Grayscale로 변환해서 사용한다. 2. SURF 알고리즘을 사용하여 각 이미지의 특징점을 추출한 후 이미지들 간의 특징점을 비교하여 좋은 특징점들끼리 매칭시킨다. 3. 이미지들을 하나의 평면에 투영시키기 위해서 이미지 간의 변환관계(Homography)를 계산한다. 이때 모델 파라미터의 예측을 방해하는 대응점(Outlier)로부터 정확한 변환관계를 구축하기 위해 RANSAC 알고리즘을 사용한다. 4. 앞에서 계산한 Homography를 사용하여 이미지에 회전 변환을 적용하여 Image stitching을 실행한다. 주요 알고리즘 이론 : SURF, RANSAC, Homography 환경 : ope..
[영상처리] 가우시안(Gaussian) 필터 가우시안 필터는 저역 통과 필터로써 가우시안 확률분포 함수를 기반으로 구성된다. - 가우시안 필터의 푸리에(Fourier) 변환은 또 다른 가우시안 - 회전에 대해서 대칭 - 분리 가능 : 2차원 필터링--> x방향으로 1차원 필터링 + y 방향으로 1차원 필터링 으로 수행가능 - 2개의 가우시안 필터를 convolution 처리하면 그 결과 역시 다른 가우시안 필터 - 이미지를 흐리게 하거나 노이즈를 줄이는 것에 많이 사용 Matlab으로 구현한 Gaussian filter --> a는 필터 크기, s는 표준 편차 g1 = fspecial('gaussian', [5, 5]); a = 50; s=3; g = fspecial('gaussian', [a, a], s); surf(1:a, 1:a, g); s ..
[영상처리] Homogeneous coordinates darkpgmr.tistory.com/78[영상 Geometry #2] Homogeneous Coordinates(3D 비전 geometry 2번째 파트 homogeneous coordinates 입니다) 2. Homogeneous Coordinates 먼저, 들어가기 앞서 http://blog.daum.net/shksjy/229 글을 읽어보기를 추천합니다. Homogeneous Coordinate에 대한..darkpgmr.tistory.com위의 블로그 글을 정리 요약한 것. 하나의 이미지로 투영되는 3D에서의 좌표계를 이미지와 연결할 때 나타나는 투영선상의 모든 점들이 Homogenous 좌표로 표현된다. 어렵다 ......
[영상처리] 2D변환 - Rigid Transformation 출처 : darkpgmr.tistory.com/79 [영상 Geometry #3] 2D 변환 (Transformations) (3D 비전 geometry 3번째 파트 2D 변환입니다) 3. 2D 변환 (2D Transformations) 변환에 대해서는 2D 변환과 3D 변환을 구분해서 설명하겠습니다. 2D 변환은 detection 또는 tracking 문제에 있어서 아래 그림과.. darkpgmr.tistory.com 위 블로그의 Rigid 변환 부분 공부하고 요약 정리한 것. 의문점 : Rigid 변환에서 스케일 변화까지 고려하여 변환 후 나중에 스케일을 제거 한다. 이유는 회전 변환은 원점을 기준으로 하기 때문에 만일 두 점의 원점사이의 거리가 다르다면 이러한 회전 행렬이 존재하지 않기 때문......
[영상처리] RANSAC 알고리즘 출처 : darkpgmr.tistory.com/61 RANSAC의 이해와 영상처리 활용 영상처리나 컴퓨터 비전을 하면서 RANSAC을 모르면 간첩일 정도로 RANSAC은 너무나 유명한, 그리고 널리 사용되는 방법이다. RANSAC이 유명한 만큼 이미 인터넷에 관련된 글들이 꽤 있다. 그럼에도 darkpgmr.tistory.com 위 글을 읽고 요약정리한 것.
[opencv] 직선 검출(Line Detection) 참고 출처 : https://076923.github.io/posts/Python-opencv-28/ https://opencv-python.readthedocs.io/en/latest/doc/25.imageHoughLineTransform/imageHoughLineTransform.html https://ko.wikipedia.org/wiki/%ED%97%88%ED%94%84_%EB%B3%80%ED%99%98 직선 검출 알고리즘: 허프 변환(Hough Transform)을 활용 (위 출처의 이론적인 설명이 자세하게 나와 있습니다 ) 위의 사진처럼 3개의 점에 대해서 원점에서 각 점까지의 거리를 𝜃, r로 표현할 수 있다. 이 곡선은 각 점(x, y)에 대해서 r=xsinθ+ycosθ을 만족한다. 허프 ..

반응형