OpenCV (C ++ / Python)를 사용한 딥 러닝 기반 휴먼 포즈 추정

9월 11, 2019

http://34.210.74.193/deep-learning-based-human-pose-estimation-using-opencv-cpp-python/

이 튜토리얼에서는 OpenCV에서 인간 포즈 추정을 수행하기 위해 Deep Neural Net 모델을 사용하는 방법에 대해 설명합니다. 2016 년 COCO 키포인트 도전 과제를 수상한 사전 훈련 된 Caffe 모델을 사용하는 방법에 대해 자세히 설명합니다. 우리는 간단히 아키텍처를 살펴보고 후드 아래에서 무슨 일이 일어나고 있는지에 대한 아이디어를 얻습니다.

참고 : 코드를 실행하려면 OpenCV 버전 3.4.1 이상이 필요합니다.

1. 포즈 추정 (일명 키포인트 감지)

포즈 추정은 컴퓨터 비전에서 물체의 위치와 방향을 감지하는 일반적인 문제입니다. 이것은 일반적으로 객체를 설명하는 키포인트 위치를 감지하는 것을 의미합니다.

예를 들어, 얼굴 포즈 추정 (일명 얼굴 랜드 마크 검출)의 문제에서, 우리는 인간 얼굴의 랜드 마크를 검출합니다. 우리는 주제에 대해 광범위하게 글을 썼습니다. (에 우리의 문서를 참조하십시오 얼굴 랜드 마크 감지 사용을 OpenCV 와 Dlib를 사용하여 얼굴 랜드 마크 감지 )

이와 관련된 문제는 얼굴 랜드 마크를 사용하여 카메라에 대한 사람 머리의 3D 방향을 얻는 헤드 포즈 추정 입니다.

이 기사에서는 신체의 주요 부분 / 관절 (예 : 어깨, 발목, 무릎, 손목 등)을 감지하고 국소화해야하는 인간 자세 추정에 중점을 둘 것입니다.

Tony stark가 제스처를 사용하여 Iron Man 슈트를 입는 장면을 기억하십니까?

그러한 복장이 만들어지면 인간 자세 추정이 필요합니다!

하지만이 기사의 목적을 위해 우리는 야심을 조금 낮추고 신체의 키포인트를 감지하는 간단한 문제를 해결합니다. 포즈 감지기의 일반적인 출력은 다음과 같습니다.

1.1. 키포인트 감지 데이터 세트

최근까지는 고품질 데이터 세트가 없기 때문에 포즈 추정에 거의 진전이 없었습니다. AI에 대한 열정은 요즘 사람들은 모든 문제가 철거되는 것보다 좋은 데이터 세트라고 생각합니다. 지난 몇 년 동안 일부 까다로운 데이터 세트가 발표되어 연구원들이 모든 지적 능력으로 문제를 쉽게 공격 할 수있었습니다.

일부 데이터 세트는 다음과 같습니다.

중요한 데이터 집합을 놓친 경우 의견에 언급 해 주시면이 목록에 기꺼이 추가하겠습니다.

2. 다자 포즈 추정 모델

이 튜토리얼에 사용 된 모델 은 Carnegie Mellon University의 Perceptual Computing Lab이 작성한 다중 인물 포즈 추정 논문을 기반으로합니다 . 이 논문의 저자는이 작업을 위해 매우 깊은 신경망을 훈련시킵니다. 사전 훈련 된 모델을 사용하는 방법을 설명하기 전에 아키텍처를 간단히 살펴 보겠습니다.

이 블로그 검색

tomatolinux