본 프로젝트를 진행하면서 정말 많은 변수를 얼마나 어떻게 의미있게 축소하는지가 관건이라고 생각했다.
각 공정에서의 데이터에서 사출 장치의 좌표값에 대한 데이터들이 x, y, z축의 형태로 제공이 되었는데 팀원 중 한 분이 이 3차원 데이터를 1차원으로 PCA, 즉 주성분 분석을 통해 축소시켰다.
이런 식으로 3차원의 데이터의 차원을 저차원으로 줄였다고 볼 수 있다. 2차원의 그래프로 보이지만 애초에 왼쪽 수치는 빈도 수를 나타내고 아래 수치의 값에 분포한다고 볼 수 있을 것 같다.
실제 프로젝트에서 PCA를 쓴 경험은 처음 봐서 나름 공부가 되는 것 같다.
이렇게 여러가지 3차원 데이터들을 차원 축소시켜도 원래의 데이터의 대표성을 갖고 있어 좋은 방법인 것 같다.
'프로젝트 > 제품 이상 여부 판별 프로젝트' 카테고리의 다른 글
LG AI 해커톤 5기 예선 최종 점수 결과 공개 (0) | 2024.09.03 |
---|---|
언더보단 오버샘플링? (0) | 2024.08.26 |