다변량 자료를 차원축소기법을 사용하여 서열구조를 파악하기 위한 방법
Redundancy analysis (RDA, 중복분석)
- 반응변수와 설명변수가 여러개인 회귀분석
- 가장 설명력이 좋은 변수를 찾아내는 것
- RDA는 PCA의 canonical version으로서, 설명변수에 의해 축이 제한됨
- 이 떄, missing value는 column average에 의하여 대체
- 연관관계를 직접적으로 표현이 가능함
Principal Component Regression (PCA, 주성분 분석)
- 구성을 가장 잘 설명하는 변수를 찾아내는 것
- 대사체와 같이 많은 data base에서 구분짓는 축을 찾는데 이용
- PLS-DA / OPLS-DA와 다르게 separation에 대한 정보를 제공하지 않고 분석 진행
- 여러 환경변수가 혼재되어 해석이 난해 할 수 있음
통계를 독학으로 공부하면서 정리한 내용입니다.
전문적으로 배운 내용이 아니기 때문에 참고만 해주세요 *^^*
'Study' 카테고리의 다른 글
Microbiome Diversity - Alpha &Beta (0) | 2022.08.03 |
---|---|
Association analysis - RDA (0) | 2022.07.26 |