일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 한-캐대학원
- 태블로
- 태블로행정동
- torch.nn.Linear
- sql코테준비
- 태블로에러
- 맵지도
- 행정동표시
- 태블로맵
- 한국캐나다대학원연수
- 코테select
- 단어뒤집기
- wishart gamma random effect model
- wishart parameter 추정법
- 맵지도시각화
- 조세퍼스 문제
- wishart laplace transform
- dependency modeling
- d similar
- 백준 알고리즘 기초1
- d similar matrices class
- iris대학원
- wishart-gamma
- 대학원연수프로그램
- 태블로맵지도시각화
- random effect model
- 모수추정
- explicit random effect model
- 이공계 대학원 연수 프로그램
- 행정동시각화
- Today
- Total
수리통계 분석 코딩 실습
[한-캐] The concept of D-similar matrix 본문
✔️ Wishart distn 모수인 추정치 $\Sigma$를 결정짓는 방법인 D-similar matrix를 알아보자!
[process]
[Concept] - [Method]
1. Concept
D-similar matrix라는 개념은
만약 SPD matrix라면 Signed Diagonal matrix를 곱해도 여전히 nonnegative symmetric하며 D를 곱해 구해진 두 matrix는 D-similar라고 부른다. 다시말해, D-similar matrix의 경우 eigenvalue가 같다.
↔︎
예를 들어 다음과 같은 A matrix가 있을 때, D:= diag(-1,1,1)라면 두 matrix는 같은 eigenvalue를 갖는다. eigenvalue를 구하는 방법은 det(A - lambda*I) where I = identity matrix(n)을 풀면 된다. 어려우면 R에서 matrix를 정의하고 eigen(A)를 써도 된다.
특히 D를 곱할 때, diag(-1,1,1)을 곱하는 의미는 원래 기존 A 행렬에 대해, 1행 1열의 부호를 바꾸라는 뜻이다.
그렇다면 원래 nxn matrix의 경우 D-similar matrix를 고려할 때, $2^n$ 개의 같은 eigenvalue를 갖는 matrices가 있음을 알 수 있다.
그런데, D = -D이므로, 우리가 추정해야하는 matrices 수는 $2^{n-1}$이다.
예를 들어 앞선 A matrix를 고려해보면, D := diag(-1,1,1) ↔︎ D:= diag(1,-1,-1)의 결과를 보인다는 뜻이다.
D := diag(-1,1,1) 의 경우 1행 1열을 바꾸고, D:= diag(1,-1,-1) 경우 2행 2열 & 3행 3열의 부호를 바꾸면 두 행렬이 동치관계임을 쉽게 보일 수 있다.
n=3일 땐, 아래 같은 셋들이 pair를 이뤄서 4개의 D-similar matrix를 보인다. $# = 2^{3-1}$ 총 4개
n=4 일땐,
아래 matricese들이 동치 관계에 있다. $# = 2^{4-1}$, 총 8개
2. Method
Wishart-Gamma의 parameter인 $\Sigma$를 추정할 때, 절대값으로 추정되는 $\Sigma$의 추정치 중 어느 $\Sigma$가 잘 추정된 $\Sigma$인지 class 를 나눌 때 유용하게 사용되는 개념이다.
다시말해, Wishart estimation의 결과는 true $\Sigma$값이 있을 때, 기존의 $\Sigma$에 절대값이 취해진 값이 추정되기 때문에 어떤 sign을 줄 지 결정해야 한다.
그런데 각 $\Sigma$는 D-similar한 개수만큼 같은 eigenvalue를 가지므로, 다른 eigenvalue를 가진, 다시말해 non D-similar matrix의 대표값을 추정해서 어떤 $\Sigma$ 추정치가 joint distribution($U_i, U_j$)의 log-likelihood 값을 잘 대표하는 지 찾아주면 된다.
(그래서 추후 페이퍼에선 joint log-likelihood 값을 이용해서 어떤 추정치가 더 나은 추정치인지 보여준다)
그러려면 추정해야하는 class의 개수와 각 class 별 D-similar matrices의 수를 아는 것이 중요하다.
앞서, nxn matrix에 대해서 한 sign matrix에 대해 D-similar matrix의 총 개수는 $2^{n-1}$라고 했다.
그렇다면, 각 matrix element의 부호를 바꾸면 각 부호 별로 D-similar matrix가 총 $2^{n-1}$개 씩 있을 것이다.
그렇다면 총 고려해야 할 signed matrix는 몇 개일 까?
이때, Wishart distn parameter $\Sigma$의 경우 Symmetric하므로 diagonal과 upper diagonal term의 부호만 바꾼 걸 고려하면 되므로, 총 $2^{\frac{n(n-1)}{2}}$ 개의 부호만 고려하면 된다.
다시말해, sign이 바뀌는 경우를 고려해보면, Symmetric이므로 upper diagonal(or lower diagonal)의 값만 sign이 바뀌는 경우를 고려하면 되므로 총 $2^{\frac{n(n-1)}{2}}$개의 distinguishable matrices class가 있는 것을 알 수 있다.
그리고 각 class의 수 $2^{\frac{n(n-1)}{2}}$는 항상 각 class 별 element 수인 $2^{d-1}$보다 크므로, 결국 앞서 정의한 matrix의 sign이 바뀌는 경우 각 sign당 총 추정해야하는 class는 $2^{\frac{(d-1)(d-2)}{2}}$임을 알 수 있다.
그렇다면 각 class를 나누는 matrices는 어떻게 추정할까? 다시말해, $2^{\frac{(d-1)(d-2)}{2}$에 대한 matrices set은 어떻게 찾을 수 있을까?
사실 이 방법은 thm으로 정의된 것이 아니라 양루 교수님께서 알려주신 방법인데 어떻게 찾으신 건지 모르겠다. 어떻게 아래 방법이 D-similar의 각 representative 값을 찾는 방법이 되는 지 궁금하다.
여쭤봤는 데 명확히 설명해주시지 않더라 다음에 차분히 증명을 해봐야겠다. 아니면 너무 쉽게 derive 되는 건가
정말 쉽게 첫번째 행은 nonegative 값으로 고정하고 그 뒤로 그 아래 행 중 upper diagonal term에 sign을 주는 경우를 고려하면 된다.
예를 들어 dimesion = 3인 경우 [2,3]의 element가 +인지 -인지만 distinguishable matrix(eigenvalue가 다른 행렬)이 되는 거다.
이렇게 Wishart parameter의 비교셋을 구하고 앞서 말했듯 joint log-likelihood approximation (defined as eq.1 in study)로 최적 $\Sigma$를 결정 지으면 된다.
'대학원 > 한-캐나다 대학원 연수' 카테고리의 다른 글
[한-캐] 연수 프로젝트: Wishart-Gamma Random Effect Model (0) | 2024.12.29 |
---|---|
[한-캐] 연수 프로젝트: 연구 소개 (0) | 2024.12.17 |
[한-캐] 캐나다 대학 연계 대학원 생 연수 프로그램 (0) | 2024.12.16 |