영상처리/Depth Estimation

Monodepth 에서 Disparity Smoothness Loss 에 대한 생각(+자연상수의 의미)

미노츄레이 2023. 3. 17. 15:43

Monodepth 1, 2에서 쓰이는 Loss 함수 중에서,

Photometric Loss 에는 또 세부적인 Loss 함수들이 들어있다.

 

그 중 Disparity Smoothness Loss 라는 Term이 있는데,

항 하나하나를 곱씹어보면서 의미를 가슴으로 느껴보고싶었다.

 

Disparity Smoothness Loss

$$ C_{ds}^l=\frac{1}{N}\sum_{i,j}\left|\ \partial_xd_{ij}^l\right|e^{-\left\|\partial_xI_{ij}^l\right\|}+\left|\ \partial_yd_{ij}^l\right|e^{-\left\|\partial_yI_{ij}^l\right\|} $$

 

d는 disparity를,

I는 RGB Image를 말한다.

 

$$ e^{-\left\|\partial_xI_{ij}^l\right\|} $$

$$ e^{-\left\|\partial_yI_{ij}^l\right\|} $$

먼저 자연상수 e가 들어있는 항을 생각해보자.

RGB 이미지에서 각각 x, y 방향에 대한 변화량을 구하고

이를 자연상수의 지수로 놓아서 해당 항의 성장량으로 표현했다. (자연상수의 지수가 왜 성장량인지는 뒤에 설명할 예정)

 

$$ \left|\ \partial_xd_{ij}^l\right|e^{-\left\|\partial_xI_{ij}^l\right\|} $$

$$ \left|\ \partial_yd_{ij}^l\right|e^{-\left\|\partial_yI_{ij}^l\right\|} $$

이후 RGB 이미지에 대한 Disparity 성장성을 부여한다.

Disparity에서 x, y 각각의 변화량에 RGB 변화량에 대한 성장량을 곱하면 된다.

 

이렇게되면 RGB 이미지에서 물체의 경계선(x, y변화량이 커지는 구간)이 있는 부분들이 깊이값에 영향을 주게 된다.

 

RGB 이미지 변화량이 커지면

Disparity 변화량은 작아지도록 텀을 만든 것이다.

 

즉, 물체의 경계면에서 Disparity가 작게 표현이 되고, 이에 따라 물체와 물체 경계면이 좀 더 정확히 표현될 것 이라는 아이디어다.

 

 


자연상수

자연상수 e 에 대해서 어떤 의미였는지 다시 생각해보자.

자연상수 e는 자연의 연속 성장에 대해 표현하는 상수다.

 

무슨 의미일까?

$$ e = \lim_{n\to\infty}\left( 1+\frac{1}{n} \right)^n $$

$$ e = 2.71828... $$


식을 풀어보면 자연로그 e는
100%의 성장률을 가지고 1회 연속 성장할 때의 성장률이다.


다시 나타내보면,
$$ e = \lim_{n\to\infty}\left( 1+\frac{100%}{n} \right)^n $$
이다.

50% 성장률을 가지고 1회 연속 성장한다면 어떻게될까?
$$ e = \lim_{n\to\infty}\left( 1+\frac{50%}{n} \right)^n $$
$$ e = \lim_{n\to\infty}\left( 1+\frac{1}{2n} \right)^{2n/2} $$
$$ e = \lim_{n\to\infty}\left( \left( 1+\frac{1}{2n} \right)^{2n} \right)^{1/2} $$
$$ e = \lim_{x\to\infty}\left( \left( 1+\frac{1}{x} \right)^{x} \right)^{1/2} $$
$$ e = e^{1/2} $$


그렇다면 100%의 성장률을 가지고 2회 연속 성장한다면 어떻게 될까?
$$ e \times e = e^2 $$


따라서 자연상수 e의 지수는 성장률을 뜻하게 된다. 더 정확히 설명하자면 연속 성장률이다.
식으로 표현하면,
$$ e^{성장률 \times 연속성장횟수} $$
이다.