1. 아래와 같은 데이터가 있을때 Standard Score - 표준점수 z 로 
어떻게 표준화가 되는지 살펴보자.





2. 파이썬 sklearn 코드

>>> data = [[0, 3], [2, 0], [1, 1], [6, 0]]
>>> pd.DataFrame(data)
0 1
0 0 3
1 2 0
2 1 1
3 6 0
>>> scaler = StandardScaler()
>>> print(scaler.fit(data))
StandardScaler(copy=True, with_mean=True, with_std=True)
>>> print(scaler.mean_)
[2.25 1. ]
>>> print(scaler.transform(data))
[[-0.98787834 1.63299316]
[-0.10976426 -0.81649658]
[-0.5488213 0. ]
[ 1.6464639 -0.81649658]]
 
3. 어떻게 표준화가 계산된 것일까?




이렇게 표준화를 하면 feature 간의 scale 을 맞출수 있게 된다.