분류 전체보기(756)
-
[이론정리] Line plot
꺾은선 그래프 시계열 분석에 특화 .plot() Line plot의 요소 색상(color) 마커(marker, markersize) 선의 종류(linestyle, linewidth) noise를 줄이기 위해 smoothing 사용(평균) 전처리가 필요 정확한 line plot 꼭 축을 0에 초점을 둘 필요는 없음 추세에 집중!!!!!!! 간격 규칙적인 간격이 아니면 오해를 줄 수 있다. 점을 잇는 보간은 일반적인 분석에서는 지양 이중 축 사용 한 plot에 대해 2개의 축을 사용 서로 다른 종류의 데이터를 표현하기 위해 한 데이터에 대해 다른 단위 But 그래프 두 개 사용하는 것이 가독성이 높음 Etc Min/max 정보 Uncertainty 표현
2023.03.23 -
[이론 정리] Bar plot
직사각형 막대를 이용해 데이터의 값을 표현하는 차트 .bar() vertical, .barh() horizontal 플롯을 여러 개 그리는 방법 한 개의 플롯에 동시에 나타내는 방법 1. 쌓아서 표현 그룹의 순서는 항상 유지 맨 밑의 분포만 알기 쉬움 Percentage stacked bar chart 2. 겹쳐서 표현 2개 그룹만 비교한다면 겹쳐서 만드는 것도 하나의 선택지 투명도 조절 3. 이웃에 배치하여 표현 그룹별 범주에 따른 바를 이웃되게 배치 수치형 데이터가 적합 5-7 이하일때 효과적. Etc, 상위 몇 개만 그리고 정확한 바 플롯 실제값과 그에 표현되는 그래픽으로 표현되는 잉크 양은 비례해야함 x축의 시작은 0 가독성 높이기 위해 X 데이터 정렬 순서가 있으면 정렬 여러 가지 기준으로 정렬..
2023.03.23 -
[이론 정리] 데이터 시각화의 요소
1. 데이터의 종류 데이터의 구조에 따라 정형 데이터(테이블) 시계열 데이터(시간이 있는 데이터) 지리/지도 데이터 관계 데이터(객체간의 관계를 나타내는 데이터) 계층적 데이터(관계 중에서도 포함 관계가 분명한 데이터) ex) 트리 구조 하나의 데이터의 특성에 따라 수치형 -연속형(온도, 시간) -이산형(학생수, 동전수) 범주형 -명목형(혈액형, 별자리) -순서형(등급, 학년) 2. 시각화의 요소 마크와 채널 마크: 점, 선, 면으로 이루어진 데이터 시각화 채널: 각 마크를 변경할 수 있는 요소들 전주의적 속성(주의를 주지 않아도 인지하게 되는 요소) 예) visual pop-out(검은색 점들 중 빨간색 점)
2023.03.23 -
[이론 정리] Generative model
생성 모델. 면적이 256인 이미지를 만든다고 생각해보자. 하나의 픽셀이 다른 픽셀과 모두 연관되어 있다고 한다면 필요한 파라미터의 개수는 $2^{256}-1$개이다. 여기서 알 수 있듯이 모두 연관되어 있다고 가정하게 되면 파라미터의 개수는 너무 많아지게 되고 이는 모델 성능의 저하로 이어지게 된다. 따라서 파라미터의 개수를 줄여야 한다. 그렇다면 서로의 픽셀에 하나도 영향을 주지 않는다고 가정해보자. 그렇게 되면 필요한 파라미터의 개수는 256개 즉 픽셀 수만큼만 필요하게 된다. 그러나 서로 연관이 안되어 있다고 하면 생성을 할 수가 없다. 왜냐하면 결국 이미지는 관계에 의해 생성이 되는 시퀀셜 데이터이기 때문이다. 이를 보완하기 위해 조건부 독립이 도입되었고 이는 각 픽셀이 오직 그 전 픽셀에만 영..
2023.03.23 -
[이론 정리] CNN(Convolutional Neural Network)에 대하여
Convolution이란 이미지 분야에서 사용되는 연산으로 filter를 이용하여 input의 값을 변화시킨다. 각각의 filter가 어떻게 구성되는지에 따라 output은 달라진다. 예를 들어, 3 X 3 average filter의 경우 각각의 원소는 1/9의 값을 가지게 되고 이는 결과적으로 blur한 영상을 만드는데 이용된다. CNN 크게 3 part로 구성이 된다: convolution layer, pooling layer, fully connected layer Convolution layer는 image로부터 원하는 feature를 추출하는데 사용된다. Pooling layer는 그렇게 추출된 결과의 spatial dimension을 줄이는데 사용된다. Fully connected layer..
2023.03.21 -
[이론 정리] pytorch를 쉽게 사용할 수 있는 Tool(Pytorch Lightning)
💯 pytorch를 상위레벨에서 사용할 수 있도록 하는 Tool 두 가지 Fast ai: pytorch를 쉽게 사용하도록 해주는 라이브러리 Pytorch lightning: 연구자들이 pytorch를 쉽게 사용할 수 있도록 하는 파이썬 라이브러리 참고) Fastai 노트북 상당히 잘 나와있음 코드가 좋다. course22p2 12번까지 이해해보면 좋다. ⚡ pytorch LIghtning에 대하여 ⚡ 사용방법 Lightning module class 안에만 넣으면 됨 알아서 연결해서 train 시켜줌 (기존 함수 오버라이딩해줌) ⚡ 연구에서 사용하는 이유 lightning이 조금 더 low level로 구현이 가능하기 때문 최대 장점 병렬 학습하는데 좋음 Wandb 쓰는게 편함 Fast ai는 한줄로 학..
2023.03.20