목록분류 전체보기 (79)
속도 < 방향

edwith CS50강의를 보며 정리했습니다. ● 2진수 입력과 출력은 무엇일까? 우리는 컴퓨터가 0과 1만 사용하고 0,1로만 이해한다는 것을 안다. 하지만 과연 0,1 두 숫자로 노트북이나 pc가 어떻게 작동하는지 설명할 수 있을까? 일상생활에서는 일반적으로 10진수(decimal)를 사용한다. '10'이라고 하는 이유는 0에서 9까지의 숫자 10개를 사용하기 때문이다. 2진수(binary)는 0과 1까지의 숫자 2개만을 사용한다. 컴퓨터는 0과 1만으로도 어떤 데이터든 충분히 표현할 수 있다. 숫자, 문자, 그래픽, 영상 등 모든 정보가 가능하다. 우리가 위의 그림을 본다면 본능적으로 1,2,3 숫자 3개로 인식할 것이다. 왜냐하면 우리가 어릴 때 숫자를 배울 때 10 단위로 생각하도록 배웠기 때문..

edwith CS50강의를 보며 정리했습니다. ● 비트 단위 정보의 최소 단위인 비트의 개념을 설명하려 한다. '손 들어', '불 꺼' 등과 같은 정보를 실생활에서는 컴퓨터 세계에서는 전기의 유무로 판단한다. True/False 등을 0,1 의 비트 개념으로 부호화할 수 있다. 하지만 하나의 비트로 쓰이는 것은 비효율적이기 때문에 최소 8개의 비트를 사용하여 하나의 문자를 표현한다. 즉, 1바이트(byte) 는 8비트(bit)로 이루어져 있다. 하지만 1바이트도 유용하지는 않다. 우리가 일상생활에서 대화를 하거나 메시지, 메일을 보낼 때에는 여러 바이트가 필요하기 때문에 보통은 바이트의 단위가 아닌 킬로바이트(kb)의 단위로 사용을 하기 시작한다. 1kb는 1,000byte로 이루어져 있다. 사실 정확히..

Chapter 5. 회귀 모델은 시계열 y 를 예측할 때 이것이 다른 시계열 x와 선형 관계가 있다고 가정하는 것이 기본 개념이다. 목표 예상변수(forecast variable) y 는 회귀선, 종속변수, 피설명 변수라고 부르기도 한다. 예측변수(predictor variable) x는 회귀자, 독립변수, 설명 변수라고 부르기도 한다. 5.1 선형 모델 단순 선형 회귀 회귀 모델이 목표 예상 변수 y 와 하나의 예측 변수 x 사이의 선형 관계를 다루는 경우가 가장 간단하다. β0와 β1는 각각 직선의 절편과 기울기를 나타내며, β0은 x가 0일 때 예측되는 y의 값을 나타낸다. β1는 x가 1만큼 증가했을 때 예측되는 y의 변화를 의미한다. 여기서 주목해야 할 것은 관측값이 직선 위에 있는 것이 아니라..

구글 클라우드 플랫폼(Google Cloud Platform) 은 구글에서 제공하는 클라우드 컴퓨팅 서비스다. 고객에게 서비스를 하기 위해 내부적으로 구글에서 사용하는 것과 동일한 infra structure 위에서 호스팅을 제공하는 서비스로, Amazon Web Services, Microsoft Azure 에 이어 전 세계 클라우드 컴퓨팅 시장에서 3위를 차지하고 있다. 구글 클라우드를 사용하려면 공식 홈페이지에서 사용이 가능하다. 위처럼, 신규 회원에게는 $300 의 크레딧이 제공되며, 90일간 무료로 사용할 수 있다. 구글 계정이 있는 경우 무료로 시작하기를 눌러 그대로 사용하면 되며 다른 클라우드 플랫폼과 마찬가지로 신용카드/체크카드 등의 결제수단을 등록해야 한다. 카드를 등록하는 이유는 프로그..

과거 데이터가 전혀 없거나 완전히 새로우면서 독특한 시장 상황 등 특수한 상황에서 판단 예측 (judgmental forecasting) 을 사용할 수밖에 없다. 1) 이용할 수 없는 데이터가 없어 통계 기법을 적용할 수 없고 판단 예측으로만 접근이 가능한 경우 2) 이용할 수 있는 데이터가 있고 통계적인 예측값을 생성했고 판단을 이용하여 조정하는 경우| 3) 이용할 수 있는 데이터가 있고 통계적인 예측값과 판단 예측값을 독립적으로 내고 그 둘을 결합하는 경우 위와 같은 경우에 판단 예측을 사용할 수 있으며 일반적으로 통계적인 예측값은 판단만 이용하여 예측한 값보다 뛰어나다. 4.1 한계점에 주의하기 판단 예측값은 주관적이라 편견이나 한계점에 노출될 수밖에 없다. 사람의 인지력에 크게 의존하기 때문에 일..

06. 비지도 학습 06-1 군집 알고리즘 시작하기 전에 과일의 여러가지 사진을 어떤 과일인지 찾기 위해 자동으로 분류하는 프로그램을 만들어 보려 한다. chapter 2에서 배운 것처럼 타깃을 모르거나 타깃이 없을 때 사용하는 머신러닝 알고리즘을 비지도 학습(unsupervised learning)이라고 한다. 가르쳐 주지 않아도 데이터에 있는 무언가를 학습하도록 하기 위한 방법이 무엇이 있을까? !wget https://bit.ly/fruits_300_data -O fruits_300.npy 처음에 숫자 0 인줄 알았는데, 계속 에러가 나길래 봤더니 open 의 알파벳 O 였다... import numpy as np import matplotlib.pyplot as plt fruits = np.loa..

[업데이트 : 2022-02-17] 논문 : Rethinking on Multi-Stage Networks for Human Pose Estimation 2019년에 발표된 Rethinking on Multi-Stage Networks for Human Pose Estimation 논문의 Summary 겸 리뷰를 적어보려고 합니다. 글을 쓰기에 앞서, 공부를 위해 논문을 보며 요약, 작성한 내용이라 간혹 오역이나 잘못된 내용이 있을 수 있습니다. 핵심 키워드는 highlight를 해두었습니다. 틀린 부분은 댓글로 알려주시면 감사하겠습니다^^ 편의상 경어체를 빼고 작성합니다. 시작하기 전에 내가 뽑은 키워드 : Pose estimation, bottleneck, 단일 단계 (single-stage) , 복..

Forecasting : Principles and Practice 온라인 교재를 보며 참고하였습니다. Chapter 3. 예측을 하는 데 있어 유용한 도구들과 예측 작업을 단순하게 만드는 법, 예측 기법에서 이용 가능한 정보를 적절하게 사용하게 사용했는지 확인하는 법, 예측구간(prediction interval)을 계산하는 기법 등을 살펴볼 것이다. 3.1 몇 가지 단순한 예측 기법 평균 기법 예측한 모든 미래의 값은 과거 데이터의 평균과 같다. 과거 데이터를 y1,…,yTy1,…,yT라고 쓴다면, 예측값을 다음과 같이 쓸 수 있다. meanf(y, h) # 시계열, 예측범위 단순 기법(naïve method) 단순 기법에서는 모든 예측값을 단순하게 마지막 값으로 둔다. 이 기법은 금융 시계열을 다룰..

족장님, 한빛미디어 사랑합니다..♥ 05. 트리 알고리즘 05-1 결정 트리 시작하기 전에 와인을 알코올, 당도, pH 값을 활용하여 분류해보려고 한다. import pandas as pd wine = pd.read_csv('https://bit.ly/wine_csv_data') wine.info() 데이터를 불러온 후 info() 메서드를 사용하면 데이터프레임의 각 열의 데이터 타입과 누락된 데이터 여부를 알 수 있다. 6497개의 샘플 중 non-null count가 6497 이므로 누락된 값은 없는 것을 알 수 있다. 만약 누락된 값이 있다면 그 데이터를 버리거나 평균값으로 채운 후 사용할 수 있는데, 그렇게 하는 과정에서도 훈련 세트의 통계 값으로 테스트세트를 변환해야 한다. 즉, 훈련 세트의 평..

Forecasting : Principles and Practice 온라인 교재를 보며 참고하였습니다. Chapter 2. 데이터 분석 작업에서 가장 먼저, 많이 하는 것이 데이터 시각화다. 그래프를 통해 패턴, 관측값, 변수에 따른 변화, 변수 사이의 관계 등 데이터의 많은 특성을 파악할 수 있다. 데이터 시각화 과정은 예측 기법에 반드시 포함되어야 한다. 2.1 ts객체 시계열이란 각 숫자가 기록된 시간에 관한 정보가 있는 숫자들의 목록이다. R에서는 이러한 정보를 ts 객체로 저장할 수 있다. y