목록전체 글 (76)
속도 < 방향
구글 클라우드 플랫폼(Google Cloud Platform) 은 구글에서 제공하는 클라우드 컴퓨팅 서비스다. 고객에게 서비스를 하기 위해 내부적으로 구글에서 사용하는 것과 동일한 infra structure 위에서 호스팅을 제공하는 서비스로, Amazon Web Services, Microsoft Azure 에 이어 전 세계 클라우드 컴퓨팅 시장에서 3위를 차지하고 있다. 구글 클라우드를 사용하려면 공식 홈페이지에서 사용이 가능하다. 위처럼, 신규 회원에게는 $300 의 크레딧이 제공되며, 90일간 무료로 사용할 수 있다. 구글 계정이 있는 경우 무료로 시작하기를 눌러 그대로 사용하면 되며 다른 클라우드 플랫폼과 마찬가지로 신용카드/체크카드 등의 결제수단을 등록해야 한다. 카드를 등록하는 이유는 프로그..
과거 데이터가 전혀 없거나 완전히 새로우면서 독특한 시장 상황 등 특수한 상황에서 판단 예측 (judgmental forecasting) 을 사용할 수밖에 없다. 1) 이용할 수 없는 데이터가 없어 통계 기법을 적용할 수 없고 판단 예측으로만 접근이 가능한 경우 2) 이용할 수 있는 데이터가 있고 통계적인 예측값을 생성했고 판단을 이용하여 조정하는 경우| 3) 이용할 수 있는 데이터가 있고 통계적인 예측값과 판단 예측값을 독립적으로 내고 그 둘을 결합하는 경우 위와 같은 경우에 판단 예측을 사용할 수 있으며 일반적으로 통계적인 예측값은 판단만 이용하여 예측한 값보다 뛰어나다. 4.1 한계점에 주의하기 판단 예측값은 주관적이라 편견이나 한계점에 노출될 수밖에 없다. 사람의 인지력에 크게 의존하기 때문에 일..
06. 비지도 학습 06-1 군집 알고리즘 시작하기 전에 과일의 여러가지 사진을 어떤 과일인지 찾기 위해 자동으로 분류하는 프로그램을 만들어 보려 한다. chapter 2에서 배운 것처럼 타깃을 모르거나 타깃이 없을 때 사용하는 머신러닝 알고리즘을 비지도 학습(unsupervised learning)이라고 한다. 가르쳐 주지 않아도 데이터에 있는 무언가를 학습하도록 하기 위한 방법이 무엇이 있을까? !wget https://bit.ly/fruits_300_data -O fruits_300.npy 처음에 숫자 0 인줄 알았는데, 계속 에러가 나길래 봤더니 open 의 알파벳 O 였다... import numpy as np import matplotlib.pyplot as plt fruits = np.loa..
[업데이트 : 2022-02-17] 논문 : Rethinking on Multi-Stage Networks for Human Pose Estimation 2019년에 발표된 Rethinking on Multi-Stage Networks for Human Pose Estimation 논문의 Summary 겸 리뷰를 적어보려고 합니다. 글을 쓰기에 앞서, 공부를 위해 논문을 보며 요약, 작성한 내용이라 간혹 오역이나 잘못된 내용이 있을 수 있습니다. 핵심 키워드는 highlight를 해두었습니다. 틀린 부분은 댓글로 알려주시면 감사하겠습니다^^ 편의상 경어체를 빼고 작성합니다. 시작하기 전에 내가 뽑은 키워드 : Pose estimation, bottleneck, 단일 단계 (single-stage) , 복..
Forecasting : Principles and Practice 온라인 교재를 보며 참고하였습니다. Chapter 3. 예측을 하는 데 있어 유용한 도구들과 예측 작업을 단순하게 만드는 법, 예측 기법에서 이용 가능한 정보를 적절하게 사용하게 사용했는지 확인하는 법, 예측구간(prediction interval)을 계산하는 기법 등을 살펴볼 것이다. 3.1 몇 가지 단순한 예측 기법 평균 기법 예측한 모든 미래의 값은 과거 데이터의 평균과 같다. 과거 데이터를 y1,…,yTy1,…,yT라고 쓴다면, 예측값을 다음과 같이 쓸 수 있다. meanf(y, h) # 시계열, 예측범위 단순 기법(naïve method) 단순 기법에서는 모든 예측값을 단순하게 마지막 값으로 둔다. 이 기법은 금융 시계열을 다룰..
족장님, 한빛미디어 사랑합니다..♥ 05. 트리 알고리즘 05-1 결정 트리 시작하기 전에 와인을 알코올, 당도, pH 값을 활용하여 분류해보려고 한다. import pandas as pd wine = pd.read_csv('https://bit.ly/wine_csv_data') wine.info() 데이터를 불러온 후 info() 메서드를 사용하면 데이터프레임의 각 열의 데이터 타입과 누락된 데이터 여부를 알 수 있다. 6497개의 샘플 중 non-null count가 6497 이므로 누락된 값은 없는 것을 알 수 있다. 만약 누락된 값이 있다면 그 데이터를 버리거나 평균값으로 채운 후 사용할 수 있는데, 그렇게 하는 과정에서도 훈련 세트의 통계 값으로 테스트세트를 변환해야 한다. 즉, 훈련 세트의 평..
Forecasting : Principles and Practice 온라인 교재를 보며 참고하였습니다. Chapter 2. 데이터 분석 작업에서 가장 먼저, 많이 하는 것이 데이터 시각화다. 그래프를 통해 패턴, 관측값, 변수에 따른 변화, 변수 사이의 관계 등 데이터의 많은 특성을 파악할 수 있다. 데이터 시각화 과정은 예측 기법에 반드시 포함되어야 한다. 2.1 ts객체 시계열이란 각 숫자가 기록된 시간에 관한 정보가 있는 숫자들의 목록이다. R에서는 이러한 정보를 ts 객체로 저장할 수 있다. y
edwith CS50강의를 보며 정리했습니다. ● 기억장치 CPU의 용량은 굉장히 제한적이라서 1MB정도의 저장공간만 있다. 한 번에 64bit정도만 처리하면 되기 때문이다. CPU가 두 수를 더한다면 64bit + 64bit 이기 때문에 파일 크기와 관계 없이 적은 양만 CPU로 가져온다. 계산을 하는 동안 데이터를 다른 곳에 저장하는데, 그것을 저장하는 곳이 바로 RAM이다. RAM은 임의 접근 기억장치다. 메모리는 두 가지 종류가 있는데, RAM과 하드디스크가 있다. 두 메모리는 반대의 성질을 띄는데, 하드디스크는 영구적이고 휘발성이 없는데 반해 RAM은 일시적이고 전원을 끄면 사라지기 때문에 휘발성이 있다. 보통 파일이나 프로그램을 더블클릭하면 도달하는 곳이 RAM이다. 문서를 작성하거나 프로그램..
edwith CS50강의를 보며 정리했습니다. ● 하드웨어 우리가 pc를 구매할 때, 마케팅팀의 눈속임에 따라서 플로우가 흘러가게 된다. nn만원만 더 투자하면 훨씬 성능이 좋은 걸 사게 되도록 가격이 구성되어 있기 때문이다. 이런 눈속임에 홀리지 않고 정말 나에게 필요한 것이 무엇인지 알고 가격대가 합리적인지 캐치하기 위해서는 하드웨어에 대해 알아두면 좋다. 하드웨어는 컴퓨터를 물리적으로 구성하는 요소이며, 다양한 하드웨어의 기능과 차이점에 대하여 잘 알수록 유용하게 활용할 수 있다. Processor/CPU : Intel Core i7-8700 Processor(3.2GHz, 8GT/s FSB) 위와 같은 하드웨어가 있을 때 인텔 사의 cpu를 쓰고 속도는 3.2GHz 라는 것을 알 수 있다. FSB..
1. 스터디에 치여 사는 삶 가장 롱텀으로 이어지고 있는 스터디는 독일어speaking, 독서, free talking으로 셋 다 1년반이 넘었다. 작년 당근에서 새로 구한 독일어 문법/writing 스터디도 주2-3회 만남을 하며 잘 이어가고 있다. 개발 관련 스터디는 선형대수, 스탠포드 ML, 파이썬, CV논문, 혼공학습단 외에 ML project, friedberg. 추가적으로 다른 스터디는 부동산, 주식, NFT, 공인중개사, finance, english 정도. 15-6개 정도 되는 것 같은데 스터디가 날 잡아먹는 것 같아서 좀 줄일까 생각중이지만.. 이중에 내가 부추긴(?) 스터디도 있어서.. 책임감을 가지고 열심히 따라가보려 한다. 2. 건강은 실력이다. 수영,헬스,런닝으로 키워 온 지구력 ..