목록전체 글 (80)
속도 < 방향

Forecasting : Principles and Practice 온라인 교재를 보며 참고하였습니다. Chapter 2. 데이터 분석 작업에서 가장 먼저, 많이 하는 것이 데이터 시각화다. 그래프를 통해 패턴, 관측값, 변수에 따른 변화, 변수 사이의 관계 등 데이터의 많은 특성을 파악할 수 있다. 데이터 시각화 과정은 예측 기법에 반드시 포함되어야 한다. 2.1 ts객체 시계열이란 각 숫자가 기록된 시간에 관한 정보가 있는 숫자들의 목록이다. R에서는 이러한 정보를 ts 객체로 저장할 수 있다. y

edwith CS50강의를 보며 정리했습니다. ● 기억장치 CPU의 용량은 굉장히 제한적이라서 1MB정도의 저장공간만 있다. 한 번에 64bit정도만 처리하면 되기 때문이다. CPU가 두 수를 더한다면 64bit + 64bit 이기 때문에 파일 크기와 관계 없이 적은 양만 CPU로 가져온다. 계산을 하는 동안 데이터를 다른 곳에 저장하는데, 그것을 저장하는 곳이 바로 RAM이다. RAM은 임의 접근 기억장치다. 메모리는 두 가지 종류가 있는데, RAM과 하드디스크가 있다. 두 메모리는 반대의 성질을 띄는데, 하드디스크는 영구적이고 휘발성이 없는데 반해 RAM은 일시적이고 전원을 끄면 사라지기 때문에 휘발성이 있다. 보통 파일이나 프로그램을 더블클릭하면 도달하는 곳이 RAM이다. 문서를 작성하거나 프로그램..

edwith CS50강의를 보며 정리했습니다. ● 하드웨어 우리가 pc를 구매할 때, 마케팅팀의 눈속임에 따라서 플로우가 흘러가게 된다. nn만원만 더 투자하면 훨씬 성능이 좋은 걸 사게 되도록 가격이 구성되어 있기 때문이다. 이런 눈속임에 홀리지 않고 정말 나에게 필요한 것이 무엇인지 알고 가격대가 합리적인지 캐치하기 위해서는 하드웨어에 대해 알아두면 좋다. 하드웨어는 컴퓨터를 물리적으로 구성하는 요소이며, 다양한 하드웨어의 기능과 차이점에 대하여 잘 알수록 유용하게 활용할 수 있다. Processor/CPU : Intel Core i7-8700 Processor(3.2GHz, 8GT/s FSB) 위와 같은 하드웨어가 있을 때 인텔 사의 cpu를 쓰고 속도는 3.2GHz 라는 것을 알 수 있다. FSB..

1. 스터디에 치여 사는 삶 가장 롱텀으로 이어지고 있는 스터디는 독일어speaking, 독서, free talking으로 셋 다 1년반이 넘었다. 작년 당근에서 새로 구한 독일어 문법/writing 스터디도 주2-3회 만남을 하며 잘 이어가고 있다. 개발 관련 스터디는 선형대수, 스탠포드 ML, 파이썬, CV논문, 혼공학습단 외에 ML project, friedberg. 추가적으로 다른 스터디는 부동산, 주식, NFT, 공인중개사, finance, english 정도. 15-6개 정도 되는 것 같은데 스터디가 날 잡아먹는 것 같아서 좀 줄일까 생각중이지만.. 이중에 내가 부추긴(?) 스터디도 있어서.. 책임감을 가지고 열심히 따라가보려 한다. 2. 건강은 실력이다. 수영,헬스,런닝으로 키워 온 지구력 ..

지난번 업로드했던 내용이 정리가 잘 되었는지 우수 혼공족으로 선정되었다. 항상 도움 많이받는 한빛미디어! 혼공족장님도 열일해주셔서 너무 감사하고,,백신 후유증은 괜찮으신가요? 사랑하는 한빛미디어 뼈를 묻겠습니다..♡ 04. 다양한 분류 알고리즘 04-1 로지스틱 회귀 시작하기 전에럭키백을 판매한다고 할 때, 고객에게 힌트를 주기 위해 확률을 구하는 문제가 있다. k-최근접 이웃 분류기를 통해 생선의 확률을 계산할 것이다. 이웃한 샘플 중 다수의 항목들로 분류될 확률이 크다. import pandas as pd fish = pd.read_csv('https://bit.ly/fish_csv_data') fish.head() 판다스의 데이터프레임으로 데이터를 읽는다. head() 메서드는 처음 5개 행을 출력..

Forecasting : Principles and Practice 온라인 교재를 보며 참고하였습니다. Chapter 1. 우리는 많은 경우에 예측을 한다. 비단 현대사회뿐만 아니라 수천년전부터 사람들은 예측을 하는 것에 관심이 많았다. 고대 바빌로니아의 예측가는 썩은 양의 간에서 구더기의 분포를 미래를 예언하기도 했다. 이처럼, 계획을 세우는 데 있어 예측은 큰 도움이 된다. 예측가능성은 다음과 같은 요인에 의존하게 된다. 영향을 주는 요인을 얼마나 잘 이해할 수 있는지 사용할 수 있는 데이터가 얼마나 많은지 예측이 우리가 예측하려는 것에 영향을 줄 수 있는지 여부 전기 수요 예측의 경우는 위의 조건이 모두 맞기 때문에 상당히 정확한 편이다. 하지만, 환율 예측의 경우에는 2번의 조건만 만족하기 때문에..

[업데이트 : 2022-01-30] 논문 : Dynamical Isometry and a Mean Field Theory of CNNs: How to Train 10,000-Layer Vanilla Convolutional Neural Networks 2018년에 발표된 Dynamical Isometry and a Mean Field Theory of CNNs:How to Train 10,000-Layer Vanilla Convolutional Neural Networks 논문의 Summary 겸 리뷰를 적어보려고 합니다. 글을 쓰기에 앞서, 공부를 위해 논문을 보며 요약, 작성한 내용이라 간혹 오역이나 잘못된 내용이 있을 수 있습니다. 핵심 키워드는 highlight를 해두었습니다. 틀린 부분은 댓글로..

03. 회귀 알고리즘과 모델 규제 03-1 k-최근접 이웃 회귀 시작하기 전에 농어의 무게를 예측하는 모델을 만들어보려고 한다. 지도 학습 알고리즘은 분류와 회귀(regression)로 나뉜다. 분류는 샘플을 클래스 중 하나로 분류하는 문제이고, 회귀는 분류가 아니라 임의의 어떤 숫자를 예측하는 문제이다. 즉, 정해진 클래스, 타깃 값(정답)이 없는 것을 예측하여 임의의 수치를 출력하는 것이다. 회귀는 19세기 통계학자인 프랜시스 골턴이 처음 사용한 단어로, 두 변수 사이의 상관관계를 분석하는 방법을 회귀라고 불렀다. k-최근접 이웃 분류 알고리즘은 샘플에 가장 가까운 샘플 k개를 선택한 다음 그들의 클래스를 확인하여 예측하는 것이다. X를 추측할때 네모가 더 많기 때문에 동그라미보단 네모로 예측하는 것..

[업데이트 : 2022-01-26] 논문 : Understanding the difficulty of training deep feedforward neural networks 2010년에 발표된 Understanding the difficulty of training deep feedforward neural Networks 논문의 Summary 겸 리뷰를 적어보려고 합니다. 글을 쓰기에 앞서, 공부를 위해 논문을 보며 요약, 작성한 내용이라 간혹 오역이나 잘못된 내용이 있을 수 있습니다. 핵심 키워드는 highlight를 해두었습니다. 틀린 부분은 댓글로 알려주시면 감사하겠습니다^^ 편의상 경어체를 빼고 작성하겠습니다. Abstract 2006년 이전엔 DNN(Deep Neural Networks)이..

정재곤님의 Do it! 안드로이드 앱 프로그래밍 책과 유튜브 영상을 참고하여 공부하며 정리하였습니다. 01. Hello! Android 01.안드로이드란? 구글에서 만든 스마트폰용 운영체제(OS)로, 휴대용 단말기를 위한 운영체제뿐만 아니라 다양한 앱을 설치하여 실행할 수 있는 앱 플랫폼이기도 하다. 아무리 아이폰이 많이 팔린다고 하지만, 안드로이드가 압도적으로 판매량이 높다. 그 이유는 무엇일까? * 안드로이드의 장점 오픈소스이다. 그렇기에 전 세계 개발자들의 피드백도 빠른 편이다. 자바(Java)언어를 사용한다. 전세계 수많은 개발자들이 사용하기 때문에 접근이 손쉽다. - 코틀린으로도 안드로이드 앱 프로그래밍을 할 수 있는데, 코틀린은 자바 가상머신(JVM)에서도 동작하기 때문에 훨씬 간단하고 단순하..