공부/Hands-On Machine Learning
-
chapter4 모델 훈련공부/Hands-On Machine Learning 2023. 1. 18. 12:42
가장 간단한 선형 회귀부터 시작, 방법은 2가지 직접 계산할 수 있는 공식을 사용하여 훈련 세트에 가장 잘 맞는 모델 파라미터(즉, 훈련세트에 대해 비용함수를 최소화하는 모델 파라미터)를 해석적으로 구함 경사하강법(GS)이라 불리는 반복적인 최적화 방식을 사용하여 모델 파라미터를 조금씩 바꾸면서 비용 함수 훈련 세트에 대해 최소화, 결국에는 앞의 방법과 동일한 파라미터로 수렴함, 경사 하강법의 변종으로 2부에서 신경망 고부할 때 계속 사용하게 될 배치 경사하강법, 미니배치 경사하강법, 확률적 경사 하강법(SGD)도 살펴보겠음 다음은 다항 회귀를 살펴봄 이 모델은 선형 회귀보다 파라미터가 많아서 훈련 데이터에 과대적합되기 더 쉬움 따라서 학습 곡선을 사용해 모델이 과대적합되는 지 감지하는 방법도 살펴보겠음..
-
Chapter3 연습문제 스팸분류기공부/Hands-On Machine Learning 2023. 1. 16. 14:28
https://github.com/rickiepark/hand
-
chapter3 연습문제 - 타이타닉공부/Hands-On Machine Learning 2023. 1. 13. 14:27
https://www.kaggle.com/code/startupsci/titanic-data-science-solutions Titanic Data Science Solutions Explore and run machine learning code with Kaggle Notebooks | Using data from Titanic - Machine Learning from Disaster www.kaggle.com 이 분 코드를 베끼면서 연습!
-
chatper3. 분류공부/Hands-On Machine Learning 2023. 1. 6. 13:03
3.1 MNIST 70,000의 작은 숫자 이미지를 모은 MNIST 데이터셋 어떤 숫자를 나타내는지 레이블되어있음 사이킷런에서 제공하는 여러 행의 함수를 사용해 잘 알려진 데이터셋을 내려받을 수 있음 from sklearn.datasets import fetch_openml mnist=fetch_openml('mnist_784',version=1,as_frame=False) #사이킷런 0.22버전에서 as_frame 매개변수 추가 #as_frame=True로 설정하면 판다스 데이터프레임을 반환 mnist.keys() #데이터셋을 설명하는 DESCR #샘플이 하나의 행,특성이 하나의 열로 구성된 배열을 가진 data #레이블 배열을 담은 target X,y=mnist['data'],mnist['target..
-
chapter2. 머신러닝 프로젝트 처음부터 끝까지공부/Hands-On Machine Learning 2022. 11. 2. 16:01
2.1 실제 데이터로 작업하기 유명한 공개 데이터 저장소 UC 얼바인 머신러닝 저장소(http://archive.ics.uci.edu/ml) 캐글 데이터셋(http://www.kaggle.com/datasets) 아마존 AWS 데이터셋(http://registry.opendata.aws) 메타 포털(공개 데이터 저장소가 나열되어 있음) 데이터 포털(http://dataportals.org) 오픈 데이터 모니터(http://opendatamonitor.eu) 퀸들(http://quandl.com) 인기 있는 공개 데이터 저장소가 나열되어 있는 다른 페이지 위키백과 머신러닝 데이터셋 목록(https://goo.gl/SJHN2K) Quora.com(https://homl.info/10) 데이터 세브레딧(htt..
-
Chapter1.한눈에 보는 머신러닝공부/Hands-On Machine Learning 2022. 11. 1. 16:25
인공지능에 손 안 댄지 어언 1년,,,기억이 하나도 안 난다. 기초부터 다시 잡고 가자 1.1 머신러닝이란? 데이터에서부터 학습하도록 컴퓨터를 프로그래밍하는 과학 훈련세트(training set) : 시스템이 학습하는 데 사용하는 샘플(각 한 사례는 샘플로 불림) 정확도(accuracy) : 정확히 분류된 비율(=P) 1.2 왜 머신러닝을 사용하는가? 패턴을 감지하여 판단하는데 좋은 기준인지 자동으로 학습->프로그램이 짧아지고 유지보수하기 쉽고 정확도가 높음 너무 복잡하거나 알려진 알고리즘이 없는 문제 ex)음성인식 데이터 마이닝 : 머신러닝 기술을 적용해서 대용량의 데이터를 분석하면 보이지않던 패턴 발견가능 =>요약 기존 솔루션으로는 많은 수동 조정과 규칙이 필요한 문제 : 하나의 머신러닝 모델이 코드..