공부해라 공부

Day15

교육/서울 ICT 이노베이션 고오급 시각과정 2022. 9. 4. 13:15

머신러닝의 주요작업은 학습 알고리즘을 선택해서 어떤 데이터에 훈련시키는 것 배치 학습에서의 머신러닝 입력 x에 대해 y를 출력하는 시스템 f(x)=y를 가정 f는 실체를 알 수 없으므로 θ에 의해 정의되는 모델로 간주 f는 알 수 없지만 수 많은 사례(x,y)를 통해 θ를 추정 만약 실제 시스템을 완벽히 복원했다면 f(x)-y=0 즉, 모델링된 시스템의 출력값 f(x)=ŷ가 실제 y에 가장 가까워지도록 하는 θ를 찾음 여기서 x,y는 상수(주어진 샘플)이고 θ는 우리가 찾고자 하는 값(모델에 대한 파라미터) 주어진 y에 f(x)가 최대한 가까워지는 과정이 훈련, 학습, 피팅 피팅이 잘 이루어진 정도를 에러를 통해 추정 MSE(θ)=∑(f(x)-y)^2/N (에러 계산 방법은 다양함 ex)cross ent..

0824-라벨링

프로젝트/catholic 2022. 8. 24. 20:28

거의 1년만에 돌아왔다 약간의 슬럼프를 겪고 무기력함에 절어서 아무것도 못했다 하지만 고양이는 포기할 수 없지 나를 어떻게 혹사시키더라도 완성시킨다! 다시보니 데이터셋은 많은데 라벨링을 하나도 안 해놔서 어차피 인공지능 훈련도 못 시킬거였움 근데 난 라벨링할줄모른다! 그래서 데이터 라벨링교육들으러갔더니 영상만 라벨링해서 별 도움이 안 된다ㅜ 이미지 데이터셋 라벨링 하는 방법 찾아보긔~ Labelme라는 라벨링 툴을 이용해서 폴리곤으로 작업중 현재 400개 완료 남은 거 6400개ㅋㅋㅋㅋㅋ쿠ㅜㅜ

220517-GAN

교육/서울 ICT AI서비스 기획과정 2022. 6. 21. 11:01

1. Generative Model 모델로부터 생성한 데이터가 실제 데이터와 비슷해지도록 학습해서 모델의 성능을 개선 실제 데이터의 분포와 생성한 데이터의 분포가 비슷해지도록 모델을 학습 비지도 학습이 데이터의 숨은 구조를 파악하는 학습이라면 GAN은 데이터의 분포를 추정하는 비지도 학습 데이터를 학습하여 데이터 분포 Pmodel(x)를 추정하고 추정된 분포 Pmodel(x)에 따라 샘플을 생성하는 모델 Manifold Hypothesis 다양체(Manifold)가설이라는 가정이 필요함 기계 학습에서 '다양체'의 정의 다양체는 높은 차원의 공간에 정의되어 있으나, 그보다 낮은 차원으로도 잘 근사할 수 있는 연결된 점들의 집합 고차원의 데이터들은 고차원의 공간에 고르게 퍼져있는 것이 아니라 그보다 저차원인..

220517-CNN

교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 13:08

1. CNN? Convolutional Nerual Network 기존의 Neural Network 앞 부분에 convolution layer를 추가한 것 동물의 시신경을 모방 데이터를 feature(특징, 차원)로 추출하여 패턴을 파악하는 구조 CNN의 기본구조 이미지의 특징을 추출하는 단계(Covolution Layer+Polling Layer)와 클래스를 분류하는 단계(Fully Connected Layer)를 하나의 단계로 통합한 모델 CNN의 핵심 아이디어 3가지 Sparse interactions(sparse weight) : layer와 layer간 모든 connection을 연결하는 대신 일부만 연결 Parameter sharing : 가중치들을 각각 다른 random variable로 취..

220516

교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 12:40

신용평가모형의 이해와 실습 신용평가모형(CSS, Credit Scoring System) 신용 Risk 측정 지표로 심사전략 및 사후관리 등의 주요 리스트 관리전략에 중요 의사결정도구로 활용 데이터 전처리 단계에서 각 변수를 Classing처리하여 WoE의 방향성이 존재하고 IV값이 큰 기준으로 유의미한 후보 변수를 선정함(Data processing & Feature selection) Classing : =Binning, 구간화 WoE : 변수의 타겟 분별력, 방향성 IV : 분별력의 절대적 크기 ->이상치/NULL값 처리, 범주형 처리 용이, 타겟과의 선형성 강화, 심사전략 운영 및 설명 용이 모형적합단계에서 적합한 알고리즘이란? 설명력 : 결과에 대한 합리적 설명이 가능, 블랙박스형 모형의 활용이..

220510

교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 11:50

유용한 모델 - Transfer Learning Transfer Learning 이미 만들어진 모델을 사용하여 새로운 모델을 만드는 방법 학습을 빠르게 하며 예측력을 더 높일 수 있음 이미 학습이 완료된 모델(Pre-Trained Model)을 가지고 미세조정하고 이미 학습된 가중치들을 전송하여 자신의 모델에 맞게 학습하는 과정을 세부 조정(fine-tuning)이라 부름 Fine-tuning방법 Feature extraction pre-trained model을 모델 구조를 이용 다른 레이어를 고정시키고 일부분 layer 조정 유용한 모델 - Language Model Language Model의 장점 자연어에는 불확실성이 존재 특정 시퀀스가 출현할 확률로 정량화 가능 해당 언어모델로 텍스트 생성가능(..

220509

교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 00:58

인공지능의 9대 핵심기술 1. GPT-3 언어모델의 스케일업 2. 연합학습 FL(Federated Learning) 민감정보가 보호되는 분산 AI 학습 다수의 로컬 클라이언트와 하나의 중앙 서버가 협력하여 글로벌 모델을 학습하는 기술 데이터 프라이버시 향상과 커뮤니케이션 효율성의 장점 수 만개의 로컬 디바이스의 데이터를 모두 중앙서버로 전송하게 되며 네트워크 트래픽과 스토리지 비용이 증가 연합학습을 사용하면 로컬 모델의 업데이트 정보만을 주고 받음 3. 엣지 AI 온디바이스 AI를 위한 모델 경량화 클라우드 활용없이 단말기 내에서 AI 실행 4. 트랜스포머 NLP의 트랜스포머가 컴퓨터 비전까지 확대 문장의 단어들을 병렬로 처리하고 단어의 앞 뒤 문장의 위치에 따라서 변할 수 있으므로 문장내의 단어들의 위..

220504

교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 00:57

쉽게 설명하는 딥러닝 컴포넌트 여러 컴포넌트가 모여서 여러 층을 쌓으면 =>딥뉴럴넷(DNN) 딥뉴럴넷의 문제점 3가지 : underfitting/slow/overfitting 1. underfitting의 해결법 : Back propagation 현재 틀린 정도를 미분(기울기)한 것을 곱하고 더하고를 역방향으로 반복하며 업데이트 ->작은 변화의 관점에서 선형적인 관계이기에 출력에서 생긴 오차를 입력측으로 전파하면서 가중치와 바이어스값 조정 이 때 출력 부분부터 입력 부분까지 역방향으로 cost function에 대한 편미분을 구하고 편기분값을 이용하여 값을 얻음 ->activation함수로 sigmoid를 쓰면 vanishing gradient 현상 발생! vanishing gradient란 레이어가 깊..

ABOUT ME

공부해라 공부 공부해라 공부

티스토리툴바

ABOUT ME

전체 글

티스토리툴바