교육/서울 ICT AI서비스 기획과정
-
220517-GAN교육/서울 ICT AI서비스 기획과정 2022. 6. 21. 11:01
1. Generative Model 모델로부터 생성한 데이터가 실제 데이터와 비슷해지도록 학습해서 모델의 성능을 개선 실제 데이터의 분포와 생성한 데이터의 분포가 비슷해지도록 모델을 학습 비지도 학습이 데이터의 숨은 구조를 파악하는 학습이라면 GAN은 데이터의 분포를 추정하는 비지도 학습 데이터를 학습하여 데이터 분포 Pmodel(x)를 추정하고 추정된 분포 Pmodel(x)에 따라 샘플을 생성하는 모델 Manifold Hypothesis 다양체(Manifold)가설이라는 가정이 필요함 기계 학습에서 '다양체'의 정의 다양체는 높은 차원의 공간에 정의되어 있으나, 그보다 낮은 차원으로도 잘 근사할 수 있는 연결된 점들의 집합 고차원의 데이터들은 고차원의 공간에 고르게 퍼져있는 것이 아니라 그보다 저차원인..
-
220517-CNN교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 13:08
1. CNN? Convolutional Nerual Network 기존의 Neural Network 앞 부분에 convolution layer를 추가한 것 동물의 시신경을 모방 데이터를 feature(특징, 차원)로 추출하여 패턴을 파악하는 구조 CNN의 기본구조 이미지의 특징을 추출하는 단계(Covolution Layer+Polling Layer)와 클래스를 분류하는 단계(Fully Connected Layer)를 하나의 단계로 통합한 모델 CNN의 핵심 아이디어 3가지 Sparse interactions(sparse weight) : layer와 layer간 모든 connection을 연결하는 대신 일부만 연결 Parameter sharing : 가중치들을 각각 다른 random variable로 취..
-
220516교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 12:40
신용평가모형의 이해와 실습 신용평가모형(CSS, Credit Scoring System) 신용 Risk 측정 지표로 심사전략 및 사후관리 등의 주요 리스트 관리전략에 중요 의사결정도구로 활용 데이터 전처리 단계에서 각 변수를 Classing처리하여 WoE의 방향성이 존재하고 IV값이 큰 기준으로 유의미한 후보 변수를 선정함(Data processing & Feature selection) Classing : =Binning, 구간화 WoE : 변수의 타겟 분별력, 방향성 IV : 분별력의 절대적 크기 ->이상치/NULL값 처리, 범주형 처리 용이, 타겟과의 선형성 강화, 심사전략 운영 및 설명 용이 모형적합단계에서 적합한 알고리즘이란? 설명력 : 결과에 대한 합리적 설명이 가능, 블랙박스형 모형의 활용이..
-
220510교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 11:50
유용한 모델 - Transfer Learning Transfer Learning 이미 만들어진 모델을 사용하여 새로운 모델을 만드는 방법 학습을 빠르게 하며 예측력을 더 높일 수 있음 이미 학습이 완료된 모델(Pre-Trained Model)을 가지고 미세조정하고 이미 학습된 가중치들을 전송하여 자신의 모델에 맞게 학습하는 과정을 세부 조정(fine-tuning)이라 부름 Fine-tuning방법 Feature extraction pre-trained model을 모델 구조를 이용 다른 레이어를 고정시키고 일부분 layer 조정 유용한 모델 - Language Model Language Model의 장점 자연어에는 불확실성이 존재 특정 시퀀스가 출현할 확률로 정량화 가능 해당 언어모델로 텍스트 생성가능(..
-
220509교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 00:58
인공지능의 9대 핵심기술 1. GPT-3 언어모델의 스케일업 2. 연합학습 FL(Federated Learning) 민감정보가 보호되는 분산 AI 학습 다수의 로컬 클라이언트와 하나의 중앙 서버가 협력하여 글로벌 모델을 학습하는 기술 데이터 프라이버시 향상과 커뮤니케이션 효율성의 장점 수 만개의 로컬 디바이스의 데이터를 모두 중앙서버로 전송하게 되며 네트워크 트래픽과 스토리지 비용이 증가 연합학습을 사용하면 로컬 모델의 업데이트 정보만을 주고 받음 3. 엣지 AI 온디바이스 AI를 위한 모델 경량화 클라우드 활용없이 단말기 내에서 AI 실행 4. 트랜스포머 NLP의 트랜스포머가 컴퓨터 비전까지 확대 문장의 단어들을 병렬로 처리하고 단어의 앞 뒤 문장의 위치에 따라서 변할 수 있으므로 문장내의 단어들의 위..
-
220504교육/서울 ICT AI서비스 기획과정 2022. 5. 23. 00:57
쉽게 설명하는 딥러닝 컴포넌트 여러 컴포넌트가 모여서 여러 층을 쌓으면 =>딥뉴럴넷(DNN) 딥뉴럴넷의 문제점 3가지 : underfitting/slow/overfitting 1. underfitting의 해결법 : Back propagation 현재 틀린 정도를 미분(기울기)한 것을 곱하고 더하고를 역방향으로 반복하며 업데이트 ->작은 변화의 관점에서 선형적인 관계이기에 출력에서 생긴 오차를 입력측으로 전파하면서 가중치와 바이어스값 조정 이 때 출력 부분부터 입력 부분까지 역방향으로 cost function에 대한 편미분을 구하고 편기분값을 이용하여 값을 얻음 ->activation함수로 sigmoid를 쓰면 vanishing gradient 현상 발생! vanishing gradient란 레이어가 깊..
-
-
220429교육/서울 ICT AI서비스 기획과정 2022. 4. 29. 15:05
Convolutional Neural Network 기본 개념 Convolution Smoothing Spatial filters Convolution의 작동 원리 필터(Filter) & Stride 필터 이미지의 특징을 찾아내기 위한 공용 파라미터 일반적으로 정사각 행렬로 정의 CNN에서 학습의 대상은 필터 파라미터 채널(Channel) 패딩(Padding) Convolution 레이어에서 Filter와 Stride에 작용으로 Feature Map 크기는 입력데이터 보다 작음 Convolution 레이어의 출력 데이터가 줄어드는 것을 방지하는 방법이 패딩 패딩은 입력 데이터의 외각에 지정된 픽셀만큼 특정 값으로 채워 넣는 것을 의미 보통 패딩 값은 0 Pooling 레이어 풀링 레이어는 컨볼류션 레이어..