-
[심화] 13. 인공지능 생성 목표 및 필요기술교육/AI-X 제품 및 서비스 개발 교육 2022. 12. 20. 14:46728x90
인공지능 생성이란?
문제를 해결하는 알고리즘을 개발 또는 선택하는 것
인공지능 생성 목표
AIoT프로세스와 인공지능 생성
데이터 전처리 바로 다음에 위치
앞서 전처리한 데이터 셋을 기반으로 인공지능을 만드는 단계
인공지능 생성을 해야하는 이유
데이터 처리 영역에서 생성한 데이터셋을 학습시켜 사물에 탑재될 인공지능을 생성하는 단계
인공지능 모델 개발 및 선택, 모델 학습, 모델 검증으로 구성
인공지능 생성 목표와 ITO
인공지능 생성 필요기술
학습환경 선택
- 로컬 개발환경 : 모델을 생성할 때 자신의 컴퓨터를 이용해서 학습환경을 구성하고 모델을 학습하는 것
- 클라우드 컴퓨팅 사용법을 숙지하지 않아도 되며 개인 컴퓨터를 가지고 있다면 추가적인 비용이 발생하지 않음
- 컴퓨터의 성능이 좋지 않으면 학습 속도가 느림
- 클라우드 개발환경 : 클라우드 컴퓨터 서비스를 이용해서 개발환경을 만드는 것
- 구글의 코랩, 아마존의 AWS
- 고성능의 장비를 구매할 필요없이 클라우드 컴퓨터를 사용한 만큼만 비용 지불
- 로컬환경에서 개발하는 것에 비해 기본 세팅이 되어있기 때문에 에러 해결에 강점
- 비용이 발생, 인터넷이 끊기면 사용하지 못함, 상대적으로 자료 부족할 수도 있음
인공지능 프레임워크 선택
머신러닝, 딥러닝 솔루션을 쉽게 구축할 수 있게 도와주는 프레임워크를 선택하는 것
학습 유형 및 모델 선택
학습 유형
문제해결에 적합한 인공지능 학습 방법과 적합한 학습 알고리즘을 선택하는 것
- 지도학습 : 정답이 있는 데이터를 활용해 데이터를 학습시키는 것
- 비지도 학습 : 정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법
- 강화학습
모델 학습
모델 정하기->모델 수식화하기->모델 학습하기->모델 평가하기
모델 선택
- 예측한 값을 계산하는 알고리즘을 선택하는 것
- 모델이 사용할 속성들을 선택하는 것
- 적정한 하이퍼 파라미터를 선택하는 것
모델 생성과 컴파일
모델 생성
본격적으로 학습 데이터를 이용해 모델을 만드는 단계
컴파일
모델을 학습시키기 위한 학습 과정을 설정하는 단계
모델 컴파일
- 손실함수 : 훈련하는 동안 모델의 오차를 측정하는 함수, 모델의 학습이 올바른 방향으로 향하도록 이 함수를 최소화해야함
- 옵티마이저 : 데이터와 손실함수를 바탕으로 모델의 업데이트 방법을 결정
- 지표 : 훈련 단계와 테스트 단계를 모니터링하기 위해 사용, 정확도를 지정하면 학습 과정에서 정확도를 수집할 수 있음
모델 결합
ex)그래디언트 부스팅, 랜덤포레스트
모델 검증
만들어진 모델의 성능을 평가하고 그 모델을 활용하여 새로운 데이터에 대한 예측을 하는 단계
평가용 데이터셋을 이용해서 평가지표를 구하고 확인하는 방법
평가용 데이터셋(Test Dataset)
모델 선택과 모델 학습 과정에서 사용되지 않은 데이터셋
평가지표
생성한 인공지능 모델과 평가용 데이터셋을 이용해서 모델이 일반화 될 수 있게 도와주거나 모델의 성능(완성도를) 측정하는 지표
- 정확도(Accuracy) : 전체 분류 결과 중 바르게 분류한 비율(TP+TN/TP+TN+FN+FP)
- 정밀도(Precision) : 정답이라 분류된 것들 중 실제 정답인 것들의 비율(TP/TP+FP)
- 재현율(recall) : 실제 정답 중 정확히 정답이라고 판별된 것의 비율(TP/TP+FN)
- 정밀도와 재현율은 반대되는 경우가 많음 트레이드 오프 잘 생각해서 정할 것
- F1 스코어 : 정밀도와 재현율의 조화 평균, F1스코어가 1에 도달할 때 최적의 정밀도와 재현율 0은 최악을 의미
- ROC 커브 : 분류기의 분류 능력을 그래프 좌표로 표현하는 방법
'교육 > AI-X 제품 및 서비스 개발 교육' 카테고리의 다른 글
[심화] 15. 사물지능 배포 목표 및 필요기술 (0) 2022.12.20 [심화] 14. 인공지능 생성 케이스 스터디 (0) 2022.12.20 [심화] 12. 데이터 전처리 케이스 스터디 (0) 2022.12.20 [심화] 11. 데이터 전처리 목표 및 필요기술 (0) 2022.12.20 [심화] 10. 데이터 구축 케이스 스터디 (0) 2022.12.20 - 로컬 개발환경 : 모델을 생성할 때 자신의 컴퓨터를 이용해서 학습환경을 구성하고 모델을 학습하는 것