전체 글
-
모두팝 - CES 안 간 CES 패널 톡공부/기타 2024. 1. 25. 13:01
CES 2024 트렌드 Gen AI - 특히 LLM AI enable시장이 가장 클 것 2024년에는? AI-agent, multi-modal, On Device 듣는거-보는거-읽는거 사람은 sink, ai도 가능? 국내 스타트업 Generative AI를 consumer수준까지 데려가는 것이 힘듦 일상으로의 AI, AI생태계 만들기 CES로 살펴보는 빅테크 산업분야의 경계가 흐려짐 by AI 인터페이스 경험/B2C "앱" X/Search UX(대화를 통해 문제해결, gatekeeper) 생성형 AI와 콘텐츠 환경 All Together, All On, 모든 기업,산업이 혁신기술에 올인하여 인류문제를 해결 동영상은 일관성유지, 실시간변환, 장시간 생성, 3D모델링, 복합성 결과물 등이 필요 거대공간vs개..
-
딥러닝공부/ML 모의 인터뷰 스터디 2024. 1. 25. 11:32
https://boostdevs.gitbook.io/ai-tech-interview/interview/3-deep-learning Deep Learning - AI Tech Interview 디버깅 노하우도 중요하지만, 오류에 대한 대처방식을 익히면 좋다. 디버깅 하지 않고 오류에 대처할 수 있으므로, 디버깅 시간을 아껴준다. 예를들어, 딥러닝 학습을 위한 코드를 작성할 때, 가 boostdevs.gitbook.io 딥러닝은 무엇인가요? 딥러닝과 머신러닝의 차이는? 아래 그림처럼 딥러닝은 머신러닝의 한 분야 딥러닝은 다양한 층으로 이루어진 신경망을 사용하며, 이 층들은 입력 데이터로부터 추상화된 특징을 학습하고 점차 더 복잡한 개념을 학습하도록 구성 딥러닝의 주요 특징? 다층 신경망/자동 특징 추출 머신..
-
머신러닝공부/ML 모의 인터뷰 스터디 2024. 1. 24. 17:39
https://boostdevs.gitbook.io/ai-tech-interview/interview/2-machine-learning Machine Learning - AI Tech Interview 💡 왜 test 데이터셋 만으로 검증하면 안될까? 모든 train 데이터셋을 학습하고, test 데이터셋으로 검증한 결과를 확인한다고 하자. 개발자는 test 데이터셋 점수를 높이기 위해, test 데이터셋에 편 boostdevs.gitbook.io 알고 있는 metric에 대해 설명해주세요. (ex. RMSE, MAE, recall, precision ...) - 정확도(accuracy) : 전체 예측 중 올바르게 분류된 샘플의 비율 - 정밀도(Precision) : 양성으로 예측된 것 중에서 실제로 양..
-
통계/수학공부/ML 모의 인터뷰 스터디 2024. 1. 22. 20:06
https://boostdevs.gitbook.io/ai-tech-interview/interview/1-statistics-math Statistics/Math - AI Tech Interview 리샘플링은 모집단의 분포 형태를 알 수 없을 때 주로 사용하는 방법이다. 즉, 모분포를 알 수 없으므로 일반적인 통계적 공식들을 사용하기 힘들 때, 현재 갖고 있는 데이터를 이용하여 모분포 boostdevs.gitbook.io 고유값(eigen value)와 고유벡터(eigen vector)이 무엇이고 왜 중요한지 설명해주세요. 고유값 : 행렬 A를 변환했을 때 변환된 벡터가 원래의 벡터 방향과 똑같고, 크기만 변하는 값=>그 행렬이 어떤 변환을 주는 지에 대한 특성을 나타냄 고유 행렬 : 해당 고유값에 대응..
-
2. EDA를 통해 데이터 탐색하기교육/코칭스터디<Data Science Projects 2024> 2024. 1. 22. 14:27
2.1.1 당뇨병 데이터셋 미리보기 데이터 구성 Pregnancies : 임신 횟수 Glucose : 2시간 동안의 경구 포도당 내성 검사에서 혈장 포도당 농도 BloodPressure : 이완기 혈압 (mm Hg) SkinThickness : 삼두근 피부 주름 두께 (mm), 체지방을 추정하는데 사용되는 값 Insulin : 2시간 혈청 인슐린 (mu U / ml) BMI : 체질량 지수 (체중kg / 키(m)^2) DiabetesPedigreeFunction : 당뇨병 혈통 기능 Age : 나이 Outcome : 768개 중에 268개의 결과 클래스 변수(0 또는 1)는 1이고 나머지는 0입니다. #라이브러리 로드 import pandas as pd import numpy as np import se..
-
-
여러 인공지능 관련 정의공부/AI 2024. 1. 21. 19:21
Gradient Descent 손실함수를 최소화하는 최적의 파라미터를 찾고 모델을 훈련 파라미터 초기화=>손실함수 계산(최소화가 되야하므로)=>미분계산(손실함수를 0에 가깝게 만듦)=>파라미터 업데이트 여러 개의 변수를 가진 함수(loss) 각각에 대한 편미분을 쌓은 것을 Gradient라고 하고, 수학적으로 가장 가파른 방향으로 향하는 데 Gradient를 구한 후, loss를 줄이는 Gradient의 반대방향으로 나아가는 것이 Gradient Descent loss surface? 모델의 손실함수가 모델의 파라미터에 따라 어떻게 변하는 지를 나타내는 그래픽 표현 loss surface를 시각화하면 다양한 파라미터 값에 따라 손실 함수의 형태가 어떻게 변하는 지 확인 가능 loss surface를 통해..
-
1. 분류모델 기초교육/코칭스터디<Data Science Projects 2024> 2024. 1. 13. 16:12
1. 분류모델 기초 1.1 사이킷런과 머신러닝 1.1.1 사이킷런 소개 사이킷런? 대표적인 파이썬 머신러닝 라이브러리 https://scikit-learn.org/stable/ scikit-learn: machine learning in Python — scikit-learn 1.3.2 documentation Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, metrics, and more... scikit-learn.org 1.1.2 사이킷런 활용 흐..