공부
-
상세기획서공부/기획 2024. 9. 12. 09:51
상세기획서란?프로젝트의 구조를 정리한 문서프로젝트에 참여하는 사람들이 문제 상황을 이해하고 해결책을 합의하는 데 사용작성 방법배경=>목표=>방향성=>상세정책=>마일스톤배경현상과 원인을 짚자현상을 먼저 얘기해서 문제의 심각성을 대두 후,현상이 발생하는 원인을 얘기원인은 데이터를 기반으로 작성목표캐치 프라이즈 or 제품명+정량적 목표방향성프로젝트를 위해 해야하는 것들 작성ex)업무, 원칙 등이를 바탕으로 유저 스토리 작성더보기유저 스토리란?제품을 통해 사용자가 할 수 있는 행동 쓰는 방법 : who+what+why가 정석 인수기준 : 유저 스토리를 만들 때 나열한 사항들이 개발되어야 해당 기능이 개발 완료된 것으로 판단하겠다는 것ex)사용자는 챗봇을 이용하다가 메모장을 사용할 수 있음메모장에는 rich te..
-
Chapter02 영상 처리공부/Computer Vision 기본 개념부터 최신 모바일 응용 예까지 2024. 9. 11. 16:09
1. 디지털 영상이란?1. 디지털 영상의 태동2. 획득과 표현영상을 획득하는 장비인 카메라는 사람의 눈과 비슷한 구조수정체는 카메라의 렌즈 역할망막(밝기에 반응하는 간상체, 색에 반응하는 추상체)은 CCD센서(필름) 카메라의 작동원리빛이 상자의 구멍을 통해 내부로 들어가면 CCD센서(필름)에 맺힘영상을 가로 방향으로 N, 세로 방향으로 M개의 점으로 샘플링화소(pixel)라고 부르는 각 점의 밝기를 L단계로 양자화2. 히스토그램1. 히스토그램 계산영상 f의 히스토그램은 명암값이 나타난 빈도수[0, L-1] 사이의 명암값 각각이 영상에 몇 번 나타나는 지2. 히스토그램 용도영상의 특성 파악ex)히스토그램이 왼쪽으로 치우쳐져 있으면 어두운 영상두 개의 봉우리가 선명하게 나타난 영상이면 이진 영상으로 변환하기..
-
Chapter01 소개공부/Computer Vision 기본 개념부터 최신 모바일 응용 예까지 2024. 9. 11. 13:39
1. 왜 컴퓨터 비전인가?2. 컴퓨터 비전 문제는 어떻게 해결하나?1. 과학적 접근과 공학적 접근컴퓨터 비전의 목표1. 사람의 시각에 맞먹는 인공 시각을 만든다필연적으로 인간의 시각이 어떻게 작동하는 지 원리를 밝혀낸 다음 컴퓨터로 모방해야함=>과학적 접근과학적 접근의 2가지 어려움(1. 인간의 시각 과정을 완전히 밝혀낼 수 없음 2. 현재 기술과 컴퓨터로 시뮬레이션 불가능)2. 한정된 범위에서 특정한 임무를 달성하는 인공 시각을 만든다=>공학적 접근이 책에서 제시하는 대부분의 알고리즘 컴퓨터 비전이 어려운 본질적 이유?1. 역문제(inverse problem)입력 영상은 3차원, 컴퓨터 비전은 2차원으로부터 3차원을 알아내는 과정사람은 영상을 보면 필요한 3차원 정보를 쉽게 추론해내지만 현재 그런 추론..
-
Chapter7 C언어로 컴파일하기공부/High Performance Python 2024. 8. 21. 12:01
코드를 빠르게 하는 가장 쉬운 방법?처리할 작업의 양을 줄이는 것최적의 알고리즘을 사용해라~그 다음으로는 수행할 명령의 수를 줄이는 방법명령의 수를 줄이려면 코드를 기계어로 컴파일 사이썬 - C언어로 컴파일하는데 사용하는 가장 일반적 도구, numpy와 일반 파이썬 코드 모두 커버Numba - numpy코드에 특화된 컴파일러PyPy - 일반 파이썬 실행환경을 대체하는 비 numpy코드를 위한 JIT 컴파일러7.1 가능한 속도 개선의 종류컴파일로 빨라질 수 있는 부분은 대부분 수학적인 부분why? 같은 연산을 무수히 반복하기 때문이런 루프에서는 임시 객체를 많이 사용할 확률이 높음근데 numpy연산은 임시 객체를 많이 생성하지 않아서 컴파일이 별 도움이 안 된다고 함 프로그램 동작 이해를 목표로 프로파일=..
-
Unifying Short and Long-Term Tracking with Graph Hierarchies공부/논문 2024. 8. 10. 13:39
어떸케 모델 이름이 SUSHI...?멋있다...https://arxiv.org/pdf/2212.03038 Abstracttracking은 장,단기 tracking 둘 다 고려해야함더보기단기 tracking?가려지지 않은 객체에 대한 연관성장기 tracking?가려졌다가 다시 나타나는 객체에 대한 연관성하이브리드 접근 방식인 SUSHI 제안긴 클립을 하위 클립 계층으로 분할하여 처리하므로 확장성이 뛰어남그래프 신경망을 활용하여 계층 구조의 모든 레벨을 처리=>시간적 규모에 관계없이 모델을 통합하고 매우 일반적1. Introductiontracking by detection은 MOT에 자주 쓰이는 패러다임1. 모든 프레임에서 객체를 detection2. data association : 객체를 traject..
-
Chpater2 파이썬스러운 코드공부/파이썬 클린코드 2nd Edition 2024. 8. 8. 08:18
관용구특정 작업을 수행하기 위해 코드를 작성하는 특별한 방법이 관용구를 따른 코드를 파이썬에서는 파이썬스럽다(Pythonic)고 함 파이썬스러운 코드를 왜 짤까?1. 일반적으로 더 나은 성능을 내기 때문2. 코드가 작고 소듕..작고 이해하기 쉽기 때문3. 전체 개발팀이 동일한 패턴과 구조에 익숙해지면=>실수를 줄이고 문제의 본질에 보다 집중 가능 인덱스와 슬라이스파이썬에서 지원하는 것 중 특이한 점!음수 인덱스my_num=(1,2,3,4)my_num[-1]>>>4 slice 지원*끝 인덱스는 포함하지 않음my_num=[1,2,3,4]my_num[:2]>>>[1,2]#간격 지정my_num[::2]>>>[1,3] slice는 내장 객체이므로 직접 호출도 가능!s=slice(None,3)my_num[s]==m..
-
Segment Anything공부/논문 2024. 8. 3. 20:25
SAM2가 나온 기념으로 SAM 논문 리뷰!https://arxiv.org/pdf/2304.02643 AbstractSA 프로젝트 : image segmentation을 위한 새로운 task, model, dataset1. IntroductionLLM은 zero-shot, few-shot generalization를 통해 NLP에 혁신을 일으키는 중이러한 foundation model은 일반화 가능이런 일반화는 프롬프트 엔지니어링을 통해 구현되는 경우가 많음 CV에서는 NLP만큼은 아니지만 연구되어 왔음ex)CLIP, ALIGNconstrastive learning을 통해 text, image encoder를 훈련훈련된 encoder는 새로운 시각적 개념, 데이터 분포에 대한 zero-shot ..