목록ETC (10)
-

* 12주차 강의 내용입니다. 1) Data Transformation 입출력 수준에서 데이터를 추상화 한다. 100 by 100 이미지를 classfication 하기 위해 4차원의 데이터로 줄이는 것과 같다. 고차원 데이터를 1차원으로 줄이는 방법은 무엇이 있을까? 가령 이미지 처리의 경우 수많은 픽셀로 이루어져있기 때문에 낮은 차원으로 reduction 하기 위해서는 무언가 방안이 필요하다. -- 2) CNN Convolutional Nueral Network은 Matrix간의 합성 행렬곱을 통해 차원을 줄여간다. 일정한 필터를 stride하면서 저차원으로 이동한다. padding - 지나치게 데이터가 축소되어 정보가 소실되는 것을 방지하기 위해 데이터에 0으로 이루어진 패딩을 주는 경우가 있다. ..
* 11주차 강의 내용입니다. 1) Fourier Transformation 푸리에 변환(Fourier transform, FT)은 시간에 대한 함수(혹은 신호)를 함수를 구성하고 있는 주파수 성분으로 분해하는 작업이다.

* 9주차 강의 내용입니다. 1) Modern AI 우리가 마주치게 되는 현대의 인공지능은 대부분의 문제를 Classfication이나 Clustering으로 해결하려고 든다. Classfication은 어떤 문제가 주어졌을 때 데이터에 label을 붙여주는 것을, Clustering은 데이터가 주어지면 구조나 유사성을 이용하여 Position을 찾아가는 과정을 이야기한다. Classfication은 주로 지도 학습(Supervised Learn)에 주로 사용되며 Clustering은 비지도 학습(Unsupervised Learn)에 사용되는 개념이다. Classfication - Supervised Learning 지도 학습은 항상 정답이 있어야 한다. 어떤 하나의 문제가 있고 그 문제에 대한 해답이 ..

* 8주차 강의 내용입니다. 가장 최적의 path를 찾아가는 search - 딥러닝 문제 해결 1) 품사 분석기(Part of Speech Tagging) Viterbi-Search는 머신러닝 분야에서 최종적으로 의사 결정(Descision Making)을 할 때 최적의 path를 찾아 나가는 탐색 알고리즘이다. 이 알고리즘을 이해하기 위해 사용되는 가장 대표적인 예시는 품사 분석기(Part of Speech Tagging)인데, 용어 그대로 주어진 문장에서 요소들을 추출하고 품사를 결정하는 문제를 말한다. squence of word가 들어왔을 때 각 word를 w1, w2, ... wk라고 했을 때 각 word는 특정 태그를 가질 수 있을 것이며 이는 squence를 가진다. 즉, sequence o..

* 6주차 수업 내용입니다. 0) 딥러닝은 왜 강력한가? Representation Learning 위 그림이 무엇으로 보이는가? 바로, 사다리이다. 우리는 당연하게도 그림을 보고 사다리라는 것을 바로 인지하였다. 그렇다면 어떻게 사다리라는 것을 인지한 것일까? 경험에 의해서 알 수 있다고 생각할 수도 있지만 여기서 말하고자 하는 핵심은 그것이 아니다. 가령 사다리를 처음보는 아이들에게 철로 된 사다리, 나무로 된 사다리와 같이 여러 종류의 사다리를 보여주더라도 전부 사다리라고 답할 수 있다. 즉, 이 세상에 있는 모든 사다리를 인지하기 위해 그것들의 모습을 전부 경험할 필요는 없다는 것이다. 결론적으로, 인간에게는 사다리를 사다리라고 규정지을 수 있는 그 무언가가 있다는 것이다. 사다리를 규정지을 수 ..

* 5주차 수업 내용입니다. 1) Dimension Reduction 우리가 실제 세계(Real World)를 분석할 때 자연의 존재들을 Sensing해서 Data로 가공하게 된다. 이때 데이터는 수학이라는 도구를 적용시키기 쉽도록 Vector Form으로 변환하는 것이 일반적이다(선형 대수적). 아닌 경우도 있지만 자연의 구성 요소를 Vector Form으로 가져왔을 때 Dimension이 매우 크기 때문에 수학적 연산이 곤란하다. 이 때문에 우리는 Simantic은 유지하면서 Dimension을 축소시킬 방법이 필요하다(단순화). Dimension을 줄이는 것은 데이터를 표현하는데 용량을 줄일 수 있고, 이는 Machine Learning 함에 있어 처리 속도를 기하 급수적으로 줄일 수 있다. 또한 ..

* 4주차 강의 내용입니다. 1) K-Means 1) K개의 지점을 초기 지점으로 잡는다. 2) 모든 점을 가장 가까운 초기 지점으로 클러스터링한다. 3) 클러스터링된 집단의 중심점을 재정의한다. 4) 2~3 과정을 중심점이 바뀌지 않을 때 까지 반복한다. 1. K값을 정한다. 1. K개의 점을 무작위로 고른다. 2. 모든 점을 가장 가까운 중심점에 클러스터링 한다. 3. 클러스터링 된 집단에서 mean을 이용하여 중심점을 재정의한다. 4. 반복 -- 2) Hierarchical Clustering 계층적 클러스터링(Hierarchical Clustering)은 데이터를 트리 형태로 만들어서 중첩된 클러스터링 구조를 갖게 된다. -- 3) DBSCAN(Density-based Method) core po..

* 3주차 강의 내용입니다. 0) Distance가 무엇인가? 데이터 과학, 데이터를 가공하는데 왜 Distance라는 개념이 튀어나온 것일까? 이유를 알아보기 위해 우선 우리가 일상적으로 사용하고 있는 거리(distance)의 개념에 대해 생각해보자 일상속에서의 Distance? 보통 일상속에서 '거리' 라는 개념은 어디론가 이동해야할 때 등장한다. 시작점이 있고 도착점이 있을 때 이 사이를 이동하기 위해서는 어느정도 걸어야하는지(혹은 탈 것) 나타내는 지표이며 이는 그 사이의 장애물이나 경사 등 요소에 따라 직선이 아닐수도 있다. 반면 시작점과 도착점을 직선으로 잇는 '직선 거리'라는 개념도 존재한다. 위의 예시에서는 파란색 길이 매우 굴곡져있는데, 건물들이 빼곡한 도시에서의 상황을 생각해보자. 길이..

* 2주차 강의 내용 입니다. 0) Data Understanding 어떤 양궁 선수가 한 게임에서의 점수 획득 이력이 있다고 가정하자. 점수의 타입은 [n회차에 m점 획득] 과 같은 형태와 같다고 할 때 아래의 세 선수 A, B, C의 경기 이력을 보자. -- 경기 이력 선수 A 9 8 10 7 5 3 5 1 10 9 선수 B 6 9 4 5 10 10 7 4 6 6 선수 C 10 5 4 6 10 10 10 10 1 1 -- "이 세 선수 중에 어느 선수가 가장 훌륭한 선수인가" 에 대해 정하고자 할 때 그 기준을 어떻게 설정할 것인가에 대해 이야기 해보자. 이 문제를 어떻게 해결할까? 총점이 높은 선수? 10점이 많은 선수? 물론 실제 양궁 대회라면 총점이 높은 선수가 우수한 플레이어로 인정받겠지만 이..

* 3학년 1학기 알고리즘응용(정상근 교수님) 수업 중간고사 대체 과제물입니다. - 201802092 박민 1) 과목 개요 저번 학기 알고리즘 수업은 다양한 자료구조나 알고리즘 등이 어떻게 구현되어있는지 이를 어떤 문제에 적용하면 좋을지와 같은 이론적인 측면을 배웠다. 이에 심화 과목 격인 알고리즘응용은 알고리즘 자체보다는 해당 알고리즘이 실제로 적용되는 문제에 초점이 맞춰져 있다. 선수 과목인 알고리즘에서는 컴퓨터 공학적인 문제를 어떤 알고리즘을 사용하여 문제를 해결할 것인가에 대해 관심이 있었다면 이번에 배울 과목은 흔히 말해 지능 정보(인공지능, 머신러닝 - 데이터 과학)를 처리하는 과정에서 발생할 수 있는 문제에 대해 다루게 된다. 조금 더 덧붙여서 우리가 살고있는 자연 환경을 과학/공학이 어떻게..