전체 글
-
Pandas개발 2020. 9. 2. 17:01
import numpy as np import pandas as pd Create Object Series Data 형성 obj = pd.Series([1,3,5,np.nan,6,8]) obj => 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 DataFrame Data 형성 import pandas as pd import numpy as np dates = pd.date_range('20200902', periods=6) dates=> DatetimeIndex(['2020-09-02', '2020-09-03', '2020-09-04', '2020-09-05', '2020-09-06', '2020-09-07'], dtype='datetime64[ns]', fr..
-
최단경로Algorithm 2020. 9. 2. 15:07
최단 경로(Shortest Path) 알고리즘 이란? 말 그대로 가장 짧은 경로를 찾는 알고리즘이다. 한 지점에서 다른 특정 지점까지의 최단 경로를 구해야하는 경우. 한 지점에서 다른 모든 지점까지의 최단 경로를 구해야하는 경우. 모든 지점에서 다른 모든 지점까지의 최단 경로를 모두 구해야하는 경우 등 다양한 사례에서 사용하며 최단 경로 알고리즘은 보통 그래프로 표현한다. 각 '지점'은 그래프에서 '노드'로 표현되고, 지점 간 연결된 도로는 그래프에서 '간선'으로 표현된다. 다익스트라 알고리즘 특정한 노드에서 출발하여 다른 모든 노드로 가는 최단 경로를 계산하는 알고리즘. 음의 간선이 존재하지 않을 때 정상적으로 동작한다. 현실 세계의 도로(간선)은 음의 간선으로 표현되지 않는다. 그리디 알고리즘으로 분..
-
다이나믹 프로그래밍Algorithm 2020. 8. 30. 16:55
다이나믹 프로그래밍(DP)이란? 최적의 해를 구하기에 시간이 매우 많이 필요하거나 메모리 공간이 매우 많이 필요한 문제를 해결하고자 하는 방법. 메모리를 적절히 사용하여 수행 시간을 비약적으로 증가시키는 방법. 이미 계산된 결과(작은 문제)는 별도의 메모리 영역에 저장하여 다시 계산하지 않도록 하는 방법. 일반적으로 Top-Down (메모이제이션), Bottom-Up 방식으로 구성한다. 동적계획법이라고도 부르며 다음과 같은 조건을 만족할 때 사용할 수 있다. 최적 부분 구조(Optimal Substructure) 큰 문제를 작은 문제로 나눌 수 있으며 작은 문제의 답을 모아서 큰 문제를 해결할 수 있을 때. 중복되는 부분 문제(Overlapping Subproblem) 동일한 작은 문제를 반복적으로 해결..
-
이진탐색Algorithm 2020. 8. 30. 14:21
순차 탐색 리스트 안에있는 특정한 데이터르 찾기 위해 앞에서 부터 순서별로 하나씩 확인 하는 방법. 정렬되지 않은 리스트에서 데이터를 찾을 때 주로 사용. find_item = 'hi' list =['gg','dd','ee','ff','hi','ew','se'] for i in range(len(list)): if list[i] == find_item: return i 시간 복잡도 n개일때 최대 n개의 비교이므로 O(N)이다. 이진 탐색 반으로 쪼개가면서 탐색하기. 이미 배열 내부의 데이터가 정렬 되어 있다는 가정하에 사용할 수 있는 알고리즘. 보통 3개의 변수 사용, 시작점, 끝점, 중간점. 찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾는 과정. 한번 확인할 때 ..
-
정렬Algorithm 2020. 8. 26. 18:24
정렬(Sorting) 이란? 데이터를 특정한 기준에 따라서 순서대로 나열하는 것. 오름차순, 내림차순 정렬 등 기준을 정해서 정렬한다. 정렬은 이진 탐색의 전처리 과정이기도 하다. Python Swap array[0], array[1] = array[1], array[0] 선택정렬 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고, 그 다음 작은 데이터를 선택해 앞에서 두번째 데이터와 바꾸는 과정 이런 과정을 반복하여 정렬 하는 것을 선택정렬이라 한다. def select_sort(arr): array = arr for i in range(len(array)): min_idx = i for j in range(i+1,len(array)): if array[min_idx] > array[j]: mi..
-
-
Data Clustering AlgorithmAlgorithm 2020. 8. 24. 17:54
군집화 Clustering 데이터를 모아놓았을 때 가장 궁금해하는 것 중 하나. 무슨 데이터가 서로 비슷하고 무슨 데이터가 서로 다른가? 데이터를 서로 유사한 군집으로 나눌 수 없을까? Clustering은 예측이 아닌 분석이다. 즉 정답이 존재하지 않는다. ( Output Variable X) Unsupervised learning 데이터의 분포나 경향을 파악하기에 좋다. 향후 예측을 위한 사전 단계가 될 수 있다. 군집화의 기준은? 데이터간의 유사도 유사한 데이터는 하나의 군집 안에 묶일 수록 좋다. 유사하지 않은 데이터는 서로 다른 군집에 속할 수록 좋다. 유사도는 거리의 역수. → 군집화는 거리 기반. ex) 숫자로된 Data Set을 갖고 있다 가정했을 때 무엇이 이상한 Data?, 무엇이 남과..
-
Python 3 문법 02Algorithm 2020. 8. 24. 01:48
Python3 표준 라이브러리 내장 함수 : print(), input() 같은 기본 입출력, sorted 같은 정렬 기능 포함. sum (list)→ 리스트같은 iterable 객체(리스트, 튜블, 사전) 가 입력으로 주어 졌을 때 모든 원소의 합. min (list)→ 리스트같은 iterable 객체가 입력으로 주어 졌을 때 가장 작은 값. max (list)→ 리스트같은 iterable 객체가 입력으로 주어 졌을 때 가장 큰 값 eval (list)→ 리스트같은 iterable 객체가 입력으로 주어 졌을 때 평균 값 sorted (list) → 리스트같은 iterable 객체가 입력으로 주어 졌을 때 객체를 정렬. dict경우 key 값으로 정렬 reverse로 역순정렬 iterable 객체는 기본..