Algorithm
-
-
Data Clustering AlgorithmAlgorithm 2020. 8. 24. 17:54
군집화 Clustering 데이터를 모아놓았을 때 가장 궁금해하는 것 중 하나. 무슨 데이터가 서로 비슷하고 무슨 데이터가 서로 다른가? 데이터를 서로 유사한 군집으로 나눌 수 없을까? Clustering은 예측이 아닌 분석이다. 즉 정답이 존재하지 않는다. ( Output Variable X) Unsupervised learning 데이터의 분포나 경향을 파악하기에 좋다. 향후 예측을 위한 사전 단계가 될 수 있다. 군집화의 기준은? 데이터간의 유사도 유사한 데이터는 하나의 군집 안에 묶일 수록 좋다. 유사하지 않은 데이터는 서로 다른 군집에 속할 수록 좋다. 유사도는 거리의 역수. → 군집화는 거리 기반. ex) 숫자로된 Data Set을 갖고 있다 가정했을 때 무엇이 이상한 Data?, 무엇이 남과..
-
Python 3 문법 02Algorithm 2020. 8. 24. 01:48
Python3 표준 라이브러리 내장 함수 : print(), input() 같은 기본 입출력, sorted 같은 정렬 기능 포함. sum (list)→ 리스트같은 iterable 객체(리스트, 튜블, 사전) 가 입력으로 주어 졌을 때 모든 원소의 합. min (list)→ 리스트같은 iterable 객체가 입력으로 주어 졌을 때 가장 작은 값. max (list)→ 리스트같은 iterable 객체가 입력으로 주어 졌을 때 가장 큰 값 eval (list)→ 리스트같은 iterable 객체가 입력으로 주어 졌을 때 평균 값 sorted (list) → 리스트같은 iterable 객체가 입력으로 주어 졌을 때 객체를 정렬. dict경우 key 값으로 정렬 reverse로 역순정렬 iterable 객체는 기본..
-
Python 3 기초 문법Algorithm 2020. 8. 23. 19:45
자료형 - 정수형 - 실수형 a = 5. -> 5.0 a = -.7 = -0.7 a = 1e9 = 100000000.0 a = 75.25e1 = 752.5 round ( a ) 를 통해 반올림 사용 - 리스트 자료형 a = [1,2,3] a = list() a = [] - 2차원 리스트 자료형 array = [ [0] * n for _ in range(n) ] n = 3 → [ [0,0,0], [0,0,0], [0,0,0] ] - 리스트 indexing & slicing a = [1, 2, 3, 4, 5, 6, 7, 8, 9] a[-1] = 9 a[0] = 1 a[-3] = 7 a[3] = 4 a[1:4] = 2,3,4 - 리스트 컴프리헨션 리스트 초기화 방법중 하나. [ ] 안에 조건문과 반복문을 넣어..