전체 글 24

[혼공머신] Chapter3-1 k-최근접 이웃 회귀

지도 학습 알고리즘1. 분류 : 샘플을 몇 개의 클래스 중 하나로 분류2. 회귀 : 임의의 어떤 숫자를 예측 k-최근접 이웃 회귀예측하려는 샘플에 가장 가까운 샘플 k개의 수치를 보고그 수치의 평균을 통해 타깃을 예측하는 방법이다. 농어의 데이터를 입력하고, 산점도를 측정했다.농어가 커질수록 산점도는 늘어나도록 생겼다.사이킷 런을 이용하여 훈련 세트와 데이터 세트를 나누고,2차원 배열을 필요로 하는 사이킷 런이기에 reshape() 메서드를 이용한다. 데이터.reshape(2,2)[1,2,3,4][[1,2] [3,4]]행과 열에 맞춰서 바뀌게 된다.이때 원소의 개수가 맞지 않으면 에러가 발생한다. 메소드를 이용하여 데이터를 1차원에서 2차원으로 바꾼다.이때. -1은 열을 1로 하는 숫자를 자동으로 이용하..

[혼공머신]Chapter 2-2 데이터 전처리

numpy의 column_stack()은 리스트를 일렬로 세운 후에 나란히 연결한다출력은 튜플로 한다.이를 이용하여 데이터를 변환한다.슬라이싱으로 5개를 표시하면 이렇게 나온다. np.ones() 함수 : 원하는 개수의 1을 채운 배열을 만든다np.zeros() 함수 :  원하는 개수의 0을 채운 배열을 만든다 이를 기반으로 정답 데이터를 만든다.데이터가 적으면 괜찮지만, 많을시에는 이런 함수를 사용하는 것이 편하다.사이킷런으로 훈련 세트와 테스트 세트 나누기인덱스를 만들어 나누는 거보다 편하다.사이킷 런의 train_test_split() 함수이다.  fish_data를 train_input 과 test_ input으로fish_target을 train_target 과 test_target으로 나눠준다,..

[혼공머신]Chapter 2-1 훈련 세트와 데이터 세트(Numpy)

머신러닝 알고리즘지도학습 : 훈련하기 위한 데이터와 정답이 필요하다.비지도학습 : 사람의 감독 없이 하기에 라벨이 지정되어 있지 않은 데이터를 이용한다.지도학습입력(input) : 데이터타겟(target) : 정답훈련 데이터 = 입력 + 타겟특성 : 길이와 무게 처럼 데이터를 이루는 특징데이터훈련 세트 : 머신러닝을 훈련할 때 사용하는 데이터데이터 세트 : 평가에 사용하는 데이터 샘플 : 하나의 데이터 세트 (ex, 도미의 길이+무게)샘플링 편향훈련과 데이터 세트를 나눴을 때 앞쪽은 도미, 뒷쪽은 빙어가 있게 된다.이런 상태에서 뒤를 타겟 데이터로 지정하면 충분한 빙어 데이터가 들어가지 않기에 정답을 맞출 수가 없다.-> 그러므로 골고루 섞는 과정이 필요하다. 넘파이파이썬의 대표적인 배열 라이브러리고차원..

[혼공머신] Chapter 1-3. 생선 분류 문제

데이터 준비 및 확인1. 도미 데이터 준비bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0,                 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0,                 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0]bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0,                 50..

[혼공머신] Chapter 1-1, 1-2 : 인공지능 및 코랩

혼공단 13기 시작.시작하기에 앞서.1. 파이썬의 기초 문법은 알아야 한다.2. 파이썬만 알고 있다면 머신러닝과 딥러닝을 학습할 수 있게 했다고 한다.인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술강 인공지능 : 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템약 인공지능 : 특정 분야에서 사람의 일을 도와주는 보조 역할의 컴퓨터 시스템초 인공지능 : 인간의 한계를 넘어서 스스로 목표를 설정하고 지능을 강화머신러닝: 규칙을 일일이 프로그래밍 하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘통계학과 깊은 관련이 있음 - 대표적인 라이브러리 : 사이킷런 학습 방식에 따른 구분지도학습비 지도학습강화학습정답이 주어진 상태에서 학습예측 모델 등에 사용정답없이 학습군집화..

[파이썬18] 반복문

반복문파이썬에서 같은 코드를 여러번 반복해야 하는 경우 사용한다.특정 명령 또는 연산을 반복하면 제어할 조건문을 있어야 함.for문이랑 while문 뒤에 반드시 콜론(:)을 붙이고 들여쓰기를 수행해야 한다.while문for문조건문이 참인 동안에 반복적으로 수행while 조건문:    수행문장조건에 따라 선택적으로 반복for 반복변수명 in 반복횟수 :    수행문장while 반복문 조건문이 참인 동안에 반복적으로 수행무한루프를 돌리다가 조건에 맞춰서 탈출하는 방법으로 많이 쓰임while 불 표현식:    수행문장    수행문장 while문 강제로 빠져나오기break문breakwhile문 맨 처음으로 돌아가기continue문continue를 만나면 while문 내부 밑 코드를 실행하지 않고, 처음으로 돌아..

[파이썬17] 집합(Set) 자료형

집합 자료형딕셔너리의 키만 모아놓은 특이한 자료형중괄호{ }를 이용하지만 :는 없다.중복된 데이터를 허용하지 않는다순서가 없어서 인덱싱을 지원하지 않는다.리스트에서 중복된 값을 제거할 떄 쓰인다.변수 = {값,값,값} 변수 = set(자료형)교집합 구하기 집합 & 집합합집합 구하기집합 | 집합\ -> shift + \차집합 구하기집합 - 집합 대칭 차집합 구하기집합 ^ 집합대칭 차집합은 교집합을 제외한 양쪽의 집합을 의미한다.

[파이썬16] 딕셔너리 함수 및 메소드

딕셔너리에 키 있는지 확인in키워드키 in 딕셔너리 키가 있으면 True키가 없으면 False를 반환한다.Key로 Value 얻기get() 메소드딕셔너리.get(키)딕셔너리[키]와 같은 기능을 하지만존재하지 않는 키에 접근할 경우 에러를 발생시키지 않고 None을 출력한다.딕셔너리.get(키,값이 없을때 출력할 내용)으로도 사용이 가능하다.key 리스트 만들기keys() 메소드딕셔너리.keys()key만 뽑아서 나오는 객체를 출력한다.이때 나오는 객체는 리스트처럼 뽑아서 쓸 수는 있지만, 메소드 같은건 사용하지 못한다.이를 이용하기 위해서는 형 변환을 해줘야 한다.이는 메모리 낭비를 줄이기 위한 리스트로 나오기 때문이다.value 리스트 만들기values() 메소드딕셔너리.values()이와 같이 val..

[파이썬15] 딕셔너리 자료형

딕셔너리(Dictionary)키(key)를 기반으로 값(value)을 저장하는 자료형으로이름표가 붙은 사물함이라고 생각하면 편하다.리스트나 튜플처럼 순서가 존재하지 않는다.변수 = {        키 : 값,        키 : 값,        ...        키 : 값} dict_datakeyvalue'a'1'b'2'c'3 ※ 딕셔너리 주의사항key가 같은것이 있으면 안된다 (덮어 써짐)key가 변형되면 안된다.list자료형을 key로 쓸 수 없다.(mutable 자료형이기에)튜플은 key로 쓸 수 있다. (immutable 자료형)딕셔너리 접근딕셔너리[키]리스트와 비슷하다.자료형선언방식접근방식리스트list_data=[ ]litst_data[0]딕셔너리dict_data={ }dict_data['a..

[파이썬14] 튜플(Tuple) 자료형 및 메소드

튜플 리스트 처럼 여러개의 데이터를 저장하고 순서도 있지만 수정이 안되는 자료형튜플(데이터1, 데이터2, 데이터3...)소괄호 () 사용 성질 : 괄호를 생략해도 튜플로 인식한다. 튜플은 함수의 리턴에 많이 사용된다.인덱싱성질은 리스트와 같다. 슬라이싱튜플[ : : ]이상 미만 간격(역) 더하기와 곱하기튜플 + 튜플튜플 * 숫자길이 구하기len(튜플) ※ 튜플은 요소값을 변경할 수 없기에 sort,insert,remove,pop등의 메소드를 사용할 수 없다.