프로그래밍/인공지능 5

[혼공머신] Chapter3-1 k-최근접 이웃 회귀

지도 학습 알고리즘1. 분류 : 샘플을 몇 개의 클래스 중 하나로 분류2. 회귀 : 임의의 어떤 숫자를 예측 k-최근접 이웃 회귀예측하려는 샘플에 가장 가까운 샘플 k개의 수치를 보고그 수치의 평균을 통해 타깃을 예측하는 방법이다. 농어의 데이터를 입력하고, 산점도를 측정했다.농어가 커질수록 산점도는 늘어나도록 생겼다.사이킷 런을 이용하여 훈련 세트와 데이터 세트를 나누고,2차원 배열을 필요로 하는 사이킷 런이기에 reshape() 메서드를 이용한다. 데이터.reshape(2,2)[1,2,3,4][[1,2] [3,4]]행과 열에 맞춰서 바뀌게 된다.이때 원소의 개수가 맞지 않으면 에러가 발생한다. 메소드를 이용하여 데이터를 1차원에서 2차원으로 바꾼다.이때. -1은 열을 1로 하는 숫자를 자동으로 이용하..

[혼공머신]Chapter 2-2 데이터 전처리

numpy의 column_stack()은 리스트를 일렬로 세운 후에 나란히 연결한다출력은 튜플로 한다.이를 이용하여 데이터를 변환한다.슬라이싱으로 5개를 표시하면 이렇게 나온다. np.ones() 함수 : 원하는 개수의 1을 채운 배열을 만든다np.zeros() 함수 :  원하는 개수의 0을 채운 배열을 만든다 이를 기반으로 정답 데이터를 만든다.데이터가 적으면 괜찮지만, 많을시에는 이런 함수를 사용하는 것이 편하다.사이킷런으로 훈련 세트와 테스트 세트 나누기인덱스를 만들어 나누는 거보다 편하다.사이킷 런의 train_test_split() 함수이다.  fish_data를 train_input 과 test_ input으로fish_target을 train_target 과 test_target으로 나눠준다,..

[혼공머신]Chapter 2-1 훈련 세트와 데이터 세트(Numpy)

머신러닝 알고리즘지도학습 : 훈련하기 위한 데이터와 정답이 필요하다.비지도학습 : 사람의 감독 없이 하기에 라벨이 지정되어 있지 않은 데이터를 이용한다.지도학습입력(input) : 데이터타겟(target) : 정답훈련 데이터 = 입력 + 타겟특성 : 길이와 무게 처럼 데이터를 이루는 특징데이터훈련 세트 : 머신러닝을 훈련할 때 사용하는 데이터데이터 세트 : 평가에 사용하는 데이터 샘플 : 하나의 데이터 세트 (ex, 도미의 길이+무게)샘플링 편향훈련과 데이터 세트를 나눴을 때 앞쪽은 도미, 뒷쪽은 빙어가 있게 된다.이런 상태에서 뒤를 타겟 데이터로 지정하면 충분한 빙어 데이터가 들어가지 않기에 정답을 맞출 수가 없다.-> 그러므로 골고루 섞는 과정이 필요하다. 넘파이파이썬의 대표적인 배열 라이브러리고차원..

[혼공머신] Chapter 1-3. 생선 분류 문제

데이터 준비 및 확인1. 도미 데이터 준비bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0,                 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0,                 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0]bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0,                 50..

[혼공머신] Chapter 1-1, 1-2 : 인공지능 및 코랩

혼공단 13기 시작.시작하기에 앞서.1. 파이썬의 기초 문법은 알아야 한다.2. 파이썬만 알고 있다면 머신러닝과 딥러닝을 학습할 수 있게 했다고 한다.인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술강 인공지능 : 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템약 인공지능 : 특정 분야에서 사람의 일을 도와주는 보조 역할의 컴퓨터 시스템초 인공지능 : 인간의 한계를 넘어서 스스로 목표를 설정하고 지능을 강화머신러닝: 규칙을 일일이 프로그래밍 하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘통계학과 깊은 관련이 있음 - 대표적인 라이브러리 : 사이킷런 학습 방식에 따른 구분지도학습비 지도학습강화학습정답이 주어진 상태에서 학습예측 모델 등에 사용정답없이 학습군집화..