-
(Hands-On Machine Learning 2) 2. 머신러닝 프로젝트 처음부터 끝까지
← 이전 글로 다음 글로 → 들어가기 전에 2장은 머신러닝의 예제 프로젝트를 처음부터 끝까지 진행합니다. 내용을 자세히 이해하려니 어려움이 있었지만, 프로젝트의 큰 흐름을 이해할 수 있었습니다. 해당 장에서는 캘리포니아 인구조사 데이터를 사용하여 캘리포니아 주택 가격 모델을 만듭니다. 문제 정의 금전적 수익을 위해 제작되는 모델임으로, 비즈니스 목적을 정확히 파악해야한다. 부동산 투자를 위한 머신러닝 파이프라인 [2] 파이프 라인이란 학습 방법 선택 지도, 비지도, 강화, 분류, 회귀, 배치, 온라인 등등 다양한 선택지가 있다. 이를 선택하기 위해서 현재 가지고 있는 데이터를 잘... Read More
-
머신러닝에서 컴포넌트란
서론 핸즈온 머신러닝 [1] 에서 파이프라인을 설명할 때 컴포넌트라는 단어를 많이 사용한다. 머신러닝 프로젝트 문서를 보면 컴포넌트라는 용어를 자주 보게되는데 확실히 잡고 가야되겠다고 판단했다. … 관련 문서를 찾다보니 원래 내가 알고 있던 단어였다. 컴포넌트 단어를 자바 웹 개발할 때 들어본 단어였는데 순간 머신러닝이라는 틀에 갇혀버린거 같다. 머신러닝이라도 모델링 개발인데 .. 컴포넌트란? wikipedia A component in the Unified Modeling Language represents a modular part of a system that encapsulates the... Read More
-
솔직함에 대하여
내 삶의 솔직함이란 가치관에 대하여 내가 살아온 짧은 인생에서 성인이 되기 전부터 성인이 되고 난 후로 지금까지 솔직함이라는 태도는 나의 가치관에서 큰 부분을 차지하는 자세 중 하나였다. 솔직하게 첨렴하게 남들에게 부끄럽지 않은 내가 되겠노라 생각하며 누구에게도 부끄럽지 않은 삶을 살고 싶었기에, 솔직함이라는 자세로 살아왔다. 사랑하는 사람에게도 존경하는 사람에게도 친하게 진해는 친구에게도 솔직하게 얘기하고 친구들의 얘기를 진실이라고 생각하고 받아들이고 반성하고 성장했다. 하지만 이 솔직함이란 정말 옳은 것일까? 성인이 되고 나서 나를 뒤돌아보고 주변을 바라보는 성장을 하다보니 내 가치관에 벗어나는 상황이... Read More
-
홀드 아웃 검증
홀드 아웃 검증이란 핸즈온 머신러닝2 훈련 세트의 일부를 떼어내어 여러 후보 모델을 평가하고 가장 좋은 하나를 선택한다. 홀드 아웃 세트를 검증세트(개발 세트, 데브 세트)라고 부른다. 홀드 아웃 검증의 단점과 해결 방법 홍드 아웃 검증의 단점 훈련 세트에서 데이터를 분리하다보니, 세트가 작거나 클 때 발생하는 문제가 있다. 세트가 작을 때 모델이 정확하게 평가되지 않는다. 최적이 아닌 모델을 잘못 선택할 수 있다. 세트가 클 때 남은 훈련 세트가 전체 훈련 세트보다 너무 작아진다. 너무작은 훈련 세트에서 훈련한 모델을 비교하는 것은 이상적이지 않다. ... Read More
-
교차 검증
교차 검증이란 wikipedia Cross-validation is a resampling method that uses different portions of the data to test and train a model on different iterations. 교차 검증은 데이터의 다른 부분을 사용하여 다양한 반복에서 모델을 테스트하고 훈련하는 리샘플링 방법입니다. 교차 검증 방법 k*l-fold cross-validation k-fold cross-validation with validation and test set (K겹 교차 겸증) 참고문헌 1) wikipedia, Cross-val... Read More
-
k 겹 교차 검증
k 겹 교차 검증이란 wikipedia This is a type of k*l-fold cross-validation when l = k - 1. 이는 l = k - 1일 때 k-l 겹 교차 검증 의 한 유형이다. 단일 k 겹 교차 검증은 검증 세트 및 테스트 세트를 모두 사용한다. k 겹 교차 검증 방법 두 세트를 합친 세트는 k 세트로 분활된다. 이중 하나의 세트가 테스트 세트로 선택 된다. 이후 나머지 세트 하나씩 유효성 검사 세트로 사용하고, 나머지 (k-2) 세트를 학습 세트로 사용한다. k-l겹 교차 검증 과 유사하게 훈련 세트는 모델 피팅에 사용되고 검증 세트는 각 하이퍼파라미터 세트... Read More
-
k-l 겹 교차 검증
k-l 겹 교차 검증이란 wikipedia This is a truly nested variant which contains an outer loop of k sets and an inner loop of l sets. 이것은 k 세트의 외부 루프와 l 세트의 내부 루프를 포함하는 진정한 중첩 변형입니다. k-l 겹 교차 검증 방법 총 데이터 세트는 k 세트 로 분할됩니다. 하나씩 (외부) 테스트 세트로 세트가 선택되고 (k - 1)개의 다른 세트가 해당 외부 훈련 세트로 결합됩니다. 이것은 k 세트 각각에 대해 반복됩니다. 각 외부 훈련 세트는 l 세트 로 다시 세분화됩니다 . 하나씩 하나의 세트... Read More