-
평균 절대 오차, MAE
평균 절대 오차 (MAE, Mean Absolute Error) 핸즈온 머신러닝 2 평균 절대 오차 와 같이 회귀 문제에 선호되는 성능 측정 방법이지만, 노름의 지수가 클수록 큰 값의 원소에 치우치며 작은 값은 무시된다. 따라서 RMSE보다 MAE가 이상치에 조금 더 민감하다. wikipedia 평균 절대 편차(MAD, Mean Absolute Deviation)이라고도 한다. 산포도의 하나로, 평균과 개별 관측치 사이 거리의 평균이다. 각 측정치에서 전체 평균 값을 뺀 값의 절댓값으로 표시되는 편차들의 합에서 산술평균을 말한다. 매우 크거나 작은 어느 하나의 값인 이상치로 인한 문제점을 보완할 수 있는 방... Read More
-
Python os
os모듈[1] This module provides (a portable way of) using operating system dependent functionality. 이 모듈은 운영 체제에 종속적인 기능을 사용하는 (이식 가능한)방법을 제공한다. os.path() This module implements some useful functions on pathnames. 이 모듈은 경로 이름에 대한 몇 가지 유용한 기능을 구현한다. os.path.join() Join one or more path components intelligently. The return value is the concatena... Read More
-
Pandas read_csv
read_csv 객체[1] 쉼표로 구분된 값(csv) 파일을 DataFrame 으로 읽어온다. 또한 선택적으로 파일을 청크로 반복하거나 분할하는 것을 지원한다. Parameters filepath_or_buffer 문자열, path 객체, file과 같은 객체 모든 유효한 문자열 주소는 가능하다. URL(http, ftp, gs, 로컬 file 등등) 경로 객체를 전달하는 경우, 모든 os.PathLike 를 허용한다. 참고문언 pandas API reference, ver 1.4.0, https://pandas.pydata.org/docs/reference/api/pandas.read_c... Read More
-
Pandas DataFrame
DataFrame 객체 [1] 기본 2차원 pandas 데이터 구조. 2차원, 크기 변경 가능, potentially heterogeneous tabular data (테이블 형식 데이터). potentially heterogeneous → 여러 다른 종류들(heterogeneous)로 이루어질 수 있는(가능성있는, potentially) 데이터 구조에는 레이블이 지정된 축(행 및 열)도 포함된다.. 산술 연산은 행 레이블과 열 레이블 모두에 정렬된다. Series 객체를 위한 dict-like 컨테이너로 생각할 수 있다. 매개변수 pandas.DataFr... Read More
-
Gitblog Latex 설정하기
이 글은 Jekyll 테마 Yat 을 기준으로 작성하였습니다. 요약 블로그 폴더/_includes/views/article.html article 태그 아래 해당 코드를 넣어준다. <script type="text/x-mathjax-config"> MathJax.Hub.Config({tex2jax: {inlineMath: [['$','$'], ['\\(','\\)']]}}); </script> <script type="text/javascript" async src="https://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-... Read More
-
평균 제곱근 오차, RMSE
평균 제곱근 오차 (RMSE, Root Mean Square Error) 핸즈온 머신러닝 2 회귀 문제의 전형적인 성능 지표로서 오차가 커질수록 값이 커짐으로서 얼마나 많은 오류가 있는지 가늠하게 해준다. wikipedia 추정 값 또는 모델이 예측한 값과 실제 환경에서 관찰되는 값의 차이를 다룰 때 흔히 사용되는 측도이다. RMSE 식 \[RMSE(\hat{\theta}) = \sqrt{MSE(\hat{\theta})} = \sqrt{E((\hat{\theta}-\theta)^2)}\; \;, \; \; \; \; \theta_{1} = \begin{bmatrix} x_{1, 1} \\ x_{1, ... Read More
-
(Hands-On Machine Learning 2) 2. 머신러닝 프로젝트 처음부터 끝까지
← 이전 글로 다음 글로 → 들어가기 전에 2장은 머신러닝의 예제 프로젝트를 처음부터 끝까지 진행합니다. 내용을 자세히 이해하려니 어려움이 있었지만, 프로젝트의 큰 흐름을 이해할 수 있었습니다. 해당 장에서는 캘리포니아 인구조사 데이터를 사용하여 캘리포니아 주택 가격 모델을 만듭니다. 문제 정의 금전적 수익을 위해 제작되는 모델임으로, 비즈니스 목적을 정확히 파악해야한다. 부동산 투자를 위한 머신러닝 파이프라인 [2] 파이프 라인이란 학습 방법 선택 지도, 비지도, 강화, 분류, 회귀, 배치, 온라인 등등 다양한 선택지가 있다. 이를 선택하기 위해서 현재 가지고 있는 데이터를 잘... Read More