Machine Learning Data Lifecycle in Production
Course Link Lecture 2 in MLOps Data Label Collecting Data You need to make sure that your data covers the same region of your feature space as the prediction request that you’ll get your trai
Course Link Lecture 2 in MLOps Data Label Collecting Data You need to make sure that your data covers the same region of your feature space as the prediction request that you’ll get your trai
Course Link Lecture 1 in MLOps Overview the key steps involved in a typical machine learning project. It starts with scoping, where the project goals and variables (X and Y) are defined. Data
정상성(stationarity) 시계열은 시계열의 특징이 해당 시계열이 관측된 시간에 무관 추세나 계절성이 있는 시계열은 정상성을 나타내는 시계열이 아님 → 추세와 계절성은 서로 다른 시간에 시계열의 값에 영향을 줄 것이기 때문. 백색 잡음(white noise) 시계열: 정상성을 나타내는 시계열 → 언제 관찰하는지에 상관이 없고 시간에 따라 어떤 시점에서
Course Lecture 3 in Machine Learning course Unsupervised Learning1. clustering Usage: Grouping similar news, DNA analysis, Astronomical data analysis k-means algorithm local minimum Occurs when
Course Lecture 2 in Machine Learning Course Neural Networks matrix multiplication: it is a binary operation that takes a pair of matrices and produces another matrix. It is defined as the product of
Course Lecture 1 in Machine Learning Course Regression with multiple input variables1. vectorization Many CPUs have “vector” or “SIMD” instruction sets which apply the same operation simultaneously
개요 이전 포스팅에 이어 Big Query ML에서 K-Means Clustering에서 k값을 결정하는 방법을 알아보자 이 포스팅 하단부에 대한 설명 Elbow Method 사용하고자 하는 클러스터 범위를 지정한다. 각 클러스터를 WCSS방법으로 계산을 합니다. WCSS값과 클러스터 K 갯수에 대한 커브선을 그립니다. 뾰족하게 구부러진 부분이나 특
1. Ensemble Model어떠한 한 현상에 대한 답을 얻는다고 가정해보자, 많은 경우에 한 명의 전문가보다 여려 명의 일반인들의 의견이 더 나은 경우가 있다. 위 예제와 비슷하게, 하나의 좋은 모형(회귀,분류)으로부터 예측을 하는 것보다 여러 개의 모형으로부터 예측을 수집하는 것이 더 좋은 예측을 할 수 있다. 이러한 여러 개의 모형을 앙상블이라고
1. 의사결정트리 데이터에 있는 규칙을 학습을 통해 자동으로 찾아내 트리 기반의 분류 규칙을 만드는 알고리즘입니다. 조금 더 쉽게 하자면 if else를 자동으로 찾아내 예측을 위한 규칙을 만드는 알고리즘입니다. 하지만 Decision Tree에서 많은 규칙이 있다는 것은 분류 방식이 복잡해진다는 것이고이는 과적합(Overfitting)으로 이어지기 쉽습니
1. What is Density-Based Spatial Clustering of Applications with Noise DBSCAN (Density-based spatial clustering of applications with noise) uses density-based clustering among clustering algorithms.