상세 컨텐츠

본문 제목

sklearn.model_selection 모듈 소개

AI/Machine Learning

by mk coding 2024. 3. 4. 21:42

본문

sklearn.model_selection: 모델 선택

Cross-validation: evaluating estimator performance, Tuning the hyper-parameters of an estimator 그리고 Learning curve 섹션을 참고할 것. (scikit-learn.org)

분할기 클래스들

  • model_selection.GroupKFold([n_splits]) : 중첩되지 않는 그룹을 가진 K-fold 반복자 변형
  • model_selection.GroupShuffleSplit([...]) : Shuffle-Group(s)-Out 교차 검증 반복자
  • model_selection.KFold([n_splits, shuffle, ...]) : K-Fold 교차 검증기
  • model_selection.LeaveOneGroupOut() : 한 그룹을 제외하는 교차 검증기
  • model_selection.LeavePGroupsOut(n_groups) : P 그룹을 제외하는 교차 검증기
  • model_selection.LeaveOneOut() : 한 개를 제외하는 교차 검증기
  • model_selection.LeavePOut(p) : P개를 제외하는 교차 검증기
  • model_selection.PredefinedSplit(test_fold) : 미리 정의된 분할 교차 검증기
  • model_selection.RepeatedKFold(*[, n_splits, ...]) : 반복 K-Fold 교차 검증기
  • model_selection.RepeatedStratifiedKFold(*[, ...]) : 반복 계층화 K-Fold 교차 검증기
  • model_selection.ShuffleSplit([n_splits, ...]) : 임의 순열 교차 검증기
  • model_selection.StratifiedKFold([n_splits, ...]) : 계층화 K-Fold 교차 검증기
  • model_selection.StratifiedShuffleSplit([...]) : 계층화 ShuffleSplit 교차 검증기
  • model_selection.StratifiedGroupKFold([...]) : 중첩되지 않는 그룹을 가진 계층화 K-Fold 반복자 변형
  • model_selection.TimeSeriesSplit([n_splits, ...]) : 시계열 교차 검증기

분할 함수들

  • model_selection.check_cv([cv, y, classifier]) : 교차 검증기를 구축하기 위한 입력 검사 유틸리티
  • model_selection.train_test_split(*arrays[, ...]) : 배열이나 행렬을 임의의 학습 및 테스트 하위 집합으로 분할

하이퍼파라미터 최적화 도구들

  • model_selection.GridSearchCV(estimator, ...) : 추정기에 대한 지정된 파라미터 값들에 대한 완전 탐색을 수행
  • model_selection.HalvingGridSearchCV(...[, ...]) : 연속적인 반감을 통한 지정된 파라미터 값들에 대한 탐색을 수행
  • model_selection.ParameterGrid(param_grid) : 각각에 대해 이산적인 수의 값들을 가진 파라미터 그리드
  • model_selection.ParameterSampler(...[, ...]) : 주어진 분포에서 샘플링된 파라미터들에 대한 생성기
  • model_selection.RandomizedSearchCV(...[, ...]) : 하이퍼 파라미터들에 대한 무작위 탐색을 수행
  • model_selection.HalvingRandomSearchCV(...[, ...]) : 하이퍼 파라미터들에 대한 무작위 탐색을 수행

모델 검증

  • model_selection.cross_validate(estimator, X) : 교차 검증에 의해 메트릭을 평가하고 학습/점수 시간을 기록
  • model_selection.cross_val_predict(estimator, X) : 각 입력 데이터 포인트에 대해 교차 검증 추정치를 생성
  • model_selection.cross_val_score(estimator, X) : 교차 검증에 의해 점수를 평가
  • model_selection.learning_curve(estimator, X, ...) : 학습 곡선
  • model_selection.permutation_test_score(...) : 순열을 사용하여 교차 검증된 점수의 유의성을 평가
  • model_selection.validation_curve(estimator, ...) : 검증 곡선

시각화

  • model_selection.LearningCurveDisplay(*, ...) : 학습 곡선을 시각화
  • model_selection.ValidationCurveDisplay(*, ...) : 검증 곡선을 시각화

관련글 더보기