GBTreesTuner

Instance Constructors

new GBTreesTuner(df: DataFrame, data: Array[TrainSplitReferences], modelSelection: String, isPipeline: Boolean = false)

Value Members

final def !=(arg0: Any): Boolean

Definition Classes
AnyRef → Any
final def ##(): Int

Definition Classes
AnyRef → Any
final def ==(arg0: Any): Boolean

Definition Classes
AnyRef → Any
def _allowableCardinalilties: List[String]

Definition Classes
DataValidation
def _allowableCategoricalFilterModes: List[String]

Definition Classes
DataValidation
def _allowableDateTimeConversions: List[String]

Definition Classes
DataValidation
final val _allowableEvolutionStrategies: List[String]

Definition Classes
Defaults
final val _allowableInitialGenerationIndexMixingModes: List[String]

Definition Classes
Defaults
final val _allowableInitialGenerationModes: List[String]

Definition Classes
Defaults
final val _allowableMlFlowLoggingModes: List[String]

Definition Classes
Defaults
final val _allowableNAFillModes: List[String]

Definition Classes
Defaults
var _cardinalityThreshold: Int

Definition Classes
Evolution
var _continuousEvolutionGeneticMixing: Double

Definition Classes
Evolution
var _continuousEvolutionImprovementThreshold: Int

Definition Classes
Evolution
var _continuousEvolutionMaxIterations: Int

Definition Classes
Evolution
var _continuousEvolutionMutationAggressiveness: Int

Definition Classes
Evolution
var _continuousEvolutionParallelism: Int

Definition Classes
Evolution
var _continuousEvolutionRollingImprovementCount: Int

Definition Classes
Evolution
var _continuousEvolutionStoppingScore: Double

Definition Classes
Evolution
def _covarianceConfigDefaults: CovarianceConfig

Definition Classes
Defaults
def _dataPrepConfigDefaults: DataPrepConfig

Definition Classes
Defaults
var _dataReduce: Double

Definition Classes
Evolution
def _defaultAutoStoppingFlag: Boolean

Definition Classes
Defaults
def _defaultAutoStoppingScore: Double

Definition Classes
Defaults
def _defaultContinuousEvolutionGeneticMixing: Double

Definition Classes
EvolutionDefaults
def _defaultContinuousEvolutionImprovementThreshold: Int

Definition Classes
EvolutionDefaults
def _defaultContinuousEvolutionMaxIterations: Int

Definition Classes
EvolutionDefaults
def _defaultContinuousEvolutionMutationAggressiveness: Int

Definition Classes
EvolutionDefaults
def _defaultContinuousEvolutionParallelism: Int

Definition Classes
EvolutionDefaults
def _defaultContinuousEvolutionRollingImprovementCount: Int

Definition Classes
EvolutionDefaults
def _defaultContinuousEvolutionStoppingScore: Double

Definition Classes
EvolutionDefaults
def _defaultCovarianceFilterFlag: Boolean

Definition Classes
Defaults
def _defaultDataPrepCachingFlag: Boolean

Definition Classes
Defaults
def _defaultDataPrepParallelism: Int

Definition Classes
Defaults
def _defaultDataReduce: Double

Definition Classes
EvolutionDefaults
def _defaultDataReductionFactor: Double

Definition Classes
Defaults
def _defaultDateTimeConversionType: String

Definition Classes
Defaults
def _defaultEarlyStoppingFlag: Boolean

Definition Classes
EvolutionDefaults
def _defaultEarlyStoppingScore: Double

Definition Classes
EvolutionDefaults
def _defaultEvolutionStrategy: String

Definition Classes
EvolutionDefaults
def _defaultFeature: String

Definition Classes
EvolutionDefaults
def _defaultFeatureImportanceCutoffType: String

Definition Classes
Defaults
def _defaultFeatureImportanceCutoffValue: Double

Definition Classes
Defaults
def _defaultFeatureInteractionConfig: FeatureInteractionConfig

Definition Classes
Defaults
def _defaultFeatureInteractionFlag: Boolean

Definition Classes
Defaults
def _defaultFeaturesCol: String

Definition Classes
Defaults
def _defaultFieldsToIgnoreInVector: Array[String]

Definition Classes
Defaults
def _defaultFirstGenArraySeed: Long

Definition Classes
EvolutionDefaults
def _defaultFirstGenIndexMixingMode: String

Definition Classes
EvolutionDefaults
def _defaultFirstGenMode: String

Definition Classes
EvolutionDefaults
def _defaultFirstGenPermutations: Int

Definition Classes
EvolutionDefaults
def _defaultFirstGenerationConfig: FirstGenerationConfig

Definition Classes
Defaults
def _defaultFirstGenerationGenePool: Int

Definition Classes
EvolutionDefaults
def _defaultFixedMutationValue: Int

Definition Classes
EvolutionDefaults
def _defaultGenerationalMutationStrategy: String

Definition Classes
EvolutionDefaults
def _defaultGeneticMBOCandidateFactor: Int

Definition Classes
EvolutionDefaults
def _defaultGeneticMBORegressorType: String

Definition Classes
EvolutionDefaults
def _defaultGeneticMixing: Double

Definition Classes
EvolutionDefaults
def _defaultHyperSpaceInference: Boolean

Definition Classes
Defaults
def _defaultHyperSpaceInferenceCount: Int

Definition Classes
Defaults
def _defaultHyperSpaceModelCount: Int

Definition Classes
Defaults
def _defaultHyperSpaceModelType: String

Definition Classes
Defaults
def _defaultInitialGenerationMode: String

Definition Classes
Defaults
def _defaultKFold: Int

Definition Classes
EvolutionDefaults
def _defaultKSampleConfig: KSampleConfig

Definition Classes
Defaults
def _defaultLabel: String

Definition Classes
EvolutionDefaults
def _defaultLabelCol: String

Definition Classes
Defaults
def _defaultMlFlowArtifactsFlag: Boolean

Definition Classes
Defaults
def _defaultMlFlowLoggingFlag: Boolean

Definition Classes
Defaults
def _defaultModelingFamily: String

Definition Classes
Defaults
def _defaultMutationMagnitudeMode: String

Definition Classes
EvolutionDefaults
def _defaultNAFillFlag: Boolean

Definition Classes
Defaults
def _defaultNumberOfMutationGenerations: Int

Definition Classes
EvolutionDefaults
def _defaultNumberOfMutationsPerGeneration: Int

Definition Classes
EvolutionDefaults
def _defaultNumberOfParentsToRetain: Int

Definition Classes
EvolutionDefaults
def _defaultOneHotEncodeFlag: Boolean

Definition Classes
Defaults
def _defaultOptimizationStrategy: String

Definition Classes
EvolutionDefaults
def _defaultOutlierFilterFlag: Boolean

Definition Classes
Defaults
def _defaultParallelism: Int

Definition Classes
EvolutionDefaults
def _defaultPearsonFilterFlag: Boolean

Definition Classes
Defaults
def _defaultPipelineDebugFlag: Boolean

Definition Classes
Defaults
def _defaultPipelineId: String

Definition Classes
Defaults
def _defaultScalingFlag: Boolean

Definition Classes
Defaults
def _defaultSeed: Long

Definition Classes
EvolutionDefaults
def _defaultTrainPortion: Double

Definition Classes
EvolutionDefaults
def _defaultTrainSplitChronologicalColumn: String

Definition Classes
EvolutionDefaults
def _defaultTrainSplitChronologicalRandomPercentage: Double

Definition Classes
EvolutionDefaults
def _defaultTrainSplitMethod: String

Definition Classes
EvolutionDefaults
def _defaultVarianceFilterFlag: Boolean

Definition Classes
Defaults
var _earlyStoppingFlag: Boolean

Definition Classes
Evolution
var _earlyStoppingScore: Double

Definition Classes
Evolution
var _evolutionStrategy: String

Definition Classes
Evolution
var _featureCol: String

Definition Classes
Evolution
def _featureImportancesDefaults: MainConfig

Definition Classes
Defaults
var _fieldsToIgnore: Array[String]

Definition Classes
Evolution
def _fillConfigDefaults: FillConfig

Definition Classes
Defaults
var _firstGenerationGenePool: Int

Definition Classes
Evolution
var _fixedMutationValue: Int

Definition Classes
Evolution
def _gbtDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
def _gbtDefaultStringBoundaries: Map[String, List[String]]

Definition Classes
Defaults
var _generationalMutationStrategy: String

Definition Classes
Evolution
var _geneticMBOCandidateFactor: Int

Definition Classes
Evolution
var _geneticMBORegressorType: String

Definition Classes
Evolution
var _geneticMixing: Double

Definition Classes
Evolution
def _geneticTunerDefaults: GeneticConfig

Definition Classes
Defaults
var _hyperSpaceModelCount: Int

Definition Classes
Evolution
def _inferenceConfigSaveLocationDefault: String

Definition Classes
Defaults
var _initialGenerationArraySeed: Long

Definition Classes
Evolution
var _initialGenerationIndexMixingMode: String

Definition Classes
Evolution
var _initialGenerationMode: String

Definition Classes
Evolution
var _initialGenerationPermutationCount: Int

Definition Classes
Evolution
var _kFold: Int

Definition Classes
Evolution
var _kFoldIteratorRange: ParRange

Definition Classes
Evolution
var _kGroups: Int

Definition Classes
Evolution
var _kMeansDistanceMeasurement: String

Definition Classes
Evolution
var _kMeansMaxIter: Int

Definition Classes
Evolution
var _kMeansPredictionCol: String

Definition Classes
Evolution
var _kMeansSeed: Long

Definition Classes
Evolution
var _kMeansTolerance: Double

Definition Classes
Evolution
var _kSampleConfig: KSampleConfig

Definition Classes
Evolution
var _labelBalanceMode: String

Definition Classes
Evolution
var _labelCol: String

Definition Classes
Evolution
def _lightGBMDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
def _lightGBMDefaultStringBoundaries: Map[String, List[String]]

Definition Classes
Defaults
def _linearRegressionDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
def _linearRegressionDefaultStringBoundaries: Map[String, List[String]]

Definition Classes
Defaults
def _logisticRegressionDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
def _logisticRegressionDefaultStringBoundaries: Map[String, List[String]]

Definition Classes
Defaults
var _lshHashTables: Int

Definition Classes
Evolution
var _lshOutputCol: String

Definition Classes
Evolution
var _lshSeed: Long

Definition Classes
Evolution
def _mainConfigDefaults: MainConfig

Definition Classes
Defaults
var _minimumVectorCountToMutate: Int

Definition Classes
Evolution
def _mlFlowConfigDefaults: MLFlowConfig

Definition Classes
Defaults
def _mlpcDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
def _mlpcDefaultStringBoundaries: Map[String, List[String]]

Definition Classes
Defaults
var _modelSeed: Map[String, Any]

Definition Classes
Evolution
var _modelSeedSet: Boolean

Definition Classes
Evolution
def _modelTypeDefault: String

Definition Classes
Defaults
var _mutationMagnitudeMode: String

Definition Classes
Evolution
var _mutationMode: String

Definition Classes
Evolution
var _mutationValue: Double

Definition Classes
Evolution
def _naiveBayesDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
def _naiveBayesDefaultStringBoundaries: Map[String, List[String]]

Definition Classes
Defaults
var _numberOfMutationGenerations: Int

Definition Classes
Evolution
var _numberOfMutationsPerGeneration: Int

Definition Classes
Evolution
var _numberOfParentsToRetain: Int

Definition Classes
Evolution
var _numericRatio: Double

Definition Classes
Evolution
var _numericTarget: Int

Definition Classes
Evolution
var _optimizationStrategy: String

Definition Classes
Evolution
def _outlierConfigDefaults: OutlierConfig

Definition Classes
Defaults
var _parallelism: Int

Definition Classes
Evolution
def _pearsonConfigDefaults: PearsonConfig

Definition Classes
Defaults
var _quorumCount: Int

Definition Classes
Evolution
var _randomizer: Random

Definition Classes
Evolution
def _rfDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
def _rfDefaultStringBoundaries: Map[String, List[String]]

Definition Classes
Defaults
def _scalingConfigDefaults: ScalingConfig

Definition Classes
Defaults
def _scoringDefaultClassifier: String

Definition Classes
Defaults
def _scoringDefaultRegressor: String

Definition Classes
Defaults
def _scoringOptimizationStrategyClassifier: String

Definition Classes
Defaults
def _scoringOptimizationStrategyRegressor: String

Definition Classes
Defaults
var _seed: Long

Definition Classes
Evolution
final val _supportedFeatureImportanceCutoffTypes: List[String]

Definition Classes
Defaults
final val _supportedModels: Array[String]

Definition Classes
Defaults
def _svmDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
def _svmDefaultStringBoundaries: Map[String, List[String]]

Definition Classes
Defaults
var _syntheticCol: String

Definition Classes
Evolution
var _trainPortion: Double

Definition Classes
Evolution
var _trainSplitChronologicalColumn: String

Definition Classes
Evolution
var _trainSplitChronologicalRandomPercentage: Double

Definition Classes
Evolution
var _trainSplitMethod: String

Definition Classes
Evolution
def _treeSplitDefaults: MainConfig

Definition Classes
Defaults
def _treesDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
def _treesDefaultStringBoundaries: Map[String, List[String]]

Definition Classes
Defaults
var _vectorMutationMethod: String

Definition Classes
Evolution
def _xgboostDefaultNumBoundaries: Map[String, (Double, Double)]

Definition Classes
Defaults
final val allowableCardinalilties: List[String]

Definition Classes
Defaults
final val allowableCategoricalFilterModes: List[String]

Definition Classes
Defaults
final val allowableDateTimeConversions: List[String]

Definition Classes
Defaults
final val allowableEvolutionStrategies: List[String]

Definition Classes
EvolutionDefaults
final val allowableFeatureInteractionModes: List[String]

Definition Classes
Defaults
final val allowableGeneticMBORegressorTypes: List[String]

Definition Classes
EvolutionDefaults
final val allowableInitialGenerationIndexMixingModes: List[String]

Definition Classes
EvolutionDefaults
final val allowableInitialGenerationModes: List[String]

Definition Classes
EvolutionDefaults
final val allowableKMeansDistanceMeasurements: List[String]

Definition Classes
Defaults
final val allowableLabelBalanceModes: List[String]

Definition Classes
Defaults
final val allowableMBORegressorTypes: List[String]

Definition Classes
Defaults
final val allowableMutationMagnitudeMode: List[String]

Definition Classes
EvolutionDefaults
final val allowableMutationModes: List[String]

Definition Classes
Defaults
final val allowableMutationStrategies: List[String]

Definition Classes
EvolutionDefaults
final val allowableOptimizationStrategies: List[String]

Definition Classes
EvolutionDefaults
final val allowableTrainSplitMethod: List[String]

Definition Classes
EvolutionDefaults
final val allowableVectorMutationMethods: List[String]

Definition Classes
Defaults
final def asInstanceOf[T0]: T0

Definition Classes
Any
def buildLayerArray(inputFeatureSize: Int, distinctClasses: Int, nLayers: Int, hiddenLayerSizeAdjust: Int): Array[Int]

Definition Classes
Evolution
def calculateModelingFamilyRemainingTime(currentGen: Int, currentModel: Int): Double

Method for calculating the remaining time left on the genetic algorithm training (roughly)
Method for calculating the remaining time left on the genetic algorithm training (roughly)
currentGen
The current Generation that the model is running on
currentModel
The index of the current model that is being run.
returns
A Double representing the total completion percentage of the modeling portion of the run.

Definition Classes
Evolution
Since
0.2.1
Note
Due to the asynchronous nature of the algorithm, the times are not exact and are a reflection of time since the creation of the Futures and when they were initially inserted into the thread pool.
def classificationAdjudicator(df: DataFrame): Boolean

Method for validating the distinct class count for a classification type model (for use in determining which evaluator to employ for scoring and optimization of each model)
Method for validating the distinct class count for a classification type model (for use in determining which evaluator to employ for scoring and optimization of each model)
df
source Dataframe (prior to splitting for train/test)
returns
Boolean true for Binary Classification problem, false for multi-class problem

Definition Classes
Evolution
Since
0.4.0
def classificationMetricValidator(binaryValidation: Boolean, metricPayload: List[String]): List[String]

Method for restricting the available metrics used or are available for optimizing for classification problems
Method for restricting the available metrics used or are available for optimizing for classification problems
binaryValidation
boolean check from classificationAdjudicator() method
metricPayload
the hard-coded allowable List[String] of allowable classification metrics from com.databricks.labs.automl.params.EvolutionDefaults
returns
a copy of the the allowable params list with the Binary metrics removed if this is a multiclass problem.

Definition Classes
Evolution
Since
0.4.0
final val classificationMetrics: List[String]

Definition Classes
EvolutionDefaults
def classificationScoring(metricName: String, labelColumn: String, data: DataFrame): Double

Method for scoring and evaluating classification models (supporting both multi-class and binary classification problems)
Method for scoring and evaluating classification models (supporting both multi-class and binary classification problems)
metricName
the metric to be tested against (both for binary and multi-class)
labelColumn
the column name in the data set that is the 'source of truth' to compare against
data
the DataFrame that has been transformed
returns
the score, as a Double value.

Definition Classes
Evolution
Since
0.4.0
def clone(): AnyRef

Attributes
protected[java.lang]
Definition Classes
AnyRef
Annotations
@throws( ... )
def coinFlip(parent: Boolean, child: Boolean, p: Double): Boolean

Definition Classes
Evolution
def coinFlip(): Boolean

Definition Classes
Evolution
def convertDateAndTime(df: DataFrame, dateFields: List[String], timeFields: List[String], mode: String): (DataFrame, List[String])

Definition Classes
DataValidation
def debugSettings: String

Definition Classes
Evolution
final def eq(arg0: AnyRef): Boolean

Definition Classes
AnyRef
def equals(arg0: Any): Boolean

Definition Classes
AnyRef → Any
def evolveBest(): GBTModelsWithResults
def evolveParameters(): Array[GBTModelsWithResults]
def evolveWithScoringDF(): (Array[GBTModelsWithResults], DataFrame)
def extractBoundaryDouble(param: String, boundaryMap: Map[String, (AnyVal, AnyVal)]): (Double, Double)

Definition Classes
Evolution
def extractBoundaryInteger(param: String, boundaryMap: Map[String, (AnyVal, AnyVal)]): (Int, Int)

Definition Classes
Evolution
def finalize(): Unit

Attributes
protected[java.lang]
Definition Classes
AnyRef
Annotations
@throws( classOf[java.lang.Throwable] )
def geneMixing(parent: Array[Int], child: Array[Int], parentMutationPercentage: Double): Array[Int]

Definition Classes
Evolution
def geneMixing(parent: String, child: String): String

Definition Classes
Evolution
def geneMixing(parent: Int, child: Int, parentMutationPercentage: Double): Int

Definition Classes
Evolution
def geneMixing(parent: Double, child: Double, parentMutationPercentage: Double): Double

Definition Classes
Evolution
def generateAggressiveness(totalConfigs: Int, currentIteration: Int): Int

Definition Classes
Evolution
def generateAssembly(numericColumns: List[String], characterColumns: List[String], featureCol: String): (Array[StringIndexer], Array[String], VectorAssembler)

Definition Classes
DataValidation
def generateGBTConfig(configMap: Map[String, Any]): GBTConfig

Definition Classes
SeedConverters
def generateIdealParents(results: Array[GBTModelsWithResults]): Array[GBTConfig]
def generateLayerArray(layerParam: String, layerSizeParam: String, boundaryMap: Map[String, (AnyVal, AnyVal)], inputFeatureSize: Int, distinctClasses: Int): Array[Int]

Definition Classes
Evolution
def generateLightGBMConfig(configMap: Map[String, Any]): LightGBMConfig

Definition Classes
SeedConverters
def generateLinearRegressionConfig(configMap: Map[String, Any]): LinearRegressionConfig

Definition Classes
SeedConverters
def generateLogisticRegressionConfig(configMap: Map[String, Any]): LogisticRegressionConfig

Definition Classes
SeedConverters
def generateMLPCConfig(configMap: Map[String, Any]): MLPCConfig

Definition Classes
SeedConverters
def generateMutationIndeces(minimum: Int, maximum: Int, parameterCount: Int, mutationCount: Int): Array[List[Int]]

Definition Classes
Evolution
def generateRandomDouble(param: String, boundaryMap: Map[String, (AnyVal, AnyVal)]): Double

Definition Classes
Evolution
def generateRandomForestConfig(configMap: Map[String, Any]): RandomForestConfig

Definition Classes
SeedConverters
def generateRandomInteger(param: String, boundaryMap: Map[String, (AnyVal, AnyVal)]): Int

Definition Classes
Evolution
def generateRandomString(param: String, boundaryMap: Map[String, List[String]]): String

Definition Classes
GBTreesTuner → Evolution
def generateSVMConfig(configMap: Map[String, Any]): SVMConfig

Definition Classes
SeedConverters
def generateScoredDataFrame(results: Array[GBTModelsWithResults]): DataFrame
def generateTreesConfig(configMap: Map[String, Any]): TreesConfig

Definition Classes
SeedConverters
def generateXGBoostConfig(configMap: Map[String, Any]): XGBoostConfig

Definition Classes
SeedConverters
final def getClass(): Class[_]

Definition Classes
AnyRef → Any
def getClassificationMetrics: List[String]
def getContinuousEvolutionGeneticMixing: Double

Definition Classes
Evolution
def getContinuousEvolutionImprovementThreshold: Int

Definition Classes
Evolution
def getContinuousEvolutionMaxIterations: Int

Definition Classes
Evolution
def getContinuousEvolutionMutationAggressiveness: Int

Definition Classes
Evolution
def getContinuousEvolutionParallelism: Int

Definition Classes
Evolution
def getContinuousEvolutionRollingImporvementCount: Int

Definition Classes
Evolution
def getContinuousEvolutionStoppingScore: Double

Definition Classes
Evolution
def getDataReductionFactor: Double

Definition Classes
Evolution
def getEarlyStoppingFlag: Boolean

Definition Classes
Evolution
def getEarlyStoppingScore: Double

Definition Classes
Evolution
def getEvolutionStrategy: String

Definition Classes
Evolution
def getFeaturesCol: String

Definition Classes
Evolution
def getFieldsToIgnore: Array[String]

Definition Classes
Evolution
def getFirstGenArraySeed: Long

Definition Classes
Evolution
def getFirstGenIndexMixingMode: String

Definition Classes
Evolution
def getFirstGenMode: String

Definition Classes
Evolution
def getFirstGenPermutations: Int

Definition Classes
Evolution
def getFirstGenerationGenePool: Int

Definition Classes
Evolution
def getFixedIndeces(minimum: Int, maximum: Int, parameterCount: Int): List[Int]

Definition Classes
Evolution
def getFixedMutationValue: Int

Definition Classes
Evolution
def getGBTNumericBoundaries: Map[String, (Double, Double)]
def getGBTStringBoundaries: Map[String, List[String]]
def getGenerationalMutationStrategy: String

Definition Classes
Evolution
def getGeneticMBOCandidateFactor: Int

Definition Classes
Evolution
def getGeneticMBORegressorType: String

Definition Classes
Evolution
def getGeneticMixing: Double

Definition Classes
Evolution
def getHyperSpaceModelCount: Int

Definition Classes
Evolution
def getKFold: Int

Definition Classes
Evolution
def getLabelCol: String

Definition Classes
Evolution
def getModelSeed: Map[String, Any]

Definition Classes
Evolution
def getMutationMagnitudeMode: String

Definition Classes
Evolution
def getNumberOfMutationGenerations: Int

Definition Classes
Evolution
def getNumberOfMutationsPerGeneration: Int

Definition Classes
Evolution
def getNumberOfParentsToRetain: Int

Definition Classes
Evolution
def getOptimizationStrategy: String

Definition Classes
Evolution
def getParallelism: Int

Definition Classes
Evolution
def getRandomIndeces(minimum: Int, maximum: Int, parameterCount: Int): List[Int]

Definition Classes
Evolution
def getRegressionMetrics: List[String]
def getScoringMetric: String
def getSeed: Long

Definition Classes
Evolution
def getTrainPortion: Double

Definition Classes
Evolution
def getTrainSplitChronologicalColumn: String

Definition Classes
Evolution
def getTrainSplitChronologicalRandomPercentage: Double

Definition Classes
Evolution
def getTrainSplitMethod: String

Definition Classes
Evolution
def hashCode(): Int

Definition Classes
AnyRef → Any
def indexStrings(categoricalFields: List[String]): (Array[StringIndexer], Array[String])

Definition Classes
DataValidation
def invalidateSelection(value: String, allowances: Seq[String]): String

Definition Classes
DataValidation
final def isInstanceOf[T0]: Boolean

Definition Classes
Any
def modelConfigLength[T](implicit arg0: scala.reflect.api.JavaUniverse.TypeTag[T]): Int

Definition Classes
Evolution
final def ne(arg0: AnyRef): Boolean

Definition Classes
AnyRef
final def notify(): Unit

Definition Classes
AnyRef
final def notifyAll(): Unit

Definition Classes
AnyRef
def oneHotEncodeStrings(stringIndexedFields: List[String]): (OneHotEncoderEstimator, Array[String])

Definition Classes
DataValidation
def partialOverrideNumericMapping(defaultMap: Map[String, (Double, Double)], updateMap: Map[String, (Double, Double)]): Map[String, (Double, Double)]

Helper function for partially updating a numeric mapping
Helper function for partially updating a numeric mapping
defaultMap
The default configuration Map for a numeric mapping for model hyperparameter search space
updateMap
user-supplied updated map (doesn't have to have all elements in it)
returns
The default map, updated with the user-supplied overrides

Definition Classes
Evolution
Since
0.6.1
def partialOverrideStringMapping(defaultMap: Map[String, List[String]], updateMap: Map[String, List[String]]): Map[String, List[String]]

Helper function for partially updating a string mapping
Helper function for partially updating a string mapping
defaultMap
The default configuration Map for a string mapping for model hyperparameter search space
updateMap
user-supplied updated map (doesn't have to have all elements in it)
returns
The default map, updated with the user-supplied overrides

Definition Classes
Evolution
Since
0.6.1
def postRunModeledHyperParams(paramsToTest: Array[GBTConfig]): (Array[GBTModelsWithResults], DataFrame)

Helper Method for a post-run model optimization based on theoretical hyperparam multidimensional grid search space After a genetic tuning run is complete, this allows for a model to be trained and run to predict a potential best-condition of hyper parameter configurations.
Helper Method for a post-run model optimization based on theoretical hyperparam multidimensional grid search space After a genetic tuning run is complete, this allows for a model to be trained and run to predict a potential best-condition of hyper parameter configurations.
paramsToTest
Array of GBT Configuration (hyper parameter settings) from the post-run model inference
returns
The results of the hyper parameter test, as well as the scored DataFrame report.
final val regressionMetrics: List[String]

Definition Classes
EvolutionDefaults
def regressionScoring(metricName: String, labelColumn: String, data: DataFrame): Double

Method for scoring Regression models.
Method for scoring Regression models.
metricName
The metric desired to be tested
labelColumn
The name of the label column
data
the DataFrame that has been transformed by a model.
returns
the score for the metric, as a Double value.

Definition Classes
Evolution
Since
0.4.0
lazy val sc: SparkContext

Definition Classes
SparkSessionWrapper
def setCardinalityThreshold(value: Int): GBTreesTuner.this.type

Setter - for overriding the cardinality threshold exception threshold.
Setter - for overriding the cardinality threshold exception threshold. [WARNING] increasing this value on a sufficiently large data set could incur, during runtime, excessive memory and cpu pressure on the cluster.
value
Int: the limit above which an exception will be thrown for a classification problem wherein the label distinct count is too large to successfully generate synthetic data.

Definition Classes
Evolution
Since
0.5.1
Note
Default: 20
def setContinuousEvolutionGeneticMixing(value: Double): GBTreesTuner.this.type

Definition Classes
Evolution
def setContinuousEvolutionImprovementThreshold(value: Int): GBTreesTuner.this.type

Setter for defining the secondary stopping criteria for continuous training mode ( number of consistentlt not-improving runs to terminate the learning algorithm due to diminishing returns.
Setter for defining the secondary stopping criteria for continuous training mode ( number of consistentlt not-improving runs to terminate the learning algorithm due to diminishing returns.
value
Negative Integer (an improvement to a priori will reset the counter and subsequent non-improvements will decrement a mutable counter. If the counter hits this limit specified in value, the continuous mode algorithm will stop).

Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Since
0.6.0
Exceptions thrown
IllegalArgumentException if the value is positive.
def setContinuousEvolutionMaxIterations(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setContinuousEvolutionMutationAggressiveness(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setContinuousEvolutionParallelism(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setContinuousEvolutionRollingImporvementCount(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setContinuousEvolutionStoppingScore(value: Double): GBTreesTuner.this.type

Definition Classes
Evolution
def setDataReductionFactor(value: Double): GBTreesTuner.this.type

Definition Classes
Evolution
def setEarlyStoppingFlag(value: Boolean): GBTreesTuner.this.type

Definition Classes
Evolution
def setEarlyStoppingScore(value: Double): GBTreesTuner.this.type

Definition Classes
Evolution
def setEvolutionStrategy(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setFeaturesCol(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setFieldsToIgnore(value: Array[String]): GBTreesTuner.this.type

Definition Classes
Evolution
def setFirstGenArraySeed(value: Long): GBTreesTuner.this.type

Definition Classes
Evolution
def setFirstGenIndexMixingMode(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setFirstGenMode(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setFirstGenPermutations(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setFirstGenerationGenePool(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setFixedMutationValue(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setGBTNumericBoundaries(value: Map[String, (Double, Double)]): GBTreesTuner.this.type
def setGBTStringBoundaries(value: Map[String, List[String]]): GBTreesTuner.this.type
def setGenerationalMutationStrategy(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setGeneticMBOCandidateFactor(value: Int): GBTreesTuner.this.type

Setter for defining the factor to be applied to the candidate listing of hyperparameters to generate through mutation for each generation other than the initial and post-modeling optimization phases.
Setter for defining the factor to be applied to the candidate listing of hyperparameters to generate through mutation for each generation other than the initial and post-modeling optimization phases. The larger this value (default: 10), the more potential space can be searched. There is not a large performance hit to this, and as such, values in excess of 100 are viable.
value
Int - a factor to multiply the numberOfMutationsPerGeneration by to generate a count of potential candidates.

Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Since
0.6.0
Exceptions thrown
IllegalArgumentException if the value is not greater than zero.
def setGeneticMBORegressorType(value: String): GBTreesTuner.this.type

Setter for selecting the type of Regressor to use for the within-epoch generation MBO of candidates
Setter for selecting the type of Regressor to use for the within-epoch generation MBO of candidates
value
String - one of "XGBoost", "LinearRegression" or "RandomForest"

Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Since
0.6.0
Exceptions thrown
IllegalArgumentException if the value is not supported
def setGeneticMixing(value: Double): GBTreesTuner.this.type

Definition Classes
Evolution
def setHyperSpaceModelCount(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setKFold(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setKGroups(value: Int): GBTreesTuner.this.type

Setter for specifying the number of K-Groups to generate in the KMeans model
Setter for specifying the number of K-Groups to generate in the KMeans model
value
Int: number of k groups to generate
returns
this

Definition Classes
Evolution
def setKMeansDistanceMeasurement(value: String): GBTreesTuner.this.type

Setter for which distance measurement to use to calculate the nearness of vectors to a centroid
Setter for which distance measurement to use to calculate the nearness of vectors to a centroid
value
String: Options -> "euclidean" or "cosine" Default: "euclidean"
returns
this

Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Exceptions thrown
IllegalArgumentException() if an invalid value is entered
def setKMeansMaxIter(value: Int): GBTreesTuner.this.type

Setter for specifying the maximum number of iterations for the KMeans model to go through to converge
Setter for specifying the maximum number of iterations for the KMeans model to go through to converge
value
Int: Maximum limit on iterations
returns
this

Definition Classes
Evolution
def setKMeansPredictionCol(value: String): GBTreesTuner.this.type

Setter for the internal KMeans column for cluster membership attribution
Setter for the internal KMeans column for cluster membership attribution
value
String: column name for internal algorithm column for group membership
returns
this

Definition Classes
Evolution
def setKMeansSeed(value: Long): GBTreesTuner.this.type

Setter for a KMeans seed for the clustering algorithm
Setter for a KMeans seed for the clustering algorithm
value
Long: Seed value
returns
this

Definition Classes
Evolution
def setKMeansTolerance(value: Double): GBTreesTuner.this.type

Setter for Setting the tolerance for KMeans (must be >0)
Setter for Setting the tolerance for KMeans (must be >0)
value
The tolerance value setting for KMeans
returns
this

Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Exceptions thrown
IllegalArgumentException() if a value less than 0 is entered
See also
reference: http://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.ml.clustering.KMeans for further details.
def setLSHHashTables(value: Int): GBTreesTuner.this.type

Setter for Configuring the number of Hash Tables to use for MinHashLSH
Setter for Configuring the number of Hash Tables to use for MinHashLSH
value
Int: Count of hash tables to use
returns
this

Definition Classes
Evolution
See also
http://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.ml.feature.MinHashLSH for more information
def setLSHOutputCol(value: String): GBTreesTuner.this.type

Setter for the internal LSH output hash information column
Setter for the internal LSH output hash information column
value
String: column name for the internal MinHashLSH Model transformation value
returns
this

Definition Classes
Evolution
def setLSHSeed(value: Long): GBTreesTuner.this.type

Setter for the LSH Seed for the model
Setter for the LSH Seed for the model
value
Long: Seed value
returns
this

Definition Classes
Evolution
def setLabelBalanceMode(value: String): GBTreesTuner.this.type

Setter - for determining the label balance approach mode.
Setter - for determining the label balance approach mode.
value
String: one of: 'match', 'percentage' or 'target'

Definition Classes
Evolution
Annotations
@throws( ... )
Since
0.5.1
Exceptions thrown
UnsupportedOperationException() if the provided mode is not supported.
Note
Default: "percentage"
,
Available modes:
'match': Will match all smaller class counts to largest class count. [WARNING] - May significantly increase memory pressure!
'percentage' Will adjust smaller classes to a percentage value of the largest class count. 'target' Will increase smaller class counts to a fixed numeric target of rows.
def setLabelCol(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setMinimumVectorCountToMutate(value: Int): GBTreesTuner.this.type

Setter for minimum threshold for vector indexes to mutate within the feature vector.
Setter for minimum threshold for vector indexes to mutate within the feature vector.
value
The minimum (or fixed) number of indexes to mutate.
returns
this

Definition Classes
Evolution
Note
In vectorMutationMethod "fixed" this sets the fixed count of how many vector positions to mutate. In vectorMutationMethod "random" this sets the lower threshold for 'at least this many indexes will be mutated'
def setModelSeed(value: Map[String, Any]): GBTreesTuner.this.type

Definition Classes
Evolution
def setMutationMagnitudeMode(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setMutationMode(value: String): GBTreesTuner.this.type

Setter for the Mutation Mode of the feature vector individual values
Setter for the Mutation Mode of the feature vector individual values
value
String: the mode to use.
returns
this

Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Exceptions thrown
IllegalArgumentException() if the mode is not supported.
Note
Options: "weighted" - uses weighted averaging to scale the euclidean distance between the centroid vector and mutation candidate vectors "random" - randomly selects a position on the euclidean vector between the centroid vector and the candidate mutation vectors "ratio" - uses a ratio between the values of the centroid vector and the mutation vector *
def setMutationValue(value: Double): GBTreesTuner.this.type

Setter for specifying the mutation magnitude for the modes 'weighted' and 'ratio' in mutationMode
Setter for specifying the mutation magnitude for the modes 'weighted' and 'ratio' in mutationMode
value
Double: value between 0 and 1 for mutation magnitude adjustment.
returns
this

Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Exceptions thrown
IllegalArgumentException() if the value specified is outside of the range (0, 1)
Note
the higher this value, the closer to the centroid vector vs. the candidate mutation vector the synthetic row data will be.
def setNumberOfMutationGenerations(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setNumberOfMutationsPerGeneration(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setNumberOfParentsToRetain(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setNumericRatio(value: Double): GBTreesTuner.this.type

Setter - for specifying the percentage ratio for the mode 'percentage' in setLabelBalanceMode()
Setter - for specifying the percentage ratio for the mode 'percentage' in setLabelBalanceMode()
value
Double: A fractional double in the range of 0.0 to 1.0.

Definition Classes
Evolution
Annotations
@throws( ... )
Since
0.5.1
Exceptions thrown
UnsupportedOperationException() if the provided value is outside of the range of 0.0 -> 1.0
Note
Default: 0.2
,
Setting this value to 1.0 is equivalent to setting the label balance mode to 'match'
def setNumericTarget(value: Int): GBTreesTuner.this.type

Setter - for specifying the target row count to generate for 'target' mode in setLabelBalanceMode()
Setter - for specifying the target row count to generate for 'target' mode in setLabelBalanceMode()
value
Int: The desired final number of rows per minority class label

Definition Classes
Evolution
Since
0.5.1
Note
[WARNING] Setting this value to too high of a number will greatly increase runtime and memory pressure.
def setOptimizationStrategy(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setParallelism(value: Int): GBTreesTuner.this.type

Definition Classes
Evolution
def setQuorumCount(value: Int): GBTreesTuner.this.type

Setter for how many vectors to find in adjacency to the centroid for generation of synthetic data
Setter for how many vectors to find in adjacency to the centroid for generation of synthetic data
value
Int: Number of vectors to find nearest each centroid within the class
returns
this

Definition Classes
Evolution
Note
the higher the value set here, the higher the variance in synthetic data generation
def setScoringMetric(value: String): GBTreesTuner.this.type
def setSeed(value: Long): GBTreesTuner.this.type

Definition Classes
Evolution
def setSyntheticCol(value: String): GBTreesTuner.this.type

Setter - for setting the name of the Synthetic column name
Setter - for setting the name of the Synthetic column name
value
String: A column name that is uniquely not part of the main DataFrame

Definition Classes
Evolution
Since
0.5.1
def setTrainPortion(value: Double): GBTreesTuner.this.type

Definition Classes
Evolution
def setTrainSplitChronologicalColumn(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setTrainSplitChronologicalRandomPercentage(value: Double): GBTreesTuner.this.type

Definition Classes
Evolution
def setTrainSplitMethod(value: String): GBTreesTuner.this.type

Definition Classes
Evolution
def setVectorMutationMethod(value: String): GBTreesTuner.this.type

Setter for the Vector Mutation Method
Setter for the Vector Mutation Method
value
String - the mode to use.
returns
this

Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Exceptions thrown
IllegalArgumentException() if the mode is not supported.
Note
Options: "fixed" - will use the value of minimumVectorCountToMutate to select random indexes of this number of indexes. "random" - will use this number as a lower bound on a random selection of indexes between this and the vector length. "all" - will mutate all of the vectors.
lazy val spark: SparkSession

Definition Classes
SparkSessionWrapper
final def synchronized[T0](arg0: ⇒ T0): T0

Definition Classes
AnyRef
def toString(): String

Definition Classes
AnyRef → Any
def totalModels: Int

Definition Classes
Evolution
final val trainSplitMethods: List[String]

Definition Classes
Defaults
def validateCardinality(df: DataFrame, stringFields: List[String], cardinalityLimit: Int = 500, parallelism: Int = 20): ValidatedCategoricalFields

Definition Classes
DataValidation
def validateFieldPresence(df: DataFrame, column: String): Unit

Definition Classes
DataValidation
def validateInputDataframe(df: DataFrame): Unit

Definition Classes
DataValidation
def validateLabelAndFeatures(df: DataFrame, labelCol: String, featureCol: String): Unit

Definition Classes
DataValidation
def validateNumericMapping(standardConfig: Map[String, (Double, Double)], modConfig: Map[String, (Double, Double)]): Unit

Internal method for validating if a numeric mapping that is specified contains any invalid keys
Internal method for validating if a numeric mapping that is specified contains any invalid keys
standardConfig
The static defined numeric mapping for a model type
modConfig
a user-specified mapping override

Attributes
protected[com.databricks.labs.automl.model]
Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Since
0.6.1
Exceptions thrown
IllegalArgumentException if the key is invalid for the model type specified.
def validateStringMapping(standardConfig: Map[String, List[String]], modConfig: Map[String, List[String]]): Unit

Internal method for validating if a string mapping that is specified contains any invalid keys
Internal method for validating if a string mapping that is specified contains any invalid keys
standardConfig
The static defined string mapping for a model type
modConfig
a user-specified mapping override

Attributes
protected[com.databricks.labs.automl.model]
Definition Classes
Evolution
Annotations
@throws( classOf[IllegalArgumentException] )
Since
0.6.1
Exceptions thrown
IllegalArgumentException if the key is invalid for the model type specified.
final def wait(): Unit

Definition Classes
AnyRef
Annotations
@throws( ... )
final def wait(arg0: Long, arg1: Int): Unit

Definition Classes
AnyRef
Annotations
@throws( ... )
final def wait(arg0: Long): Unit

Definition Classes
AnyRef
Annotations
@throws( ... )

Related Doc: package model

class GBTreesTuner extends SparkSessionWrapper with Evolution with Defaults

Instance Constructors

new GBTreesTuner(df: DataFrame, data: Array[TrainSplitReferences], modelSelection: String, isPipeline: Boolean = false)

Value Members

final def !=(arg0: Any): Boolean

final def ##(): Int

final def ==(arg0: Any): Boolean

def _allowableCardinalilties: List[String]

def _allowableCategoricalFilterModes: List[String]

def _allowableDateTimeConversions: List[String]

final val _allowableEvolutionStrategies: List[String]

final val _allowableInitialGenerationIndexMixingModes: List[String]

final val _allowableInitialGenerationModes: List[String]

final val _allowableMlFlowLoggingModes: List[String]

final val _allowableNAFillModes: List[String]

var _cardinalityThreshold: Int

var _continuousEvolutionGeneticMixing: Double

var _continuousEvolutionImprovementThreshold: Int

var _continuousEvolutionMaxIterations: Int

var _continuousEvolutionMutationAggressiveness: Int

var _continuousEvolutionParallelism: Int

var _continuousEvolutionRollingImprovementCount: Int

var _continuousEvolutionStoppingScore: Double

def _covarianceConfigDefaults: CovarianceConfig

def _dataPrepConfigDefaults: DataPrepConfig

var _dataReduce: Double

def _defaultAutoStoppingFlag: Boolean

def _defaultAutoStoppingScore: Double

def _defaultContinuousEvolutionGeneticMixing: Double

def _defaultContinuousEvolutionImprovementThreshold: Int

def _defaultContinuousEvolutionMaxIterations: Int

def _defaultContinuousEvolutionMutationAggressiveness: Int

def _defaultContinuousEvolutionParallelism: Int

def _defaultContinuousEvolutionRollingImprovementCount: Int

def _defaultContinuousEvolutionStoppingScore: Double

def _defaultCovarianceFilterFlag: Boolean

def _defaultDataPrepCachingFlag: Boolean

def _defaultDataPrepParallelism: Int

def _defaultDataReduce: Double

def _defaultDataReductionFactor: Double

def _defaultDateTimeConversionType: String

def _defaultEarlyStoppingFlag: Boolean

def _defaultEarlyStoppingScore: Double

def _defaultEvolutionStrategy: String

def _defaultFeature: String

def _defaultFeatureImportanceCutoffType: String

def _defaultFeatureImportanceCutoffValue: Double

def _defaultFeatureInteractionConfig: FeatureInteractionConfig

def _defaultFeatureInteractionFlag: Boolean

def _defaultFeaturesCol: String

def _defaultFieldsToIgnoreInVector: Array[String]

def _defaultFirstGenArraySeed: Long

def _defaultFirstGenIndexMixingMode: String

def _defaultFirstGenMode: String

def _defaultFirstGenPermutations: Int

def _defaultFirstGenerationConfig: FirstGenerationConfig

def _defaultFirstGenerationGenePool: Int

def _defaultFixedMutationValue: Int

def _defaultGenerationalMutationStrategy: String

def _defaultGeneticMBOCandidateFactor: Int

def _defaultGeneticMBORegressorType: String

def _defaultGeneticMixing: Double

def _defaultHyperSpaceInference: Boolean

def _defaultHyperSpaceInferenceCount: Int

def _defaultHyperSpaceModelCount: Int

def _defaultHyperSpaceModelType: String

def _defaultInitialGenerationMode: String

def _defaultKFold: Int

def _defaultKSampleConfig: KSampleConfig

def _defaultLabel: String

def _defaultLabelCol: String

def _defaultMlFlowArtifactsFlag: Boolean

def _defaultMlFlowLoggingFlag: Boolean

def _defaultModelingFamily: String

def _defaultMutationMagnitudeMode: String

def _defaultNAFillFlag: Boolean

def _defaultNumberOfMutationGenerations: Int

def _defaultNumberOfMutationsPerGeneration: Int