次の方法で共有


summary.mlModel: Microsoft R Machine Learning モデルの概要。

Microsoft R Machine Learning モデルの概要。

使用方法

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

論争

object

MicrosoftML 分析から返されるモデル オブジェクト。

top

rxLogisticRegressionrxFastLinear などの線形モデルの概要に表示する上位係数の数を指定します。 バイアスは最初に表示され、その後に他の重みが降順で絶対値で並べ替えられます。 NULLに設定すると、0 以外のすべての係数が表示されます。 それ以外の場合は、最初の top 係数のみが表示されます。

...

summary メソッドに渡される追加の引数。

詳細

元の関数呼び出しに関する概要情報を提供します。
モデルのトレーニングに使用されるデータ セットと、モデル内の係数の統計。

価値

summary 分析オブジェクトのメソッドは、元の関数呼び出しと使用される基になるパラメーターを含むリストを返します。 coef メソッドは、重みの名前付きベクトルを返し、モデル オブジェクトから情報を処理します。

rxLogisticRegression の場合、showTrainingStatsTRUE に設定されている場合、次の統計情報が概要に表示される場合もあります。

training.size

モデルのトレーニングに使用されるデータ セットの行数に関するサイズ。

deviance

モデルの逸脱は、-2 * ln(L)がモデルに組み込まれているすべての特徴を含む観測値を取得する可能性があるLによって与えられる。

null.deviance

null 逸脱は、-2 * ln(L0)が特徴から影響を受けずに観測値を取得する可能性があるL0によって与えられる。 null モデルには、モデルにバイアスがある場合にバイアスが含まれます。

aic

AIC (赤池情報抽出条件) は 2 * k ``+ devianceとして定義されます。ここで、 k はモデルの係数の数です。 バイアスは係数の 1 つとしてカウントされます。 AIC は、モデルの相対的な品質の尺度です。 モデルの適合度 (逸脱度で測定) とモデルの複雑さ (係数の数で測定) のトレードオフを扱います。

coefficients.stats

これは、モデル内の各係数の統計情報を含むデータ フレームです。 各係数について、次の統計情報を示します。 バイアスは最初の行に表示され、残りの係数は p 値の昇順で表示されます。

  • モデルの推定係数値を推定します。
  • Std ErrorThis は、係数の推定値の大きな標本分散の平方根です。
  • z-ScoreWe は帰無仮説に対して検定できます。この仮説は、係数の推定値とその標準誤差の比率を計算することによって係数の有意性に関してゼロにする必要があることを示します。 帰無仮説では、正則化が適用されていない場合、関係する係数の推定値は、平均0の正規分布と、上記で計算された標準誤差と等しい標準偏差に従います。 z スコアは、係数の推定値と係数の標準誤差との比率を出力します。
  • Pr(>|z|)これは、z スコアの両面検定に対応する p 値です。 有意水準に基づいて、有意性指標がp値に付加されます。 F(x)が標準正規分布N(0, 1)の CDF である場合は、P(>|z|) = 2 - ``2 * F(|z|)

作成者

Microsoft Corporation Microsoft Technical Support

こちらも参照ください

rxFastTreesrxFastForestrxFastLinearrxOneClassSvmrxNeuralNetrxLogisticRegression

例示


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]