Microsoft R Machine Learning モデルの概要。
使用方法
## S3 method for class `mlModel':
summary (object, top = 20, ...)
論争
object
MicrosoftML 分析から返されるモデル オブジェクト。
top
rxLogisticRegression や rxFastLinear などの線形モデルの概要に表示する上位係数の数を指定します。 バイアスは最初に表示され、その後に他の重みが降順で絶対値で並べ替えられます。
NULL
に設定すると、0 以外のすべての係数が表示されます。 それ以外の場合は、最初の top
係数のみが表示されます。
...
summary メソッドに渡される追加の引数。
詳細
元の関数呼び出しに関する概要情報を提供します。
モデルのトレーニングに使用されるデータ セットと、モデル内の係数の統計。
価値
summary
分析オブジェクトのメソッドは、元の関数呼び出しと使用される基になるパラメーターを含むリストを返します。
coef
メソッドは、重みの名前付きベクトルを返し、モデル オブジェクトから情報を処理します。
rxLogisticRegression の場合、showTrainingStats
が TRUE
に設定されている場合、次の統計情報が概要に表示される場合もあります。
training.size
モデルのトレーニングに使用されるデータ セットの行数に関するサイズ。
deviance
モデルの逸脱は、-2 * ln(L)
がモデルに組み込まれているすべての特徴を含む観測値を取得する可能性があるL
によって与えられる。
null.deviance
null 逸脱は、-2 * ln(L0)
が特徴から影響を受けずに観測値を取得する可能性があるL0
によって与えられる。 null モデルには、モデルにバイアスがある場合にバイアスが含まれます。
aic
AIC (赤池情報抽出条件) は 2 * k ``+ deviance
として定義されます。ここで、 k
はモデルの係数の数です。 バイアスは係数の 1 つとしてカウントされます。 AIC は、モデルの相対的な品質の尺度です。 モデルの適合度 (逸脱度で測定) とモデルの複雑さ (係数の数で測定) のトレードオフを扱います。
coefficients.stats
これは、モデル内の各係数の統計情報を含むデータ フレームです。 各係数について、次の統計情報を示します。 バイアスは最初の行に表示され、残りの係数は p 値の昇順で表示されます。
- モデルの推定係数値を推定します。
- Std ErrorThis は、係数の推定値の大きな標本分散の平方根です。
- z-ScoreWe は帰無仮説に対して検定できます。この仮説は、係数の推定値とその標準誤差の比率を計算することによって係数の有意性に関してゼロにする必要があることを示します。 帰無仮説では、正則化が適用されていない場合、関係する係数の推定値は、平均0の正規分布と、上記で計算された標準誤差と等しい標準偏差に従います。 z スコアは、係数の推定値と係数の標準誤差との比率を出力します。
- Pr(>|z|)これは、z スコアの両面検定に対応する p 値です。 有意水準に基づいて、有意性指標がp値に付加されます。
F(x)
が標準正規分布N(0, 1)
の CDF である場合は、P(>|z|) = 2 - ``2 * F(|z|)
。
作成者
Microsoft Corporation Microsoft Technical Support
こちらも参照ください
rxFastTrees、 rxFastForest、 rxFastLinear、 rxOneClassSvm、 rxNeuralNet、 rxLogisticRegression。
例示
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]