次の方法で共有


LocationClosestGranularity クラス

最も近い場所の細分性を定義します。

_cord_count は、重複が削除された後の顧客データの数です。 _cord_limitよりも大きい場合は、_lower_fuzzy_boundaryを使用して大まかなフィルター処理を行います。それ以外の場合は、_upper_fuzzy_boundaryが使用されます。

可能なすべての場所は、2 つの場所の球面距離でランク付けされ、さらに結合を行うために _closest_top_n が選択されます。

さまざまな構成を使用して初期化します。

cord_count dropDuplicates() の後のcustomer_dataの数です。_cord_limitより大きい場合は、_lower_fuzzy_boundaryを使用して大まかなフィルター処理を行います。それ以外の場合は、_upper_fuzzy_boundaryを使用します。 考えられるすべての場所は、2 つの場所の球面距離でランク付けされます。さらに結合するには、_closest_top_nを選択します。

コンストラクター

LocationClosestGranularity(_cord_limit=5, _lower_fuzzy_boundary=2, _upper_fuzzy_boundary=5, _closest_top_n=1)

パラメーター

名前 説明
_cord_limit
int

重複を削除した後の顧客データの数。 既定値は 5 です。

規定値: 5
_lower_fuzzy_boundary
int

フィルター処理の下限。 既定値は 2 です

規定値: 2
_upper_fuzzy_boundary
int

フィルター処理の上限。 既定値は 5 です

規定値: 5
_closest_top_n
int

最も近いものを考慮する上位の一致の数。 既定値は 1 です。 値が大きいほど、時間コストが多くなります。

規定値: 1
_cord_limit
必須

既定値は 5

_lower_fuzzy_boundary
必須

既定値は 2

_upper_fuzzy_boundary
必須

既定値は 5

_closest_top_n
必須

既定値は 1 で、大きいほど時間コストが多くなります。

メソッド

get_log_property

ログ プロパティタプルを取得し、プロパティがない場合は None を取得します。

get_log_property

ログ プロパティタプルを取得し、プロパティがない場合は None を取得します。

get_log_property()