次の方法で共有


_mm_permute2_pd

更新 : 2011 年 3 月

Visual Studio 2010 SP1 が必要です。

Microsoft 固有の仕様 →

XOP XMM 命令 vpermil2pd を生成して、1 つ目と 2 つ目のソースから浮動小数点値を選択します。ゼロ設定は任意で行います。

__m128d _mm_permute2_pd (
   __m128d src1,
   __m128d src2,
   __m128i selector,
   int control
);

パラメーター

  • [入力] src1
    2 個の 64 ビット浮動小数点値を含む 128 ビットのパラメーター。

  • [入力] src2
    2 個の 64 ビット浮動小数点値を含む 128 ビットのパラメーター。

  • [入力] selector
    2 個の 64 ビット整数セレクター値を含む 128 ビットのパラメーター。

  • [入力] control
    結果の値をゼロに設定するかどうかを決定する方法を制御する 32 ビットの整数パラメーター。

戻り値

2 個の 64 ビット浮動小数点値を含む 128 ビットの結果 r。

結果の各値は、ゼロか、src1 および src2 の 4 個の 64 ビット浮動小数点値から選択された値になります。

必要条件

組み込み

アーキテクチャ

_mm_permute2_pd

XOP

ヘッダー ファイル <intrin.h>

解説

selector の 2 個の各クワドワードによって、結果の対応するクワドワードの値が src1 および src2 の 4 個の 64 ビット浮動小数点値のいずれかから選択されます。 この値は、control の値および selector クワドワードのビット 3 の値に応じて、結果に書き込まれる前にゼロで置換できます。

selector の各クワドワードの場合、2 つ目と 3 つ目の下位ビットによって src1 または src2 の浮動小数点値のいずれかが選択されます。値 0 から 1 により src1[0] から src1[1] が選択され、値 2 から 3 により src2[0] から src2[1] が選択されます。 selector の各クワドワードの最下位ビットは無視されます。

selector の各クワドワードの次のビットは、以下では "一致" ビットと呼んでいます。 selector の各クワドワードの上位 60 ビットは無視されます。

4 つ目のソース control では、結果値を 0 に設定する場合の条件を決定します。 control の値は 0、1、2、または 3 にする必要があります。 control が 0 または 1 の場合は、選択された浮動小数点値がターゲットに書き込まれます。 control が 2 の場合、selector の対応する一致ビットが 0 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 1 であればゼロが書き込まれます。 control が 3 の場合、対応する一致ビットが 1 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 0 であればゼロが書き込まれます。

vpermil2pd 命令は、XOP ファミリの命令の一部です。 この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。 この命令に対するハードウェア サポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 11 をチェックします。 このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。

使用例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128d a, b, d;
    __m128i select;
    int i;
    a.m128d_f64[0] = 0.;
    a.m128d_f64[1] = 1.;
    b.m128d_f64[0] = 2.;
    b.m128d_f64[1] = 3.;
    select.m128i_i64[0] = 2 << 1;
    select.m128i_i64[1] = (1 << 1) + 8; // turn on match bit
    
    d = _mm_permute2_pd(a, b, select, 0); // just select, don't zero
    printf_s("%.3lf %.3lf\n", d.m128d_f64[0], d.m128d_f64[1]);
    d = _mm_permute2_pd(a, b, select, 2); // zero if match is 1
    printf_s("%.3lf %.3lf\n", d.m128d_f64[0], d.m128d_f64[1]);
    d = _mm_permute2_pd(a, b, select, 3); // zero if match is 0
    printf_s("%.3lf %.3lf\n", d.m128d_f64[0], d.m128d_f64[1]);
}
  

参照

参照

__cpuid, __cpuidex

その他の技術情報

_mm256_permute2_pd

_mm_permute2_ps

Visual Studio 2010 SP1 用に追加された XOP 組み込み

履歴の変更

日付

履歴

理由

2011 年 3 月

このコンテンツを追加。

SP1 機能変更