parent
c356d8be53
commit
d6cb100bc2
|
|
@ -37,7 +37,7 @@ typedef short __v32hi __attribute__ ((__vector_size__ (64)));
|
|||
#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512bw")))
|
||||
|
||||
static __inline __v64qi __DEFAULT_FN_ATTRS
|
||||
_mm512_setzero_qi (void) {
|
||||
_mm512_setzero_qi(void) {
|
||||
return (__v64qi){ 0, 0, 0, 0, 0, 0, 0, 0,
|
||||
0, 0, 0, 0, 0, 0, 0, 0,
|
||||
0, 0, 0, 0, 0, 0, 0, 0,
|
||||
|
|
@ -49,7 +49,7 @@ _mm512_setzero_qi (void) {
|
|||
}
|
||||
|
||||
static __inline __v32hi __DEFAULT_FN_ATTRS
|
||||
_mm512_setzero_hi (void) {
|
||||
_mm512_setzero_hi(void) {
|
||||
return (__v32hi){ 0, 0, 0, 0, 0, 0, 0, 0,
|
||||
0, 0, 0, 0, 0, 0, 0, 0,
|
||||
0, 0, 0, 0, 0, 0, 0, 0,
|
||||
|
|
@ -363,8 +363,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maskz_add_epi8 (__mmask64 __U, __m512i __A, __m512i __B) {
|
||||
return (__m512i) __builtin_ia32_paddb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi)
|
||||
_mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) __U);
|
||||
}
|
||||
|
||||
|
|
@ -385,8 +384,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maskz_sub_epi8 (__mmask64 __U, __m512i __A, __m512i __B) {
|
||||
return (__m512i) __builtin_ia32_psubb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi)
|
||||
_mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) __U);
|
||||
}
|
||||
|
||||
|
|
@ -407,8 +405,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maskz_add_epi16 (__mmask32 __U, __m512i __A, __m512i __B) {
|
||||
return (__m512i) __builtin_ia32_paddw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -429,8 +426,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maskz_sub_epi16 (__mmask32 __U, __m512i __A, __m512i __B) {
|
||||
return (__m512i) __builtin_ia32_psubw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -451,8 +447,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maskz_mullo_epi16 (__mmask32 __U, __m512i __A, __m512i __B) {
|
||||
return (__m512i) __builtin_ia32_pmullw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -476,7 +471,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_abs_epi8 (__m512i __A)
|
||||
{
|
||||
return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -492,7 +487,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maskz_abs_epi8 (__mmask64 __U, __m512i __A)
|
||||
{
|
||||
return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) __U);
|
||||
}
|
||||
|
||||
|
|
@ -500,7 +495,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_abs_epi16 (__m512i __A)
|
||||
{
|
||||
return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -516,7 +511,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maskz_abs_epi16 (__mmask32 __U, __m512i __A)
|
||||
{
|
||||
return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -525,7 +520,7 @@ _mm512_packs_epi32 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_packssdw512_mask ((__v16si) __A,
|
||||
(__v16si) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -553,7 +548,7 @@ _mm512_packs_epi16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_packsswb512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -581,7 +576,7 @@ _mm512_packus_epi32 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_packusdw512_mask ((__v16si) __A,
|
||||
(__v16si) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -609,7 +604,7 @@ _mm512_packus_epi16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_packuswb512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -637,7 +632,7 @@ _mm512_adds_epi8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -656,7 +651,7 @@ _mm512_maskz_adds_epi8 (__mmask64 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) __U);
|
||||
}
|
||||
|
||||
|
|
@ -665,7 +660,7 @@ _mm512_adds_epi16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -684,7 +679,7 @@ _mm512_maskz_adds_epi16 (__mmask32 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -693,7 +688,7 @@ _mm512_adds_epu8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -712,7 +707,7 @@ _mm512_maskz_adds_epu8 (__mmask64 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) __U);
|
||||
}
|
||||
|
||||
|
|
@ -721,7 +716,7 @@ _mm512_adds_epu16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -740,7 +735,7 @@ _mm512_maskz_adds_epu16 (__mmask32 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -749,7 +744,7 @@ _mm512_avg_epu8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pavgb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -777,7 +772,7 @@ _mm512_avg_epu16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pavgw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -805,7 +800,7 @@ _mm512_max_epi8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -833,7 +828,7 @@ _mm512_max_epi16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -861,7 +856,7 @@ _mm512_max_epu8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -889,7 +884,7 @@ _mm512_max_epu16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -917,7 +912,7 @@ _mm512_min_epi8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -945,7 +940,7 @@ _mm512_min_epi16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -973,7 +968,7 @@ _mm512_min_epu8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1001,7 +996,7 @@ _mm512_min_epu16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1029,7 +1024,7 @@ _mm512_shuffle_epi8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pshufb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1048,7 +1043,7 @@ _mm512_maskz_shuffle_epi8 (__mmask64 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pshufb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) __U);
|
||||
}
|
||||
|
||||
|
|
@ -1057,7 +1052,7 @@ _mm512_subs_epi8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1076,7 +1071,7 @@ _mm512_maskz_subs_epi8 (__mmask64 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) __U);
|
||||
}
|
||||
|
||||
|
|
@ -1085,7 +1080,7 @@ _mm512_subs_epi16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1104,7 +1099,7 @@ _mm512_maskz_subs_epi16 (__mmask32 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -1113,7 +1108,7 @@ _mm512_subs_epu8 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1132,7 +1127,7 @@ _mm512_maskz_subs_epu8 (__mmask64 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
|
||||
(__v64qi) __B,
|
||||
(__v64qi) _mm512_setzero_qi (),
|
||||
(__v64qi) _mm512_setzero_qi(),
|
||||
(__mmask64) __U);
|
||||
}
|
||||
|
||||
|
|
@ -1141,7 +1136,7 @@ _mm512_subs_epu16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1160,7 +1155,7 @@ _mm512_maskz_subs_epu16 (__mmask32 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi) _mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -1209,8 +1204,7 @@ _mm512_mulhrs_epi16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1229,8 +1223,7 @@ _mm512_maskz_mulhrs_epi16 (__mmask32 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -1239,8 +1232,7 @@ _mm512_mulhi_epi16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1259,8 +1251,7 @@ _mm512_maskz_mulhi_epi16 (__mmask32 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -1269,8 +1260,7 @@ _mm512_mulhi_epu16 (__m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1289,8 +1279,7 @@ _mm512_maskz_mulhi_epu16 (__mmask32 __U, __m512i __A, __m512i __B)
|
|||
{
|
||||
return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -1298,8 +1287,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maddubs_epi16 (__m512i __X, __m512i __Y) {
|
||||
return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
|
||||
(__v64qi) __Y,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1316,8 +1304,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maskz_maddubs_epi16 (__mmask32 __U, __m512i __X, __m512i __Y) {
|
||||
return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
|
||||
(__v64qi) __Y,
|
||||
(__v32hi)
|
||||
_mm512_setzero_hi (),
|
||||
(__v32hi) _mm512_setzero_hi(),
|
||||
(__mmask32) __U);
|
||||
}
|
||||
|
||||
|
|
@ -1325,8 +1312,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_madd_epi16 (__m512i __A, __m512i __B) {
|
||||
return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v16si)
|
||||
_mm512_setzero_si512 (),
|
||||
(__v16si) _mm512_setzero_si512(),
|
||||
(__mmask16) -1);
|
||||
}
|
||||
|
||||
|
|
@ -1343,8 +1329,7 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS
|
|||
_mm512_maskz_madd_epi16 (__mmask16 __U, __m512i __A, __m512i __B) {
|
||||
return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
|
||||
(__v32hi) __B,
|
||||
(__v16si)
|
||||
_mm512_setzero_si512 (),
|
||||
(__v16si) _mm512_setzero_si512(),
|
||||
(__mmask16) __U);
|
||||
}
|
||||
|
||||
|
|
|
|||
Loading…
Reference in New Issue