1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
| | #include <math.h>
static inline float fma_fmaf(float x, float y, float z)
{
__asm__ ("vfmadd132ss %1, %2, %0" : "+x" (x) : "x" (y), "x" (z));
return x;
}
static inline float fma4_fmaf(float x, float y, float z)
{
__asm__ ("vfmaddss %3, %2, %1, %0" : "=x" (x) : "x" (x), "x" (y), "x" (z));
return x;
}
#if !__FMA__ && !__FMA4__
#include "x86_64/cpuid.h"
#define fmaf __soft_fmaf
#include "../fmaf.c"
#undef fmaf
#endif
float fmaf(float x, float y, float z)
{
#if __FMA__
return fma_fmaf(x, y, z);
#elif __FMA4__
return fma4_fmaf(x, y, z);
#else
if (__cpuid & X86_FEAT_FMA)
return fma_fmaf(x, y, z);
if (__cpuid & X86_FEAT_FMA4)
return fma4_fmaf(x, y, z);
return __soft_fmaf(x, y, z);
#endif
}
|