doxygen/volk__32fc__s32f__x2__power__spectral__density__32f_8h_source.html

 /* -*- c++ -*- */

 /*

  * Copyright 2012, 2014 Free Software Foundation, Inc.

  *

  * This file is part of VOLK

  *

  * SPDX-License-Identifier: LGPL-3.0-or-later

  */


 #ifndef INCLUDED_volk_32fc_s32f_x2_power_spectral_density_32f_a_H

 #define INCLUDED_volk_32fc_s32f_x2_power_spectral_density_32f_a_H


 #include <inttypes.h>

 #include <math.h>

 #include <stdio.h>


 #ifdef LV_HAVE_AVX

 #include <immintrin.h>


 #ifdef LV_HAVE_LIB_SIMDMATH

 #include <simdmath.h>

 #endif /* LV_HAVE_LIB_SIMDMATH */


 static inline void

 volk_32fc_s32f_x2_power_spectral_density_32f_a_avx(float* logPowerOutput,

                                                    const lv_32fc_t* complexFFTInput,

                                                    const float normalizationFactor,

                                                    const float rbw,

                                                    unsigned int num_points)

 {

     const float* inputPtr = (const float*)complexFFTInput;

     float* destPtr = logPowerOutput;

     uint64_t number = 0;

     const float iRBW = 1.0 / rbw;

     const float iNormalizationFactor = 1.0 / normalizationFactor;


 #ifdef LV_HAVE_LIB_SIMDMATH

     __m256 magScalar = _mm256_set1_ps(10.0);

     magScalar = _mm256_div_ps(magScalar, logf4(magScalar));


     __m256 invRBW = _mm256_set1_ps(iRBW);


     __m256 invNormalizationFactor = _mm256_set1_ps(iNormalizationFactor);


     __m256 power;

     __m256 input1, input2;

     const uint64_t eighthPoints = num_points / 8;

     for (; number < eighthPoints; number++) {

         // Load the complex values

         input1 = _mm256_load_ps(inputPtr);

         inputPtr += 8;

         input2 = _mm256_load_ps(inputPtr);

         inputPtr += 8;


         // Apply the normalization factor

         input1 = _mm256_mul_ps(input1, invNormalizationFactor);

         input2 = _mm256_mul_ps(input2, invNormalizationFactor);


         // Multiply each value by itself

         // (r1*r1), (i1*i1), (r2*r2), (i2*i2)

         input1 = _mm256_mul_ps(input1, input1);

         // (r3*r3), (i3*i3), (r4*r4), (i4*i4)

         input2 = _mm256_mul_ps(input2, input2);


         // Horizontal add, to add (r*r) + (i*i) for each complex value

         // (r1*r1)+(i1*i1), (r2*r2) + (i2*i2), (r3*r3)+(i3*i3), (r4*r4)+(i4*i4)

         inputVal1 = _mm256_permute2f128_ps(input1, input2, 0x20);

         inputVal2 = _mm256_permute2f128_ps(input1, input2, 0x31);


         power = _mm256_hadd_ps(inputVal1, inputVal2);


         // Divide by the rbw

         power = _mm256_mul_ps(power, invRBW);


         // Calculate the natural log power

         power = logf4(power);


         // Convert to log10 and multiply by 10.0

         power = _mm256_mul_ps(power, magScalar);


         // Store the floating point results

         _mm256_store_ps(destPtr, power);


         destPtr += 8;

     }


     number = eighthPoints * 8;

 #endif /* LV_HAVE_LIB_SIMDMATH */

     // Calculate the FFT for any remaining points

     for (; number < num_points; number++) {

         // Calculate dBm

         // 50 ohm load assumption

         // 10 * log10 (v^2 / (2 * 50.0 * .001)) = 10 * log10( v^2 * 10)

         // 75 ohm load assumption

         // 10 * log10 (v^2 / (2 * 75.0 * .001)) = 10 * log10( v^2 * 15)


         const float real = *inputPtr++ * iNormalizationFactor;

         const float imag = *inputPtr++ * iNormalizationFactor;


         *destPtr = volk_log2to10factor *

                    log2f_non_ieee((((real * real) + (imag * imag))) * iRBW);

         destPtr++;

     }

 }

 #endif /* LV_HAVE_AVX */


 #ifdef LV_HAVE_SSE3

 #include <pmmintrin.h>


 #ifdef LV_HAVE_LIB_SIMDMATH

 #include <simdmath.h>

 #endif /* LV_HAVE_LIB_SIMDMATH */


 static inline void

 volk_32fc_s32f_x2_power_spectral_density_32f_a_sse3(float* logPowerOutput,

                                                     const lv_32fc_t* complexFFTInput,

                                                     const float normalizationFactor,

                                                     const float rbw,

                                                     unsigned int num_points)

 {

     const float* inputPtr = (const float*)complexFFTInput;

     float* destPtr = logPowerOutput;

     uint64_t number = 0;

     const float iRBW = 1.0 / rbw;

     const float iNormalizationFactor = 1.0 / normalizationFactor;


 #ifdef LV_HAVE_LIB_SIMDMATH

     __m128 magScalar = _mm_set_ps1(10.0);

     magScalar = _mm_div_ps(magScalar, logf4(magScalar));


     __m128 invRBW = _mm_set_ps1(iRBW);


     __m128 invNormalizationFactor = _mm_set_ps1(iNormalizationFactor);


     __m128 power;

     __m128 input1, input2;

     const uint64_t quarterPoints = num_points / 4;

     for (; number < quarterPoints; number++) {

         // Load the complex values

         input1 = _mm_load_ps(inputPtr);

         inputPtr += 4;

         input2 = _mm_load_ps(inputPtr);

         inputPtr += 4;


         // Apply the normalization factor

         input1 = _mm_mul_ps(input1, invNormalizationFactor);

         input2 = _mm_mul_ps(input2, invNormalizationFactor);


         // Multiply each value by itself

         // (r1*r1), (i1*i1), (r2*r2), (i2*i2)

         input1 = _mm_mul_ps(input1, input1);

         // (r3*r3), (i3*i3), (r4*r4), (i4*i4)

         input2 = _mm_mul_ps(input2, input2);


         // Horizontal add, to add (r*r) + (i*i) for each complex value

         // (r1*r1)+(i1*i1), (r2*r2) + (i2*i2), (r3*r3)+(i3*i3), (r4*r4)+(i4*i4)

         power = _mm_hadd_ps(input1, input2);


         // Divide by the rbw

         power = _mm_mul_ps(power, invRBW);


         // Calculate the natural log power

         power = logf4(power);


         // Convert to log10 and multiply by 10.0

         power = _mm_mul_ps(power, magScalar);


         // Store the floating point results

         _mm_store_ps(destPtr, power);


         destPtr += 4;

     }


     number = quarterPoints * 4;

 #endif /* LV_HAVE_LIB_SIMDMATH */

     // Calculate the FFT for any remaining points

     for (; number < num_points; number++) {

         // Calculate dBm

         // 50 ohm load assumption

         // 10 * log10 (v^2 / (2 * 50.0 * .001)) = 10 * log10( v^2 * 10)

         // 75 ohm load assumption

         // 10 * log10 (v^2 / (2 * 75.0 * .001)) = 10 * log10( v^2 * 15)


         const float real = *inputPtr++ * iNormalizationFactor;

         const float imag = *inputPtr++ * iNormalizationFactor;


         *destPtr = volk_log2to10factor *

                    log2f_non_ieee((((real * real) + (imag * imag))) * iRBW);

         destPtr++;

     }

 }

 #endif /* LV_HAVE_SSE3 */


 #ifdef LV_HAVE_GENERIC


 static inline void

 volk_32fc_s32f_x2_power_spectral_density_32f_generic(float* logPowerOutput,

                                                      const lv_32fc_t* complexFFTInput,

                                                      const float normalizationFactor,

                                                      const float rbw,

                                                      unsigned int num_points)

 {

     if (rbw != 1.0)

         volk_32fc_s32f_power_spectrum_32f(

             logPowerOutput, complexFFTInput, normalizationFactor * sqrt(rbw), num_points);

     else

         volk_32fc_s32f_power_spectrum_32f(

             logPowerOutput, complexFFTInput, normalizationFactor, num_points);

 }


 #endif /* LV_HAVE_GENERIC */


 #endif /* INCLUDED_volk_32fc_s32f_x2_power_spectral_density_32f_a_H */

__m128
float32x4_t __m128
Definition: sse2neon.h:235

_mm_hadd_ps
FORCE_INLINE __m128 _mm_hadd_ps(__m128 a, __m128 b)
Definition: sse2neon.h:6527

_mm_div_ps
FORCE_INLINE __m128 _mm_div_ps(__m128 a, __m128 b)
Definition: sse2neon.h:1756

_mm_mul_ps
FORCE_INLINE __m128 _mm_mul_ps(__m128 a, __m128 b)
Definition: sse2neon.h:2205

_mm_set_ps1
FORCE_INLINE __m128 _mm_set_ps1(float)
Definition: sse2neon.h:2437

_mm_load_ps
FORCE_INLINE __m128 _mm_load_ps(const float *p)
Definition: sse2neon.h:1858

_mm_store_ps
FORCE_INLINE void _mm_store_ps(float *p, __m128 a)
Definition: sse2neon.h:2704

volk_32fc_s32f_x2_power_spectral_density_32f_generic
static void volk_32fc_s32f_x2_power_spectral_density_32f_generic(float *logPowerOutput, const lv_32fc_t *complexFFTInput, const float normalizationFactor, const float rbw, unsigned int num_points)
Definition: volk_32fc_s32f_x2_power_spectral_density_32f.h:231

volk_32fc_s32f_x2_power_spectral_density_32f_a_avx
static void volk_32fc_s32f_x2_power_spectral_density_32f_a_avx(float *logPowerOutput, const lv_32fc_t *complexFFTInput, const float normalizationFactor, const float rbw, unsigned int num_points)
Definition: volk_32fc_s32f_x2_power_spectral_density_32f.h:57

volk_32fc_s32f_x2_power_spectral_density_32f_a_sse3
static void volk_32fc_s32f_x2_power_spectral_density_32f_a_sse3(float *logPowerOutput, const lv_32fc_t *complexFFTInput, const float normalizationFactor, const float rbw, unsigned int num_points)
Definition: volk_32fc_s32f_x2_power_spectral_density_32f.h:148

volk_log2to10factor
#define volk_log2to10factor
Definition: volk_common.h:169

log2f_non_ieee
static float log2f_non_ieee(float f)
Definition: volk_common.h:159

lv_32fc_t
float complex lv_32fc_t
Definition: volk_complex.h:74