doxygen/volk__16ic__convert__32fc_8h_source.html

 /* -*- c++ -*- */

 /*

  * Copyright 2016 Free Software Foundation, Inc.

  *

  * This file is part of VOLK

  *

  * SPDX-License-Identifier: LGPL-3.0-or-later

  */


 #ifndef INCLUDED_volk_16ic_convert_32fc_a_H

 #define INCLUDED_volk_16ic_convert_32fc_a_H


 #include <volk/volk_complex.h>


 #ifdef LV_HAVE_AVX2

 #include <immintrin.h>


 static inline void volk_16ic_convert_32fc_a_avx2(lv_32fc_t* outputVector,

                                                  const lv_16sc_t* inputVector,

                                                  unsigned int num_points)

 {

     const unsigned int avx_iters = num_points / 8;

     unsigned int number = 0;

     const int16_t* complexVectorPtr = (int16_t*)inputVector;

     float* outputVectorPtr = (float*)outputVector;

     __m256 outVal;

     __m256i outValInt;

     __m128i cplxValue;


     for (number = 0; number < avx_iters; number++) {

         cplxValue = _mm_load_si128((__m128i*)complexVectorPtr);

         complexVectorPtr += 8;


         outValInt = _mm256_cvtepi16_epi32(cplxValue);

         outVal = _mm256_cvtepi32_ps(outValInt);

         _mm256_store_ps((float*)outputVectorPtr, outVal);


         outputVectorPtr += 8;

     }


     number = avx_iters * 8;

     for (; number < num_points * 2; number++) {

         *outputVectorPtr++ = (float)*complexVectorPtr++;

     }

 }


 #endif /* LV_HAVE_AVX2 */


 #ifdef LV_HAVE_GENERIC


 static inline void volk_16ic_convert_32fc_generic(lv_32fc_t* outputVector,

                                                   const lv_16sc_t* inputVector,

                                                   unsigned int num_points)

 {

     unsigned int i;

     for (i = 0; i < num_points; i++) {

         outputVector[i] =

             lv_cmake((float)lv_creal(inputVector[i]), (float)lv_cimag(inputVector[i]));

     }

 }


 #endif /* LV_HAVE_GENERIC */


 #ifdef LV_HAVE_SSE2

 #include <emmintrin.h>


 static inline void volk_16ic_convert_32fc_a_sse2(lv_32fc_t* outputVector,

                                                  const lv_16sc_t* inputVector,

                                                  unsigned int num_points)

 {

     const unsigned int sse_iters = num_points / 2;


     const lv_16sc_t* _in = inputVector;

     lv_32fc_t* _out = outputVector;

     __m128 a;

     unsigned int number;


     for (number = 0; number < sse_iters; number++) {

         a = _mm_set_ps(

             (float)(lv_cimag(_in[1])),

             (float)(lv_creal(_in[1])),

             (float)(lv_cimag(_in[0])),

             (float)(lv_creal(

                 _in[0]))); // //load (2 byte imag, 2 byte real) x 2 into 128 bits reg

         _mm_store_ps((float*)_out, a);

         _in += 2;

         _out += 2;

     }

     if (num_points & 1) {

         *_out++ = lv_cmake((float)lv_creal(*_in), (float)lv_cimag(*_in));

         _in++;

     }

 }


 #endif /* LV_HAVE_SSE2 */


 #ifdef LV_HAVE_AVX

 #include <immintrin.h>


 static inline void volk_16ic_convert_32fc_a_avx(lv_32fc_t* outputVector,

                                                 const lv_16sc_t* inputVector,

                                                 unsigned int num_points)

 {

     const unsigned int sse_iters = num_points / 4;


     const lv_16sc_t* _in = inputVector;

     lv_32fc_t* _out = outputVector;

     __m256 a;

     unsigned int i, number;


     for (number = 0; number < sse_iters; number++) {

         a = _mm256_set_ps(

             (float)(lv_cimag(_in[3])),

             (float)(lv_creal(_in[3])),

             (float)(lv_cimag(_in[2])),

             (float)(lv_creal(_in[2])),

             (float)(lv_cimag(_in[1])),

             (float)(lv_creal(_in[1])),

             (float)(lv_cimag(_in[0])),

             (float)(lv_creal(

                 _in[0]))); // //load (2 byte imag, 2 byte real) x 2 into 128 bits reg

         _mm256_store_ps((float*)_out, a);

         _in += 4;

         _out += 4;

     }


     for (i = 0; i < (num_points % 4); ++i) {

         *_out++ = lv_cmake((float)lv_creal(*_in), (float)lv_cimag(*_in));

         _in++;

     }

 }


 #endif /* LV_HAVE_AVX */


 #ifdef LV_HAVE_NEON

 #include <arm_neon.h>


 static inline void volk_16ic_convert_32fc_neon(lv_32fc_t* outputVector,

                                                const lv_16sc_t* inputVector,

                                                unsigned int num_points)

 {

     const unsigned int sse_iters = num_points / 2;


     const lv_16sc_t* _in = inputVector;

     lv_32fc_t* _out = outputVector;


     int16x4_t a16x4;

     int32x4_t a32x4;

     float32x4_t f32x4;

     unsigned int i, number;


     for (number = 0; number < sse_iters; number++) {

         a16x4 = vld1_s16((const int16_t*)_in);

         __VOLK_PREFETCH(_in + 4);

         a32x4 = vmovl_s16(a16x4);

         f32x4 = vcvtq_f32_s32(a32x4);

         vst1q_f32((float32_t*)_out, f32x4);

         _in += 2;

         _out += 2;

     }

     for (i = 0; i < (num_points % 2); ++i) {

         *_out++ = lv_cmake((float)lv_creal(*_in), (float)lv_cimag(*_in));

         _in++;

     }

 }

 #endif /* LV_HAVE_NEON */


 #endif /* INCLUDED_volk_32fc_convert_16ic_a_H */


 #ifndef INCLUDED_volk_16ic_convert_32fc_u_H

 #define INCLUDED_volk_16ic_convert_32fc_u_H


 #include <volk/volk_complex.h>


 #ifdef LV_HAVE_AVX2

 #include <immintrin.h>


 static inline void volk_16ic_convert_32fc_u_avx2(lv_32fc_t* outputVector,

                                                  const lv_16sc_t* inputVector,

                                                  unsigned int num_points)

 {

     const unsigned int avx_iters = num_points / 8;

     unsigned int number = 0;

     const int16_t* complexVectorPtr = (int16_t*)inputVector;

     float* outputVectorPtr = (float*)outputVector;

     __m256 outVal;

     __m256i outValInt;

     __m128i cplxValue;


     for (number = 0; number < avx_iters; number++) {

         cplxValue = _mm_loadu_si128((__m128i*)complexVectorPtr);

         complexVectorPtr += 8;


         outValInt = _mm256_cvtepi16_epi32(cplxValue);

         outVal = _mm256_cvtepi32_ps(outValInt);

         _mm256_storeu_ps((float*)outputVectorPtr, outVal);


         outputVectorPtr += 8;

     }


     number = avx_iters * 8;

     for (; number < num_points * 2; number++) {

         *outputVectorPtr++ = (float)*complexVectorPtr++;

     }

 }


 #endif /* LV_HAVE_AVX2 */


 #ifdef LV_HAVE_SSE2

 #include <emmintrin.h>


 static inline void volk_16ic_convert_32fc_u_sse2(lv_32fc_t* outputVector,

                                                  const lv_16sc_t* inputVector,

                                                  unsigned int num_points)

 {

     const unsigned int sse_iters = num_points / 2;


     const lv_16sc_t* _in = inputVector;

     lv_32fc_t* _out = outputVector;

     __m128 a;

     unsigned int number;


     for (number = 0; number < sse_iters; number++) {

         a = _mm_set_ps(

             (float)(lv_cimag(_in[1])),

             (float)(lv_creal(_in[1])),

             (float)(lv_cimag(_in[0])),

             (float)(lv_creal(

                 _in[0]))); // //load (2 byte imag, 2 byte real) x 2 into 128 bits reg

         _mm_storeu_ps((float*)_out, a);

         _in += 2;

         _out += 2;

     }

     if (num_points & 1) {

         *_out++ = lv_cmake((float)lv_creal(*_in), (float)lv_cimag(*_in));

         _in++;

     }

 }


 #endif /* LV_HAVE_SSE2 */


 #ifdef LV_HAVE_AVX

 #include <immintrin.h>


 static inline void volk_16ic_convert_32fc_u_avx(lv_32fc_t* outputVector,

                                                 const lv_16sc_t* inputVector,

                                                 unsigned int num_points)

 {

     const unsigned int sse_iters = num_points / 4;


     const lv_16sc_t* _in = inputVector;

     lv_32fc_t* _out = outputVector;

     __m256 a;

     unsigned int i, number;


     for (number = 0; number < sse_iters; number++) {

         a = _mm256_set_ps(

             (float)(lv_cimag(_in[3])),

             (float)(lv_creal(_in[3])),

             (float)(lv_cimag(_in[2])),

             (float)(lv_creal(_in[2])),

             (float)(lv_cimag(_in[1])),

             (float)(lv_creal(_in[1])),

             (float)(lv_cimag(_in[0])),

             (float)(lv_creal(

                 _in[0]))); // //load (2 byte imag, 2 byte real) x 2 into 128 bits reg

         _mm256_storeu_ps((float*)_out, a);

         _in += 4;

         _out += 4;

     }


     for (i = 0; i < (num_points % 4); ++i) {

         *_out++ = lv_cmake((float)lv_creal(*_in), (float)lv_cimag(*_in));

         _in++;

     }

 }


 #endif /* LV_HAVE_AVX */

 #endif /* INCLUDED_volk_32fc_convert_16ic_u_H */

__m128
float32x4_t __m128
Definition: sse2neon.h:235

_mm_loadu_si128
FORCE_INLINE __m128i _mm_loadu_si128(const __m128i *p)
Definition: sse2neon.h:4570

_mm_set_ps
FORCE_INLINE __m128 _mm_set_ps(float w, float z, float y, float x)
Definition: sse2neon.h:2429

_mm_storeu_ps
FORCE_INLINE void _mm_storeu_ps(float *p, __m128 a)
Definition: sse2neon.h:2787

_mm_load_si128
FORCE_INLINE __m128i _mm_load_si128(const __m128i *p)
Definition: sse2neon.h:4471

__m128i
int64x2_t __m128i
Definition: sse2neon.h:244

_mm_store_ps
FORCE_INLINE void _mm_store_ps(float *p, __m128 a)
Definition: sse2neon.h:2704

volk_16ic_convert_32fc_generic
static void volk_16ic_convert_32fc_generic(lv_32fc_t *outputVector, const lv_16sc_t *inputVector, unsigned int num_points)
Definition: volk_16ic_convert_32fc.h:86

volk_16ic_convert_32fc_u_avx
static void volk_16ic_convert_32fc_u_avx(lv_32fc_t *outputVector, const lv_16sc_t *inputVector, unsigned int num_points)
Definition: volk_16ic_convert_32fc.h:284

volk_16ic_convert_32fc_a_avx
static void volk_16ic_convert_32fc_a_avx(lv_32fc_t *outputVector, const lv_16sc_t *inputVector, unsigned int num_points)
Definition: volk_16ic_convert_32fc.h:136

volk_16ic_convert_32fc_u_sse2
static void volk_16ic_convert_32fc_u_sse2(lv_32fc_t *outputVector, const lv_16sc_t *inputVector, unsigned int num_points)
Definition: volk_16ic_convert_32fc.h:250

volk_16ic_convert_32fc_neon
static void volk_16ic_convert_32fc_neon(lv_32fc_t *outputVector, const lv_16sc_t *inputVector, unsigned int num_points)
Definition: volk_16ic_convert_32fc.h:175

volk_16ic_convert_32fc_a_sse2
static void volk_16ic_convert_32fc_a_sse2(lv_32fc_t *outputVector, const lv_16sc_t *inputVector, unsigned int num_points)
Definition: volk_16ic_convert_32fc.h:103

__VOLK_PREFETCH
#define __VOLK_PREFETCH(addr)
Definition: volk_common.h:71

volk_complex.h

lv_cimag
#define lv_cimag(x)
Definition: volk_complex.h:98

lv_cmake
#define lv_cmake(r, i)
Definition: volk_complex.h:77

lv_creal
#define lv_creal(x)
Definition: volk_complex.h:96

lv_32fc_t
float complex lv_32fc_t
Definition: volk_complex.h:74

lv_16sc_t
short complex lv_16sc_t
Definition: volk_complex.h:71

i
for i
Definition: volk_config_fixed.tmpl.h:13