Skip to content
GitLab
Explore
Sign in
Primary navigation
Search or go to…
Project
F
FFmpeg
Manage
Activity
Members
Labels
Plan
Issues
Issue boards
Milestones
Wiki
Code
Merge requests
Repository
Branches
Commits
Tags
Repository graph
Compare revisions
Snippets
Build
Pipelines
Jobs
Pipeline schedules
Artifacts
Deploy
Releases
Container Registry
Model registry
Operate
Environments
Monitor
Incidents
Service Desk
Analyze
Value stream analytics
Contributor analytics
CI/CD analytics
Repository analytics
Model experiments
Help
Help
Support
GitLab documentation
Compare GitLab plans
Community forum
Contribute to GitLab
Provide feedback
Keyboard shortcuts
?
Snippets
Groups
Projects
Show more breadcrumbs
libremedia
Tethys
FFmpeg
Commits
8ff78578
Commit
8ff78578
authored
12 years ago
by
Mans Rullgard
Browse files
Options
Downloads
Patches
Plain Diff
ARM: libavresample: NEON optimised generic fltp to s16 conversion
Signed-off-by:
Mans Rullgard
<
mans@mansr.com
>
parent
d26de339
No related branches found
Branches containing commit
No related tags found
Tags containing commit
No related merge requests found
Changes
2
Hide whitespace changes
Inline
Side-by-side
Showing
2 changed files
libavresample/arm/audio_convert_init.c
+5
-0
5 additions, 0 deletions
libavresample/arm/audio_convert_init.c
libavresample/arm/audio_convert_neon.S
+233
-0
233 additions, 0 deletions
libavresample/arm/audio_convert_neon.S
with
238 additions
and
0 deletions
libavresample/arm/audio_convert_init.c
+
5
−
0
View file @
8ff78578
...
...
@@ -26,6 +26,8 @@
#include
"libavresample/audio_convert.h"
void
ff_conv_flt_to_s16_neon
(
int16_t
*
dst
,
const
float
*
src
,
int
len
);
void
ff_conv_fltp_to_s16_neon
(
int16_t
*
dst
,
float
*
const
*
src
,
int
len
,
int
channels
);
void
ff_conv_fltp_to_s16_2ch_neon
(
int16_t
*
dst
,
float
*
const
*
src
,
int
len
,
int
channels
);
...
...
@@ -37,6 +39,9 @@ av_cold void ff_audio_convert_init_arm(AudioConvert *ac)
ff_audio_convert_set_func
(
ac
,
AV_SAMPLE_FMT_S16
,
AV_SAMPLE_FMT_FLT
,
0
,
16
,
8
,
"NEON"
,
ff_conv_flt_to_s16_neon
);
ff_audio_convert_set_func
(
ac
,
AV_SAMPLE_FMT_S16
,
AV_SAMPLE_FMT_FLTP
,
0
,
16
,
8
,
"NEON"
,
ff_conv_fltp_to_s16_neon
);
ff_audio_convert_set_func
(
ac
,
AV_SAMPLE_FMT_S16
,
AV_SAMPLE_FMT_FLTP
,
2
,
16
,
8
,
"NEON"
,
ff_conv_fltp_to_s16_2ch_neon
);
...
...
This diff is collapsed.
Click to expand it.
libavresample/arm/audio_convert_neon.S
+
233
−
0
View file @
8ff78578
...
...
@@ -128,3 +128,236 @@ function ff_conv_fltp_to_s16_2ch_neon, export=1
vst1.16
{
q10
-
q11
},[
r0
,:
128
]!
bx
lr
endfunc
function
ff_conv_fltp_to_s16_neon
,
export
=
1
cmp
r3
,
#
2
itt
lt
ldrlt
r1
,
[
r1
]
blt
ff_conv_flt_to_s16_neon
beq
ff_conv_fltp_to_s16_2ch_neon
push
{
r4
-
r8
,
lr
}
cmp
r3
,
#
4
lsl
r12
,
r3
,
#
1
blt
4
f
@
4
channels
5
:
ldm
r1
!,
{
r4
-
r7
}
mov
lr
,
r2
mov
r8
,
r0
vld1.32
{
q8
},
[
r4
,:
128
]!
vcvt.s32.f32
q8
,
q8
,
#
31
vld1.32
{
q9
},
[
r5
,:
128
]!
vcvt.s32.f32
q9
,
q9
,
#
31
vld1.32
{
q10
},
[
r6
,:
128
]!
vcvt.s32.f32
q10
,
q10
,
#
31
vld1.32
{
q11
},
[
r7
,:
128
]!
vcvt.s32.f32
q11
,
q11
,
#
31
6
:
subs
lr
,
lr
,
#
8
vld1.32
{
q0
},
[
r4
,:
128
]!
vcvt.s32.f32
q0
,
q0
,
#
31
vsri.32
q9
,
q8
,
#
16
vld1.32
{
q1
},
[
r5
,:
128
]!
vcvt.s32.f32
q1
,
q1
,
#
31
vsri.32
q11
,
q10
,
#
16
vld1.32
{
q2
},
[
r6
,:
128
]!
vcvt.s32.f32
q2
,
q2
,
#
31
vzip.32
d18
,
d22
vld1.32
{
q3
},
[
r7
,:
128
]!
vcvt.s32.f32
q3
,
q3
,
#
31
vzip.32
d19
,
d23
vst1.16
{
d18
},
[
r8
],
r12
vsri.32
q1
,
q0
,
#
16
vst1.16
{
d22
},
[
r8
],
r12
vsri.32
q3
,
q2
,
#
16
vst1.16
{
d19
},
[
r8
],
r12
vzip.32
d2
,
d6
vst1.16
{
d23
},
[
r8
],
r12
vzip.32
d3
,
d7
beq
7
f
vld1.32
{
q8
},
[
r4
,:
128
]!
vcvt.s32.f32
q8
,
q8
,
#
31
vst1.16
{
d2
},
[
r8
],
r12
vld1.32
{
q9
},
[
r5
,:
128
]!
vcvt.s32.f32
q9
,
q9
,
#
31
vst1.16
{
d6
},
[
r8
],
r12
vld1.32
{
q10
},
[
r6
,:
128
]!
vcvt.s32.f32
q10
,
q10
,
#
31
vst1.16
{
d3
},
[
r8
],
r12
vld1.32
{
q11
},
[
r7
,:
128
]!
vcvt.s32.f32
q11
,
q11
,
#
31
vst1.16
{
d7
},
[
r8
],
r12
b
6
b
7
:
vst1.16
{
d2
},
[
r8
],
r12
vst1.16
{
d6
},
[
r8
],
r12
vst1.16
{
d3
},
[
r8
],
r12
vst1.16
{
d7
},
[
r8
],
r12
subs
r3
,
r3
,
#
4
it
eq
popeq
{
r4
-
r8
,
pc
}
cmp
r3
,
#
4
add
r0
,
r0
,
#
8
bge
5
b
@
2
channels
4
:
cmp
r3
,
#
2
blt
4
f
ldm
r1
!,
{
r4
-
r5
}
mov
lr
,
r2
mov
r8
,
r0
tst
lr
,
#
8
vld1.32
{
q8
},
[
r4
,:
128
]!
vcvt.s32.f32
q8
,
q8
,
#
31
vld1.32
{
q9
},
[
r5
,:
128
]!
vcvt.s32.f32
q9
,
q9
,
#
31
vld1.32
{
q10
},
[
r4
,:
128
]!
vcvt.s32.f32
q10
,
q10
,
#
31
vld1.32
{
q11
},
[
r5
,:
128
]!
vcvt.s32.f32
q11
,
q11
,
#
31
beq
6
f
subs
lr
,
lr
,
#
8
beq
7
f
vsri.32
d18
,
d16
,
#
16
vsri.32
d19
,
d17
,
#
16
vld1.32
{
q8
},
[
r4
,:
128
]!
vcvt.s32.f32
q8
,
q8
,
#
31
vst1.32
{
d18
[
0
]},
[
r8
],
r12
vsri.32
d22
,
d20
,
#
16
vst1.32
{
d18
[
1
]},
[
r8
],
r12
vsri.32
d23
,
d21
,
#
16
vst1.32
{
d19
[
0
]},
[
r8
],
r12
vst1.32
{
d19
[
1
]},
[
r8
],
r12
vld1.32
{
q9
},
[
r5
,:
128
]!
vcvt.s32.f32
q9
,
q9
,
#
31
vst1.32
{
d22
[
0
]},
[
r8
],
r12
vst1.32
{
d22
[
1
]},
[
r8
],
r12
vld1.32
{
q10
},
[
r4
,:
128
]!
vcvt.s32.f32
q10
,
q10
,
#
31
vst1.32
{
d23
[
0
]},
[
r8
],
r12
vst1.32
{
d23
[
1
]},
[
r8
],
r12
vld1.32
{
q11
},
[
r5
,:
128
]!
vcvt.s32.f32
q11
,
q11
,
#
31
6
:
subs
lr
,
lr
,
#
16
vld1.32
{
q0
},
[
r4
,:
128
]!
vcvt.s32.f32
q0
,
q0
,
#
31
vsri.32
d18
,
d16
,
#
16
vld1.32
{
q1
},
[
r5
,:
128
]!
vcvt.s32.f32
q1
,
q1
,
#
31
vsri.32
d19
,
d17
,
#
16
vld1.32
{
q2
},
[
r4
,:
128
]!
vcvt.s32.f32
q2
,
q2
,
#
31
vld1.32
{
q3
},
[
r5
,:
128
]!
vcvt.s32.f32
q3
,
q3
,
#
31
vst1.32
{
d18
[
0
]},
[
r8
],
r12
vsri.32
d22
,
d20
,
#
16
vst1.32
{
d18
[
1
]},
[
r8
],
r12
vsri.32
d23
,
d21
,
#
16
vst1.32
{
d19
[
0
]},
[
r8
],
r12
vsri.32
d2
,
d0
,
#
16
vst1.32
{
d19
[
1
]},
[
r8
],
r12
vsri.32
d3
,
d1
,
#
16
vst1.32
{
d22
[
0
]},
[
r8
],
r12
vsri.32
d6
,
d4
,
#
16
vst1.32
{
d22
[
1
]},
[
r8
],
r12
vsri.32
d7
,
d5
,
#
16
vst1.32
{
d23
[
0
]},
[
r8
],
r12
vst1.32
{
d23
[
1
]},
[
r8
],
r12
beq
6
f
vld1.32
{
q8
},
[
r4
,:
128
]!
vcvt.s32.f32
q8
,
q8
,
#
31
vst1.32
{
d2
[
0
]},
[
r8
],
r12
vst1.32
{
d2
[
1
]},
[
r8
],
r12
vld1.32
{
q9
},
[
r5
,:
128
]!
vcvt.s32.f32
q9
,
q9
,
#
31
vst1.32
{
d3
[
0
]},
[
r8
],
r12
vst1.32
{
d3
[
1
]},
[
r8
],
r12
vld1.32
{
q10
},
[
r4
,:
128
]!
vcvt.s32.f32
q10
,
q10
,
#
31
vst1.32
{
d6
[
0
]},
[
r8
],
r12
vst1.32
{
d6
[
1
]},
[
r8
],
r12
vld1.32
{
q11
},
[
r5
,:
128
]!
vcvt.s32.f32
q11
,
q11
,
#
31
vst1.32
{
d7
[
0
]},
[
r8
],
r12
vst1.32
{
d7
[
1
]},
[
r8
],
r12
bgt
6
b
6
:
vst1.32
{
d2
[
0
]},
[
r8
],
r12
vst1.32
{
d2
[
1
]},
[
r8
],
r12
vst1.32
{
d3
[
0
]},
[
r8
],
r12
vst1.32
{
d3
[
1
]},
[
r8
],
r12
vst1.32
{
d6
[
0
]},
[
r8
],
r12
vst1.32
{
d6
[
1
]},
[
r8
],
r12
vst1.32
{
d7
[
0
]},
[
r8
],
r12
vst1.32
{
d7
[
1
]},
[
r8
],
r12
b
8
f
7
:
vsri.32
d18
,
d16
,
#
16
vsri.32
d19
,
d17
,
#
16
vst1.32
{
d18
[
0
]},
[
r8
],
r12
vsri.32
d22
,
d20
,
#
16
vst1.32
{
d18
[
1
]},
[
r8
],
r12
vsri.32
d23
,
d21
,
#
16
vst1.32
{
d19
[
0
]},
[
r8
],
r12
vst1.32
{
d19
[
1
]},
[
r8
],
r12
vst1.32
{
d22
[
0
]},
[
r8
],
r12
vst1.32
{
d22
[
1
]},
[
r8
],
r12
vst1.32
{
d23
[
0
]},
[
r8
],
r12
vst1.32
{
d23
[
1
]},
[
r8
],
r12
8
:
subs
r3
,
r3
,
#
2
add
r0
,
r0
,
#
4
it
eq
popeq
{
r4
-
r8
,
pc
}
@
1
channel
4
:
ldr
r4
,
[
r1
]
tst
r2
,
#
8
mov
lr
,
r2
mov
r5
,
r0
vld1.32
{
q0
},
[
r4
,:
128
]!
vcvt.s32.f32
q0
,
q0
,
#
31
vld1.32
{
q1
},
[
r4
,:
128
]!
vcvt.s32.f32
q1
,
q1
,
#
31
bne
8
f
6
:
subs
lr
,
lr
,
#
16
vld1.32
{
q2
},
[
r4
,:
128
]!
vcvt.s32.f32
q2
,
q2
,
#
31
vld1.32
{
q3
},
[
r4
,:
128
]!
vcvt.s32.f32
q3
,
q3
,
#
31
vst1.16
{
d0
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d0
[
3
]},
[
r5
,:
16
],
r12
vst1.16
{
d1
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d1
[
3
]},
[
r5
,:
16
],
r12
vst1.16
{
d2
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d2
[
3
]},
[
r5
,:
16
],
r12
vst1.16
{
d3
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d3
[
3
]},
[
r5
,:
16
],
r12
beq
7
f
vld1.32
{
q0
},
[
r4
,:
128
]!
vcvt.s32.f32
q0
,
q0
,
#
31
vld1.32
{
q1
},
[
r4
,:
128
]!
vcvt.s32.f32
q1
,
q1
,
#
31
7
:
vst1.16
{
d4
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d4
[
3
]},
[
r5
,:
16
],
r12
vst1.16
{
d5
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d5
[
3
]},
[
r5
,:
16
],
r12
vst1.16
{
d6
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d6
[
3
]},
[
r5
,:
16
],
r12
vst1.16
{
d7
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d7
[
3
]},
[
r5
,:
16
],
r12
bgt
6
b
pop
{
r4
-
r8
,
pc
}
8
:
subs
lr
,
lr
,
#
8
vst1.16
{
d0
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d0
[
3
]},
[
r5
,:
16
],
r12
vst1.16
{
d1
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d1
[
3
]},
[
r5
,:
16
],
r12
vst1.16
{
d2
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d2
[
3
]},
[
r5
,:
16
],
r12
vst1.16
{
d3
[
1
]},
[
r5
,:
16
],
r12
vst1.16
{
d3
[
3
]},
[
r5
,:
16
],
r12
it
eq
popeq
{
r4
-
r8
,
pc
}
vld1.32
{
q0
},
[
r4
,:
128
]!
vcvt.s32.f32
q0
,
q0
,
#
31
vld1.32
{
q1
},
[
r4
,:
128
]!
vcvt.s32.f32
q1
,
q1
,
#
31
b
6
b
endfunc
This diff is collapsed.
Click to expand it.
Preview
0%
Loading
Try again
or
attach a new file
.
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Save comment
Cancel
Please
register
or
sign in
to comment