Media
Please find implementation codes for our solutions to artificial bandwidth extension (ABE) at :
https://github.com/bachhavpramod/bandwidth_extension
LATENT REPRESENTATION LEARNING FOR ARTIFICIAL BANDWIDTH EXTENSION USING A CONDITIONAL VARIATIONAL AUTO-ENCODER
P. Bachhav, M. Todisco and N. Evans (accepted in ICASSP 2019)
NB |
Original WB |
CVAE |
SSAE+zs |
PCA |
M1 | M1 | M1 | M1 | M1 |
M2 | M2 | M2 | M2 | M2 |
M3 | M3 | M3 | M3 | M3 |
M4 | M4 | M4 | M4 | M4 |
M5 | M5 | M5 | M5 | M5 |
M6 | M6 | M6 | M6 | M6 |
F1 | F1 | F1 | F1 | F1 |
F2 | F2 | F2 | F2 | F2 |
F3 | F3 | F3 | F3 | F3 |
F4 | F4 | F4 | F4 | F4 |
F5 | F5 | F5 | F5 | F5 |
F6 | F6 | F6 | F6 | F6 |
ARTIFICIAL BANDWIDTH EXTENSION WITH MEMORY INCLUSION USING SEMI-SUPERVISED STACKED AUTO-ENCODERS
P. Bachhav, M. Todisco and N. Evans (INTERSPEECH 2018)
NB |
Original WB |
Arch-2C,tanh LPS |
Arch-2C,tanh LogMFE |
Baseline |
M1 | M1 | M1 | M1 | M1 |
M2 | M2 | M2 | M2 | M2 |
M3 | M3 | M3 | M3 | M3 |
M4 | M4 | M4 | M4 | M4 |
M5 | M5 | M5 | M5 | M5 |
F1 | F1 | F1 | F1 | F1 |
F2 | F2 | F2 | F2 | F2 |
F3 | F3 | F3 | F3 | F3 |
F4 | F4 | F4 | F4 | F4 |
F5 | F5 | F5 | F5 | F5 |
EXPLOITING EXPLICIT MEMORY INCLUSION FOR ARTIFICIAL BANDWIDTH EXTENSION
P. Bachhav, M. Todisco and N. Evans (ICASSP 2018)
NB |
Original WB |
Baseline (B1) |
Proposed (M2) |
A1 | A1 | A1 | A1 |
A2 | A2 | A2 | A2 |
A3 | A3 | A3 | A3 |
A4 | A4 | A4 | A4 |
A5 | A5 | A5 | A5 |
A6 | A6 | A6 | A6 |
A7 | A7 | A7 | A7 |
A8 | A8 | A8 | A8 |
A9 | A9 | A9 | A9 |
A10 | A10 | A10 | A10 |
A11 | A11 | A11 | A11 |
A12 | A12 | A12 | A12 |
A13 | A13 | A13 | A13 |
A14 | A14 | A14 | A14 |
EFFICIENT SUPER-WIDE BANDWIDTH EXTENSION USING LINEAR PREDICTION BASED ANALYSIS-SYNTHESIS
P. Bachhav, M. Todisco and N. Evans (ICASSP 2018)
Databases |
AMR-WB (12.65kbps) |
EVS (13.2kbps) |
Proposed |
EHBE |
CMU Arctic | A1 | A1 | A1 | A1 |
A2 | A2 | A2 | A2 | |
A3 | A3 | A3 | A3 | |
A4 | A4 | A4 | A4 | |
A5 | A5 | A5 | A5 | |
3GPP | A6 | A6 | A6 | A6 |
A7 | A7 | A7 | A7 | |
A8 | A8 | A8 | A8 | |
A9 | A9 | A9 | A9 | |
A10 | A10 | A10 | A10 | |
TSP speech | A11 | A11 | A11 | A11 |
A12 | A12 | A12 | A12 | |
A13 | A13 | A13 | A13 | |
A14 | A14 | A14 | A14 | |
A15 | A15 | A15 | A15 |
Artificial Bandwidth Extention using the Constant Q Transform
P. Bachhav, M. Todisco, M. Mossi, C. Beaugeant and N. Evans (ICASSP 2017)
NB |
Original WB |
OG-OP |
EG-EP (Proposed) |
M1 | M1 | M1 | M1 |
M2 | M2 | M2 | M2 |
M3 | M3 | M3 | M3 |
M4 | M4 | M4 | M4 |
M5 | M5 | M5 | M5 |
F1 | F1 | F1 | F1 |
F2 | F2 | F2 | F2 |
F3 | F3 | F3 | F3 |
F4 | F4 | F4 | F4 |
F5 | F5 | F5 | F5 |
An experimental framework for the derivation of
perceptually-optimal noise suppression functions
A. Daniel, L. Lepauloux, C. Yemdji, N. Evans and C. Beaugeant
(Submitted to ICASSP 2013)
Demonstration video:
Sound samples:
These samples allow for a direct comparison between a conventional Wiener filter and a "perceptually-optimal" filter applying the mean experimental noise suppression curve obtained in this paper. It is recommended to listen to these samples through headphones at a comfortable level to be in the same conditions as the participants.
Clean speech, additive white noise, noisy speech (0 dB SNR).
Utterance #1: Wiener filter, perceptual filter
Utterance #2: Wiener filter, perceptual filter
Utterance #3: Wiener filter, perceptual filter
News
-
9 years 14 weeks ago
-
9 years 40 weeks ago
-
9 years 46 weeks ago
-
9 years 48 weeks ago
-
9 years 48 weeks ago
-
10 years 3 weeks ago
-
10 years 7 weeks ago
-
10 years 14 weeks ago
-
10 years 18 weeks ago
-
10 years 47 weeks ago
-
10 years 49 weeks ago
-
10 years 49 weeks ago
-
11 years 1 week ago
-
11 years 12 weeks ago
-
12 years 8 weeks ago