Author: "Hsin-Min Wang" / Publication Type: Conference Materials - Searchworks@Jio Institute Digital Library Search Results

1. A Study On Incorporating Whisper For Robust Speech Assessment.

Author: Ryandhimas E. Zezario, Yu-Wen Chen, Szu-Wei Fu, Yu Tsao 0001, Hsin-Min Wang, and Chiou-Shann Fuh
Published: 2024
Full Text: View/download PDF

2. SpeechCLIP+: Self-Supervised Multi-Task Representation Learning for Speech Via Clip and Speech-Image Data.

Author: Hsuan-Fu Wang, Yi-Jen Shih, Heng-Jui Chang, Layne Berry, Puyuan Peng, Hung-Yi Lee, Hsin-Min Wang, and David Harwath
Published: 2024
Full Text: View/download PDF

3. Multi-Task Pseudo-Label Learning for Non-Intrusive Speech Quality Assessment Model.

Author: Ryandhimas E. Zezario, Bo-Ren Brian Bai, Chiou-Shann Fuh, Hsin-Min Wang, and Yu Tsao 0001
Published: 2024
Full Text: View/download PDF

4. Audio-Visual Mandarin Electrolaryngeal Speech Voice Conversion.

Author: Yung-Lun Chien, Hsin-Hao Chen 0006, Ming-Chi Yen, Shu-Wei Tsai, Hsin-Min Wang, Yu Tsao 0001, and Tai-Shih Chi
Published: 2023
Full Text: View/download PDF

5. A Training and Inference Strategy Using Noisy and Enhanced Speech as Target for Speech Enhancement without Clean Speech.

Author: Li-Wei Chen, Yao-Fei Cheng, Hung-Shin Lee, Yu Tsao 0001, and Hsin-Min Wang
Published: 2023
Full Text: View/download PDF

6. Mandarin Electrolaryngeal Speech Voice Conversion using Cross-domain Features.

Author: Hsin-Hao Chen 0006, Yung-Lun Chien, Ming-Chi Yen, Shu-Wei Tsai, Tai-Shih Chi, Hsin-Min Wang, and Yu Tsao 0001
Published: 2023
Full Text: View/download PDF

7. The Voicemos Challenge 2023: Zero-Shot Subjective Speech Quality Prediction for Multiple Domains.

Author: Erica Cooper, Wen-Chin Huang, Yu Tsao 0001, Hsin-Min Wang, Tomoki Toda, and Junichi Yamagishi
Published: 2023
Full Text: View/download PDF

8. LC4SV: A Denoising Framework Learning to Compensate for Unseen Speaker Verification Models.

Author: Chi-Chang Lee, Hong-Wei Chen, Chu-Song Chen, Hsin-Min Wang, Tsung-Te Liu, and Yu Tsao 0001
Published: 2023
Full Text: View/download PDF

9. MTI-Net: A Multi-Target Speech Intelligibility Prediction Model.

Author: Ryandhimas Edo Zezario, Szu-Wei Fu, Fei Chen 0011, Chiou-Shann Fuh, Hsin-Min Wang, and Yu Tsao 0001
Published: 2022
Full Text: View/download PDF

10. NASTAR: Noise Adaptive Speech Enhancement with Target-Conditional Resampling.

Author: Chi-Chang Lee, Cheng-Hung Hu, Yu-Chen Lin, Chu-Song Chen, Hsin-Min Wang, and Yu Tsao 0001
Published: 2022
Full Text: View/download PDF

11. Disentangling the Impacts of Language and Channel Variability on Speech Separation Networks.

Author: Fan-Lin Wang, Hung-Shin Lee, Yu Tsao 0001, and Hsin-Min Wang
Published: 2022
Full Text: View/download PDF

12. Chain-based Discriminative Autoencoders for Speech Recognition.

Author: Hung-Shin Lee, Pin-Tuan Huang, Yao-Fei Cheng, and Hsin-Min Wang
Published: 2022
Full Text: View/download PDF

13. The VoiceMOS Challenge 2022.

Author: Wen-Chin Huang, Erica Cooper, Yu Tsao 0001, Hsin-Min Wang, Tomoki Toda, and Junichi Yamagishi
Published: 2022
Full Text: View/download PDF

14. MBI-Net: A Non-Intrusive Multi-Branched Speech Intelligibility Prediction Model for Hearing Aids.

Author: Ryandhimas Edo Zezario, Fei Chen 0011, Chiou-Shann Fuh, Hsin-Min Wang, and Yu Tsao 0001
Published: 2022
Full Text: View/download PDF

15. EMGSE: Acoustic/EMG Fusion for Multimodal Speech Enhancement.

Author: Kuan-Chen Wang, Kai-Chun Liu, Hsin-Min Wang, and Yu Tsao 0001
Published: 2022
Full Text: View/download PDF

16. Partially Fake Audio Detection by Self-Attention-Based Fake Span Discovery.

Author: Haibin Wu, Heng-Cheng Kuo, Naijun Zheng, Kuo-Hsuan Hung, Hung-Yi Lee, Yu Tsao 0001, Hsin-Min Wang, and Helen Meng
Published: 2022
Full Text: View/download PDF

17. Speech-enhanced and Noise-aware Networks for Robust Speech Recognition.

Author: Hung-Shin Lee, Pin-Yuan Chen, Yao-Fei Cheng, Yu Tsao 0001, and Hsin-Min Wang
Published: 2022
Full Text: View/download PDF

18. Is Character Trigram Overlapping Ratio Still the Best Similarity Measure for Aligning Sentences in a Paraphrased Corpus?

Author: Aleksandra Smolka, Hsin-Min Wang, Jason S. Chang, and Keh-Yih Su
Published: 2022

19. Chinese Movie Dialogue Question Answering Dataset.

Author: Shang-Bao Luo, Cheng-Chung Fan, Kuan-Yu Chen, Yu Tsao 0001, Hsin-Min Wang, and Keh-Yih Su
Published: 2022

20. D4AM: A General Denoising Framework for Downstream Acoustic Models.

Author: Chi-Chang Lee, Yu Tsao 0001, Hsin-Min Wang, and Chu-Song Chen
Published: 2023

21. Relational Data Selection for Data Augmentation of Speaker-Dependent Multi-Band MelGAN Vocoder.

Author: Yi-Chiao Wu, Cheng-Hung Hu, Hung-Shin Lee, Yu-Huai Peng, Wen-Chin Huang, Yu Tsao 0001, Hsin-Min Wang, and Tomoki Toda
Published: 2021
Full Text: View/download PDF

22. Dual-Path Filter Network: Speaker-Aware Modeling for Speech Separation.

Author: Fan-Lin Wang, Yu-Huai Peng, Hung-Shin Lee, and Hsin-Min Wang
Published: 2021
Full Text: View/download PDF

23. A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker Identity in Dysarthric Voice Conversion.

Author: Wen-Chin Huang, Kazuhiro Kobayashi, Yu-Huai Peng, Ching-Feng Liu, Yu Tsao 0001, Hsin-Min Wang, and Tomoki Toda
Published: 2021
Full Text: View/download PDF

24. AlloST: Low-Resource Speech Translation Without Source Transcription.

Author: Yao-Fei Cheng, Hung-Shin Lee, and Hsin-Min Wang
Published: 2021
Full Text: View/download PDF

25. Speech Enhancement with Zero-Shot Model Selection.

Author: Ryandhimas E. Zezario, Chiou-Shann Fuh, Hsin-Min Wang, and Yu Tsao 0001
Published: 2021
Full Text: View/download PDF

26. Mandarin Electrolaryngeal Speech Voice Conversion with Sequence-to-Sequence Modeling.

Author: Ming-Chi Yen, Wen-Chin Huang, Kazuhiro Kobayashi, Yu-Huai Peng, Shu-Wei Tsai, Yu Tsao 0001, Tomoki Toda, Jyh-Shing Roger Jang, and Hsin-Min Wang
Published: 2021
Full Text: View/download PDF

27. HASA-Net: A Non-Intrusive Hearing-Aid Speech Assessment Network.

Author: Hsin-Tien Chiang, Yi-Chiao Wu, Cheng Yu, Tomoki Toda, Hsin-Min Wang, Yih-Chun Hu, and Yu Tsao 0001
Published: 2021
Full Text: View/download PDF

28. Sequence to General Tree: Knowledge-Guided Geometry Word Problem Solving.

Author: Shih-hung Tsai, Chao-Chun Liang, Hsin-Min Wang, and Keh-Yih Su
Published: 2021
Full Text: View/download PDF

29. Investigation of a Single-Channel Frequency-Domain Speech Enhancement Network to Improve End-to-End Bengali Automatic Speech Recognition Under Unseen Noisy Conditions.

Author: Md Mahbub E. Noor, Yen-Ju Lu, Syu-Siang Wang, Supratip Ghose, Chia-Yu Chang, Ryandhimas E. Zezario, Shafique Ahmed, Wei-Ho Chung, Yu Tsao 0001, and Hsin-Min Wang
Published: 2021
Full Text: View/download PDF

30. Melody Harmonization Using Orderless Nade, Chord Balancing, and Blocked Gibbs Sampling.

Author: Chung-En Sun, Yi-Wei Chen, Hung-Shin Lee, Yen-Hsing Chen, and Hsin-Min Wang
Published: 2021
Full Text: View/download PDF

31. Speech Recognition by Simply Fine-Tuning Bert.

Author: Wen-Chin Huang, Chia-Hua Wu, Shang-Bao Luo, Kuan-Yu Chen, Hsin-Min Wang, and Tomoki Toda
Published: 2021
Full Text: View/download PDF

32. Generation of Speaker Representations Using Heterogeneous Training Batch Assembly.

Author: Yu-Huai Peng, Hung-Shin Lee, Pin-Tuan Huang, and Hsin-Min Wang
Published: 2021

33. Time Alignment using Lip Images for Frame-based Electrolaryngeal Voice Conversion.

Author: Yi-Syuan Liou, Wen-Chin Huang, Ming-Chi Yen, Shu-Wei Tsai, Yu-Huai Peng, Tomoki Toda, Yu Tsao 0001, and Hsin-Min Wang
Published: 2021

34. Improvement of Spatial Ambiguity in Multi-Channel Speech Separation Using Channel Attention.

Author: Qian-Bei Hong, Chung-Hsien Wu 0001, Thanh Binh Nguyen 0013, and Hsin-Min Wang
Published: 2021

35. SurpriseNet: Melody Harmonization Conditioning on User-controlled Surprise Contours.

Author: Yi-Wei Chen, Hung-Shin Lee, Yen-Hsing Chen, and Hsin-Min Wang
Published: 2021

36. MoEVC: A Mixture of Experts Voice Conversion System With Sparse Gating Mechanism for Online Computation Acceleration.

Author: Yu-Tao Chang, Yuan-Hong Yang, Yu-Huai Peng, Syu-Siang Wang, Tai-Shih Chi, Yu Tsao 0001, and Hsin-Min Wang
Published: 2021
Full Text: View/download PDF

37. Mining Commonsense and Domain Knowledge from Math Word Problems.

Author: Shih-hung Tsai, Chao-Chun Liang, Hsin-Min Wang, and Keh-Yih Su
Published: 2021

38. A Flexible and Extensible Framework for Multiple Answer Modes Question Answering.

Author: Cheng-Chung Fan, Chia-Chih Kuo, Shang-Bao Luo, Pei-Jun Liao, Kuang-Yu Chang, Chiao-Wei Hsu, Meng-Tse Wu, Shih-Hong Tsai, Tzu-Man Wu, Aleksandra Smolka, Chao-Chun Liang, Hsin-Min Wang, Kuan-Yu Chen, Yu Tsao 0001, and Keh-Yih Su
Published: 2021

39. SERIL: Noise Adaptive Speech Enhancement Using Regularization-Based Incremental Learning.

Author: Chi-Chang Lee, Yu-Chen Lin, Hsuan-Tien Lin, Hsin-Min Wang, and Yu Tsao 0001
Published: 2020
Full Text: View/download PDF

40. Lite Audio-Visual Speech Enhancement.

Author: Shang-Yi Chuang, Yu Tsao 0001, Chen-Chou Lo, and Hsin-Min Wang
Published: 2020
Full Text: View/download PDF

41. Using Taigi Dramas with Mandarin Chinese Subtitles to Improve Taigi Speech Recognition.

Author: Pin-Yuan Chen, Chia-Hua Wu, Hung-Shin Lee, Shao-Kang Tsao, Ming-Tat Ko, and Hsin-Min Wang
Published: 2020
Full Text: View/download PDF

42. Statistics Pooling Time Delay Neural Network Based on X-Vector for Speaker Verification.

Author: Qian-Bei Hong, Chung-Hsien Wu 0001, Hsin-Min Wang, and Chien-Lin Huang
Published: 2020
Full Text: View/download PDF

43. Self-Supervised Denoising Autoencoder with Linear Regression Decoder for Speech Enhancement.

Author: Ryandhimas E. Zezario, Tassadaq Hussain, Xugang Lu, Hsin-Min Wang, and Yu Tsao 0001
Published: 2020
Full Text: View/download PDF

44. Combining Deep Embeddings of Acoustic and Articulatory Features for Speaker Identification.

Author: Qian-Bei Hong, Chung-Hsien Wu 0001, Hsin-Min Wang, and Chien-Lin Huang
Published: 2020
Full Text: View/download PDF

45. STOI-Net: A Deep Learning based Non-Intrusive Speech Intelligibility Assessment Model.

Author: Ryandhimas E. Zezario, Szu-Wei Fu, Chiou-Shann Fuh, Yu Tsao 0001, and Hsin-Min Wang
Published: 2020

46. Joint Training of Guided Learning and Mean Teacher Models for Sound Event Detection.

Author: Hao Yen, Pin-Jui Ku, Ming-Chi Yen, Hung-Shin Lee, and Hsin-Min Wang
Published: 2020

47. Generalization of Spectrum Differential based Direct Waveform Modification for Voice Conversion.

Author: Wen-Chin Huang, Yi-Chiao Wu, Kazuhiro Kobayashi, Yu-Huai Peng, Hsin-Te Hwang, Patrick Lumban Tobing, Yu Tsao 0001, Hsin-Min Wang, and Tomoki Toda
Published: 2019
Full Text: View/download PDF

48. Specialized Speech Enhancement Model Selection Based on Learned Non-Intrusive Quality Assessment Metric.

Author: Ryandhimas E. Zezario, Szu-Wei Fu, Xugang Lu, Hsin-Min Wang, and Yu Tsao 0001
Published: 2019
Full Text: View/download PDF

49. Investigation of F0 Conditioning and Fully Convolutional Networks in Variational Autoencoder Based Voice Conversion.

Author: Wen-Chin Huang, Yi-Chiao Wu, Chen-Chou Lo, Patrick Lumban Tobing, Tomoki Hayashi, Kazuhiro Kobayashi, Tomoki Toda, Yu Tsao 0001, and Hsin-Min Wang
Published: 2019
Full Text: View/download PDF

50. MOSNet: Deep Learning-Based Objective Assessment for Voice Conversion.

Author: Chen-Chou Lo, Szu-Wei Fu, Wen-Chin Huang, Xin Wang 0037, Junichi Yamagishi, Yu Tsao 0001, and Hsin-Min Wang
Published: 2019
Full Text: View/download PDF

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Topic

Publication Year Range

Language

Publication Type

Journal

Database

Publisher

292 results on '"Hsin-Min Wang"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources