Author: "Shiliang Zhang" - Searchworks@Jio Institute Digital Library Search Results

51. CASA-ASR: Context-Aware Speaker-Attributed ASR.

Author: Mohan Shi, Zhihao Du, Qian Chen 0003, Fan Yu, Yangze Li, Shiliang Zhang, Jie Zhang 0042, and Li-Rong Dai 0001
Published: 2023
Full Text: View/download PDF

52. MMSpeech: Multi-modal Multi-task Encoder-Decoder Pre-training for speech recognition.

Author: Xiaohuan Zhou, Jiaming Wang, Zeyu Cui, Shiliang Zhang, Zhijie Yan, Jingren Zhou, and Chang Zhou
Published: 2023
Full Text: View/download PDF

53. Accurate and Reliable Confidence Estimation Based on Non-Autoregressive End-to-End Speech Recognition System.

Author: Xian Shi, Haoneng Luo, Zhifu Gao, Shiliang Zhang, and Zhijie Yan
Published: 2023
Full Text: View/download PDF

54. BAT: Boundary aware transducer for memory-efficient and low-latency ASR.

Author: Keyu An, Xian Shi, and Shiliang Zhang
Published: 2023
Full Text: View/download PDF

55. Evolved Part Masking for Self-Supervised Learning.

Author: Zhanzhou Feng and Shiliang Zhang
Published: 2023
Full Text: View/download PDF

56. Sa-Paraformer: Non-Autoregressive End-To-End Speaker-Attributed ASR.

Author: Yangze Li, Fan Yu, Yuhao Liang, Pengcheng Guo, Mohan Shi, Zhihao Du, Shiliang Zhang, and Lei Xie 0001
Published: 2023
Full Text: View/download PDF

57. The Second Multi-Channel Multi-Party Meeting Transcription Challenge (M2MeT 2.0): A Benchmark for Speaker-Attributed ASR.

Author: Yuhao Liang, Mohan Shi, Fan Yu, Yangze Li, Shiliang Zhang, Zhihao Du, Qian Chen 0003, Lei Xie 0001, Yanmin Qian, Jian Wu 0027, Zhuo Chen 0006, Kong Aik Lee, Zhijie Yan, and Hui Bu
Published: 2023
Full Text: View/download PDF

58. Recognizing High-Speed Moving Objects with Spike Camera.

Author: Junwei Zhao, Jianming Ye, Shiliang Zhang, Zhaofei Yu, and Tiejun Huang 0001
Published: 2023
Full Text: View/download PDF

59. TOLD: a Novel Two-Stage Overlap-Aware Framework for Speaker Diarization.

Author: Jiaming Wang, Zhihao Du, and Shiliang Zhang
Published: 2023
Full Text: View/download PDF

60. Speech and Noise Dual-Stream Spectrogram Refine Network With Speech Distortion Loss For Robust Speech Recognition.

Author: Haoyu Lu, Nan Li, Tongtong Song, Longbiao Wang, Jianwu Dang 0001, Xiaobao Wang, and Shiliang Zhang
Published: 2023
Full Text: View/download PDF

61. A Comparative Study on Multichannel Speaker-Attributed Automatic Speech Recognition in Multi-party Meetings.

Author: Mohan Shi, Jie Zhang 0042, Zhihao Du, Fan Yu, Qian Chen 0003, Shiliang Zhang, and Li-Rong Dai 0001
Published: 2023
Full Text: View/download PDF

62. HumVis: Human-Centric Visual Analysis System.

Author: Dongkai Wang, Shiliang Zhang, Yaowei Wang 0001, Yonghong Tian 0001, Tiejun Huang 0001, and Wen Gao 0001
Published: 2023
Full Text: View/download PDF

63. Speaker Overlap-aware Neural Diarization for Multi-party Meeting Analysis.

Author: Zhihao Du, Shiliang Zhang, Siqi Zheng, and Zhi-Jie Yan
Published: 2022
Full Text: View/download PDF

64. A Comparative Study on Speaker-attributed Automatic Speech Recognition in Multi-party Meetings.

Author: Fan Yu, Zhihao Du, Shiliang Zhang, Yuxiao Lin, and Lei Xie 0001
Published: 2022
Full Text: View/download PDF

65. Paraformer: Fast and Accurate Parallel Transformer for Non-autoregressive End-to-End Speech Recognition.

Author: Zhifu Gao, Shiliang Zhang, Ian McLoughlin 0001, and Zhijie Yan
Published: 2022
Full Text: View/download PDF

66. Contextual Instance Decoupling for Robust Multi-Person Pose Estimation.

Author: Dongkai Wang and Shiliang Zhang
Published: 2022
Full Text: View/download PDF

67. SpikingSIM: A Bio-Inspired Spiking Simulator.

Author: Junwei Zhao, Shiliang Zhang, Lei Ma 0008, Zhaofei Yu, and Tiejun Huang 0001
Published: 2022
Full Text: View/download PDF

68. MDERank: A Masked Document Embedding Rank Approach for Unsupervised Keyphrase Extraction.

Author: Linhan Zhang, Qian Chen 0003, Wen Wang, Chong Deng, Shiliang Zhang, Bing Li 0002, Wei Wang 0011, and Xin Cao 0001
Published: 2022
Full Text: View/download PDF

69. M2Met: The Icassp 2022 Multi-Channel Multi-Party Meeting Transcription Challenge.

Author: Fan Yu, Shiliang Zhang, Yihui Fu, Lei Xie 0001, Siqi Zheng, Zhihao Du, Weilong Huang, Pengcheng Guo, Zhijie Yan, Bin Ma 0001, Xin Xu, and Hui Bu
Published: 2022
Full Text: View/download PDF

70. Summary on the ICASSP 2022 Multi-Channel Multi-Party Meeting Transcription Grand Challenge.

Author: Fan Yu, Shiliang Zhang, Pengcheng Guo, Yihui Fu, Zhihao Du, Siqi Zheng, Weilong Huang, Lei Xie 0001, Zheng-Hua Tan, DeLiang Wang, Yanmin Qian, Kong Aik Lee, Zhijie Yan, Bin Ma 0001, Xin Xu, and Hui Bu
Published: 2022
Full Text: View/download PDF

71. Modeling The Detection Capability Of High-Speed Spiking Cameras.

Author: Junwei Zhao, Zhaofei Yu, Lei Ma 0008, Ziluo Ding, Shiliang Zhang, Yonghong Tian 0001, and Tiejun Huang 0001
Published: 2022
Full Text: View/download PDF

72. Prosospeech: Enhancing Prosody with Quantized Vector Pre-Training in Text-To-Speech.

Author: Yi Ren 0006, Ming Lei, Zhiying Huang, Shiliang Zhang, Qian Chen 0003, Zhijie Yan, and Zhou Zhao
Published: 2022
Full Text: View/download PDF

73. Transformer-Based Domain Adaptation for Event Data Classification.

Author: Junwei Zhao, Shiliang Zhang, and Tiejun Huang 0001
Published: 2022
Full Text: View/download PDF

74. MFCCA:Multi-Frame Cross-Channel Attention for Multi-Speaker ASR in Multi-Party Meeting Scenario.

Author: Fan Yu, Shiliang Zhang, Pengcheng Guo, Yuhao Liang, Zhihao Du, Yuxiao Lin, and Lei Xie 0001
Published: 2022
Full Text: View/download PDF

75. Asymmetric Label Propagation for Video Object Segmentation.

Author: Zhen Chen, Ming Yang 0007, and Shiliang Zhang
Published: 2022
Full Text: View/download PDF

76. Separate-to-Recognize: Joint Multi-target Speech Separation and Speech Recognition for Speaker-attributed ASR.

Author: Yuxiao Lin, Zhihao Du, Shiliang Zhang, Fan Yu, Zhou Zhao, and Fei Wu 0001
Published: 2022
Full Text: View/download PDF

77. Towards Language-universal Mandarin-English Speech Recognition with Unsupervised Label Synchronous Adaptation.

Author: Song Li, Haoneng Luo, Wenxuan Hu, Yuan Liu, Shiliang Zhang, Lin Li 0032, and Qingyang Hong
Published: 2022
Full Text: View/download PDF

78. Unleashing the Full Potential of Product Quantization for Large-Scale Image Retrieval.

Author: Yu Liang, Shiliang Zhang, Li Ken Li, and Xiaoyu Wang
Published: 2023

79. Robust Pose Estimation in Crowded Scenes with Direct Pose-Level Inference.

Author: Dongkai Wang, Shiliang Zhang, and Gang Hua 0001
Published: 2021

80. Extremely Low Footprint End-to-End ASR System for Smart Device.

Author: Zhifu Gao, Yiwu Yao, Shiliang Zhang, Jun Yang, Ming Lei, and Ian McLoughlin 0001
Published: 2021
Full Text: View/download PDF

81. Investigation of Spatial-Acoustic Features for Overlapping Speech Detection in Multiparty Meetings.

Author: Shiliang Zhang, Siqi Zheng, Weilong Huang, Ming Lei, Hongbin Suo, Jinwei Feng, and Zhijie Yan
Published: 2021
Full Text: View/download PDF

82. Intra-Inter Camera Similarity for Unsupervised Person Re-Identification.

Author: Shiyu Xuan and Shiliang Zhang
Published: 2021
Full Text: View/download PDF

83. An Energy Consumption Model for Electrical Vehicle Networks via Extended Federated-learning.

Author: Shiliang Zhang
Published: 2021
Full Text: View/download PDF

84. Graph Consistency Based Mean-Teaching for Unsupervised Domain Adaptive Person Re-Identification.

Author: Xiaobin Liu and Shiliang Zhang
Published: 2021
Full Text: View/download PDF

85. Hybrid Network Compression via Meta-Learning.

Author: Jianming Ye, Shiliang Zhang, and Jingdong Wang 0001
Published: 2021
Full Text: View/download PDF

86. Simplified Self-Attention for Transformer-Based end-to-end Speech Recognition.

Author: Haoneng Luo, Shiliang Zhang, Ming Lei, and Lei Xie 0001
Published: 2021
Full Text: View/download PDF

87. Self-Supervised Adversarial Multi-Task Learning for Vocoder-Based Monaural Speech Enhancement.

Author: Zhihao Du, Ming Lei, Jiqing Han 0001, and Shiliang Zhang
Published: 2020
Full Text: View/download PDF

88. SAN-M: Memory Equipped Self-Attention for End-to-End Speech Recognition.

Author: Zhifu Gao, Shiliang Zhang, Ming Lei, and Ian McLoughlin 0001
Published: 2020
Full Text: View/download PDF

89. Neural Zero-Inflated Quality Estimation Model for Automatic Speech Recognition System.

Author: Kai Fan 0002, Bo Li 0121, Jiayi Wang, Shiliang Zhang, Boxing Chen, Niyu Ge, and Zhijie Yan
Published: 2020
Full Text: View/download PDF

90. Streaming Chunk-Aware Multihead Attention for Online End-to-End Speech Recognition.

Author: Shiliang Zhang, Zhifu Gao, Haoneng Luo, Ming Lei, Jie Gao, Zhijie Yan, and Lei Xie 0001
Published: 2020
Full Text: View/download PDF