Author: "Zhou Zhao" / Publication Type: Conference Materials - Searchworks@Jio Institute Digital Library Search Results

1. MPOD123: One Image to 3D Content Generation Using Mask-Enhanced Progressive Outline-to-Detail Optimization.

Author: Jimin Xu, Tianbao Wang, Tao Jin 0004, Shengyu Zhang 0001, Dongjie Fu, Zhe Wang, Jiangjing Lyu, Chengfei Lv, Chaoyue Niu, Zhou Yu 0001, Zhou Zhao, and Fei Wu 0001
Published: 2024
Full Text: View/download PDF

2. WIA-LD2ND: Wavelet-Based Image Alignment for Self-supervised Low-Dose CT Denoising.

Author: Haoyu Zhao, Yuliang Gu, Zhou Zhao, Bo Du 0001, Yongchao Xu, and Rui Yu 0002
Published: 2024
Full Text: View/download PDF

3. Spatial-Aware Attention Generative Adversarial Network for Semi-supervised Anomaly Detection in Medical Image.

Author: Zerui Zhang, Zhichao Sun, Zelong Liu, Zhou Zhao, Rui Yu 0002, Bo Du 0001, and Yongchao Xu
Published: 2024
Full Text: View/download PDF

4. MoreStyle: Relax Low-Frequency Constraint of Fourier-Based Image Reconstruction in Generalizable Medical Image Segmentation.

Author: Haoyu Zhao, Wenhui Dong, Rui Yu 0002, Zhou Zhao, Bo Du 0001, and Yongchao Xu
Published: 2024
Full Text: View/download PDF

5. Prompting Segment Anything Model with Domain-Adaptive Prototype for Generalizable Medical Image Segmentation.

Author: Zhikai Wei, Wenhui Dong, Peilin Zhou, Yuliang Gu, Zhou Zhao, and Yongchao Xu
Published: 2024
Full Text: View/download PDF

6. Position-Guided Prompt Learning for Anomaly Detection in Chest X-Rays.

Author: Zhichao Sun, Yuliang Gu, Yepeng Liu, Zerui Zhang, Zhou Zhao, and Yongchao Xu
Published: 2024
Full Text: View/download PDF

7. Speech-to-Speech Translation with Discrete-Unit-Based Style Transfer.

Author: Yongqi Wang, Jionghao Bai, Rongjie Huang, Ruiqi Li, Zhiqing Hong, and Zhou Zhao
Published: 2024

8. EAGER: Two-Stream Generative Recommender with Behavior-Semantic Collaboration.

Author: Ye Wang, Jiahao Xun, Minjie Hong, Jieming Zhu, Tao Jin 0004, Wang Lin, Haoyuan Li, Linjun Li, Yan Xia 0006, Zhou Zhao, and Zhenhua Dong
Published: 2024
Full Text: View/download PDF

9. Multimodal Pretraining, Adaptation, and Generation for Recommendation: A Survey.

Author: Qijiong Liu, Jieming Zhu, Yanting Yang, Quanyu Dai, Zhaocheng Du, Xiao-Ming Wu 0003, Zhou Zhao, Rui Zhang 0003, and Zhenhua Dong
Published: 2024
Full Text: View/download PDF

10. Prompt-Singer: Controllable Singing-Voice-Synthesis with Natural Language Prompt.

Author: Yongqi Wang, Ruofan Hu, Rongjie Huang, Zhiqing Hong, Ruiqi Li, Wenrui Liu, Fuming You, Tao Jin, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

11. Wav2SQL: Direct Generalizable Speech-To-SQL Parsing.

Author: Huadai Liu, Rongjie Huang, Jinzheng He, Gang Sun, Ran Shen, Xize Cheng, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

12. MobileSpeech: A Fast and High-Fidelity Framework for Mobile Zero-Shot Text-to-Speech.

Author: Shengpeng Ji, Ziyue Jiang 0001, Hanting Wang, Jialong Zuo, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

13. Rethinking the Multimodal Correlation of Multimodal Sequential Learning via Generalizable Attentional Results Alignment.

Author: Tao Jin 0004, Wang Lin, Ye Wang, Linjun Li, Xize Cheng, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

14. Text-to-Song: Towards Controllable Music Generation Incorporating Vocal and Accompaniment.

Author: Zhiqing Hong, Rongjie Huang, Xize Cheng, Yongqi Wang, Ruiqi Li, Fuming You, Zhou Zhao, and Zhimeng Zhang
Published: 2024
Full Text: View/download PDF

15. AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension.

Author: Qian Yang, Jin Xu, Wenrui Liu, Yunfei Chu, Ziyue Jiang 0001, Xiaohuan Zhou, Yichong Leng, Yuanjun Lv, Zhou Zhao, Chang Zhou, and Jingren Zhou
Published: 2024
Full Text: View/download PDF

16. Self-Supervised Singing Voice Pre-Training towards Speech-to-Singing Conversion.

Author: Ruiqi Li, Rongjie Huang, Yongqi Wang, Zhiqing Hong, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

17. TransFace: Unit-Based Audio-Visual Speech Synthesizer for Talking Head Translation.

Author: Xize Cheng, Rongjie Huang, Linjun Li, Zehan Wang 0001, Tao Jin 0004, Aoxiong Yin, Feiyang Chen, Xinyu Duan, Baoxing Huai, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

18. Uni-Dubbing: Zero-Shot Speech Synthesis from Visual Articulation.

Author: Songju Lei, Xize Cheng, Mengjiao Lyu, Jianqiao Hu, Jintao Tan, Runlin Liu, Lingyu Xiong, Tao Jin 0004, Xiandong Li, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

19. Multimodal Prompt Learning with Missing Modalities for Sentiment Analysis and Emotion Recognition.

Author: Zirun Guo, Tao Jin 0004, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

20. Make-A-Voice: Revisiting Voice Large Language Models as Scalable Multilingual and Multitask Learners.

Author: Rongjie Huang, Chunlei Zhang, Yongqi Wang, Dongchao Yang, Jinchuan Tian, Zhenhui Ye, Luping Liu, Zehan Wang 0001, Ziyue Jiang 0001, Xuankai Chang, Jiatong Shi, Chao Weng, Zhou Zhao, and Dong Yu 0001
Published: 2024
Full Text: View/download PDF

21. Robust Singing Voice Transcription Serves Synthesis.

Author: Ruiqi Li, Yu Zhang 0126, Yongqi Wang, Zhiqing Hong, Rongjie Huang, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

22. TextrolSpeech: A Text Style Control Speech Corpus with Codec Language Text-to-Speech Models.

Author: Shengpeng Ji, Jialong Zuo, Minghui Fang 0002, Ziyue Jiang 0004, Feiyang Chen, Xinyu Duan, Baoxing Huai, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

23. Language Model is a Branch Predictor for Simultaneous Machine Translation.

Author: Aoxiong Yin, Tianyun Zhong, Haoyuan Li, Siliang Tang, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

24. AntCritic: Argument Mining for Free-Form and Visually-Rich Financial Comments.

Author: Huadai Liu, Wenqiang Xu, Xuan Lin, Jingjing Huo, Hong Chen, and Zhou Zhao
Published: 2024

25. MART: Learning Hierarchical Music Audio Representations with Part-Whole Transformer.

Author: Dong Yao, Jieming Zhu, Jiahao Xun, Shengyu Zhang 0001, Zhou Zhao, Liqun Deng, Wenqiao Zhang, Zhenhua Dong, and Xin Jiang 0002
Published: 2024
Full Text: View/download PDF

26. Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-Modal Structured Representations.

Author: Yufeng Huang, Jiji Tang, Zhuo Chen 0007, Rongsheng Zhang, Xinfeng Zhang, Weijie Chen, Zeng Zhao, Zhou Zhao, Tangjie Lv, Zhipeng Hu, and Wen Zhang 0015
Published: 2024
Full Text: View/download PDF

27. StyleSinger: Style Transfer for Out-of-Domain Singing Voice Synthesis.

Author: Yu Zhang 0126, Rongjie Huang, Ruiqi Li, Jinzheng He, Yan Xia 0006, Feiyang Chen, Xinyu Duan, Baoxing Huai, and Zhou Zhao
Published: 2024
Full Text: View/download PDF

28. AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head.

Author: Rongjie Huang, Mingze Li, Dongchao Yang, Jiatong Shi, Xuankai Chang, Zhenhui Ye, Yuning Wu, Zhiqing Hong, Jiawei Huang, Jinglin Liu, Yi Ren 0006, Yuexian Zou, Zhou Zhao, and Shinji Watanabe 0001
Published: 2024
Full Text: View/download PDF

29. Non-confusing Generation of Customized Concepts in Diffusion Models.

Author: Wang Lin, Jingyuan Chen, Jiaxin Shi, Yichen Zhu, Chen Liang, Junzhong Miao, Tao Jin 0004, Zhou Zhao, Fei Wu 0001, Shuicheng Yan, and Hanwang Zhang
Published: 2024

30. UniAudio: Towards Universal Audio Generation with Large Language Models.

Author: Dongchao Yang, Jinchuan Tian, Xu Tan 0003, Rongjie Huang, Songxiang Liu, Haohan Guo, Xuankai Chang, Jiatong Shi, Sheng Zhao, Jiang Bian 0002, Zhou Zhao, Xixin Wu, and Helen M. Meng
Published: 2024

31. FreeBind: Free Lunch in Unified Multimodal Space via Knowledge Fusion.

Author: Zehan Wang 0001, Ziang Zhang, Xize Cheng, Rongjie Huang, Luping Liu, Zhenhui Ye, Haifeng Huang, Yang Zhao, Tao Jin 0004, Peng Gao 0007, and Zhou Zhao
Published: 2024

32. InstructSpeech: Following Speech Editing Instructions via Large Language Models.

Author: Rongjie Huang, Ruofan Hu, Yongqi Wang, Zehan Wang 0001, Xize Cheng, Ziyue Jiang 0001, Zhenhui Ye, Dongchao Yang, Luping Liu, Peng Gao 0007, and Zhou Zhao
Published: 2024

33. Mega-TTS 2: Boosting Prompting Mechanisms for Zero-Shot Speech Synthesis.

Author: Ziyue Jiang 0001, Jinglin Liu, Yi Ren 0006, Jinzheng He, Zhenhui Ye, Shengpeng Ji, Qian Yang, Chen Zhang 0020, Pengfei Wei 0001, Chunfeng Wang, Xiang Yin 0006, Zejun Ma, and Zhou Zhao
Published: 2024

34. Real3D-Portrait: One-shot Realistic 3D Talking Portrait Synthesis.

Author: Zhenhui Ye, Tianyun Zhong, Yi Ren 0006, Jiaqi Yang, Weichuang Li, Jiawei Huang, Ziyue Jiang 0001, Jinzheng He, Rongjie Huang, Jinglin Liu, Chen Zhang 0020, Xiang Yin 0006, Zejun Ma, and Zhou Zhao
Published: 2024

35. Distilling Coarse-to-Fine Semantic Matching Knowledge for Weakly Supervised 3D Visual Grounding.

Author: Zehan Wang 0001, Haifeng Huang, Yang Zhao, Linjun Li, Xize Cheng, Yichen Zhu, Aoxiong Yin, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

36. MixSpeech: Cross-Modality Self-Learning with Audio-Visual Stream Mixup for Visual Speech Translation and Recognition.

Author: Xize Cheng, Tao Jin 0004, Rongjie Huang, Linjun Li, Wang Lin, Zehan Wang 0001, Ye Wang, Huadai Liu, Aoxiong Yin, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

37. Exploring Group Video Captioning with Efficient Relational Approximation.

Author: Wang Lin, Tao Jin 0004, Ye Wang, Wenwen Pan, Linjun Li, Xize Cheng, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

38. Open-Vocabulary Object Detection With an Open Corpus.

Author: Jiong Wang, Huiming Zhang, Haiwen Hong, Xuan Jin, Yuan He 0011, Hui Xue 0001, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

39. ViT-TTS: Visual Text-to-Speech with Scalable Diffusion Transformer.

Author: Huadai Liu, Rongjie Huang, Xuan Lin, Wenqiang Xu, Maozong Zheng, Hong Chen, Jinzheng He, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

40. 3DRP-Net: 3D Relative Position-aware Network for 3D Visual Grounding.

Author: Zehan Wang 0001, Haifeng Huang, Yang Zhao, Linjun Li, Xize Cheng, Yichen Zhu, Aoxiong Yin, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

41. ART: rule bAsed futuRe-inference deducTion.

Author: Mengze Li 0001, Tianqi Zhao, Jionghao Bai, Baoyi He, Jiaxu Miao, Wei Ji 0008, Zheqi Lv, Zhou Zhao, Shengyu Zhang 0001, Wenqiao Zhang, and Fei Wu 0001
Published: 2023
Full Text: View/download PDF

42. DATE: Domain Adaptive Product Seeker for E-Commerce.

Author: Haoyuan Li, Hao Jiang, Tao Jin, Mengyan Li, Yan Chen, Zhijie Lin, Yang Zhao, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

43. ANetQA: A Large-scale Benchmark for Fine-grained Compositional Reasoning over Untrimmed Videos.

Author: Zhou Yu 0001, Lixiang Zheng, Zhou Zhao, Fei Wu 0001, Jianping Fan 0001, Kui Ren 0001, and Jun Yu 0002
Published: 2023
Full Text: View/download PDF

44. WINNER: Weakly-supervised hIerarchical decompositioN and aligNment for spatio-tEmporal video gRounding.

Author: Mengze Li 0001, Han Wang, Wenqiao Zhang, Jiaxu Miao, Zhou Zhao, Shengyu Zhang 0001, Wei Ji 0008, and Fei Wu 0001
Published: 2023
Full Text: View/download PDF

45. Gloss Attention for Gloss-free Sign Language Translation.

Author: Aoxiong Yin, Tianyun Zhong, Li Tang, Weike Jin, Tao Jin, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

46. MSSRNet: Manipulating Sequential Style Representation for Unsupervised Text Style Transfer.

Author: Yazheng Yang, Zhou Zhao, and Qi Liu 0049
Published: 2023
Full Text: View/download PDF

47. Unsupervised Domain Adaptation for Referring Semantic Segmentation.

Author: Haonan Shi, Wenwen Pan, Zhou Zhao, Mingmin Zhang 0001, and Fei Wu 0001
Published: 2023
Full Text: View/download PDF

48. Rethinking Missing Modality Learning from a Decoding Perspective.

Author: Tao Jin 0004, Xize Cheng, Linjun Li, Wang Lin, Ye Wang, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

49. UniSinger: Unified End-to-End Singing Voice Synthesis With Cross-Modality Information Matching.

Author: Zhiqing Hong, Chenye Cui, Rongjie Huang, Lichao Zhang, Jinglin Liu, Jinzheng He, and Zhou Zhao
Published: 2023
Full Text: View/download PDF

50. Unsupervised Domain Adaptation for Video Object Grounding with Cascaded Debiasing Learning.

Author: Mengze Li 0001, Haoyu Zhang, Juncheng Li 0006, Zhou Zhao, Wenqiao Zhang, Shengyu Zhang 0001, Shiliang Pu, Yueting Zhuang, and Fei Wu 0001
Published: 2023
Full Text: View/download PDF

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Topic

Publication Year Range

Language

Publication Type

Journal

Database

Publisher

393 results on '"Zhou Zhao"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources