Author: "Jianwei Yang" / Journal: corr - Searchworks@Jio Institute Digital Library Search Results

1. TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models.

Author: Mu Cai, Reuben Tan, Jianrui Zhang, Bocheng Zou, Kai Zhang 0039, Feng Yao, Fangrui Zhu, Jing Gu, Yiwu Zhong, Yuzhang Shang, Yao Dou, Jaden Park, Jianfeng Gao 0001, Yong Jae Lee, and Jianwei Yang
Published: 2024
Full Text: View/download PDF

2. Latent Action Pretraining from Videos.

Author: Seonghyeon Ye, Joel Jang, Byeongguk Jeon, Se June Joo, Jianwei Yang, Baolin Peng, Ajay Mandlekar, Reuben Tan, Yu-Wei Chao, Bill Yuchen Lin, Lars Liden, Kimin Lee, Jianfeng Gao 0001, Luke Zettlemoyer, Dieter Fox, and Minjoon Seo
Published: 2024
Full Text: View/download PDF

3. Towards Flexible Visual Relationship Segmentation.

Author: Fangrui Zhu, Jianwei Yang, and Huaizu Jiang
Published: 2024
Full Text: View/download PDF

4. OmniParser for Pure Vision Based GUI Agent.

Author: Yadong Lu, Jianwei Yang, Yelong Shen, and Ahmed Awadallah 0001
Published: 2024
Full Text: View/download PDF

5. BiomedParse: a biomedical foundation model for image parsing of everything everywhere all at once.

Author: Theodore Zhao, Yu Gu 0017, Jianwei Yang, Naoto Usuyama, Ho Hin Lee, Tristan Naumann, Jianfeng Gao 0001, Angela Crabtree, Jacob Abel, Christine Moung, Brian Piening, Carlo Bifulco, Mu Wei, Hoifung Poon, and Sheng Wang
Published: 2024
Full Text: View/download PDF

6. List Items One by One: A New Data Source and Learning Paradigm for Multimodal LLMs.

Author: An Yan 0003, Zhengyuan Yang, Junda Wu, Wanrong Zhu, Jianwei Yang, Linjie Li, Kevin Lin, Jianfeng Wang, Julian J. McAuley, Jianfeng Gao 0001, and Lijuan Wang
Published: 2024
Full Text: View/download PDF

7. V3Det Challenge 2024 on Vast Vocabulary and Open Vocabulary Object Detection: Methods and Results.

Author: Jiaqi Wang 0003, Yuhang Zang, Pan Zhang 0001, Tao Chu, Yuhang Cao, Zeyi Sun 0002, Ziyu Liu, Xiaoyi Dong, Tong Wu, Dahua Lin, Zeming Chen, Zhi Wang, Lingchen Meng, Wenhao Yao, Jianwei Yang, Sihong Wu, Zhineng Chen, Zuxuan Wu, Yu-Gang Jiang, Peixi Wu, Bosong Chai, Xuan Nie, Longquan Yan, Zeyu Wang, Qifan Zhou, Boning Wang, Jiaqi Huang, Zunnan Xu, Xiu Li 0001, Kehong Yuan, Yanyan Zu, Jiayao Ha, Qiong Gao, and Licheng Jiao
Published: 2024
Full Text: View/download PDF

8. Training Small Multimodal Models to Bridge Biomedical Competency Gap: A Case Study in Radiology Imaging.

Author: Juan Manuel Zambrano Chaves, Shih-Cheng Huang, Yanbo Xu, Hanwen Xu, Naoto Usuyama, Sheng Zhang 0012, Fei Wang 0060, Yujia Xie, Mahmoud Khademi, Ziyi Yang, Hany Hassan Awadalla, Julia Gong, Houdong Hu, Jianwei Yang, Chunyuan Li, Jianfeng Gao 0001, Yu Gu 0017, Cliff Wong, Mu Wei, Tristan Naumann, Muhao Chen, Matthew P. Lungren, Serena Yeung-Levy, Curtis P. Langlotz, Sheng Wang, and Hoifung Poon
Published: 2024
Full Text: View/download PDF

9. Pix2Gif: Motion-Guided Diffusion for GIF Generation.

Author: Hitesh Kandala, Jianfeng Gao 0001, and Jianwei Yang
Published: 2024
Full Text: View/download PDF

10. DeepStack: Deeply Stacking Visual Tokens is Surprisingly Simple and Effective for LMMs.

Author: Lingchen Meng, Jianwei Yang, Rui Tian, Xiyang Dai, Zuxuan Wu, Jianfeng Gao 0001, and Yu-Gang Jiang
Published: 2024
Full Text: View/download PDF

11. Matryoshka Multimodal Models.

Author: Mu Cai, Jianwei Yang, Jianfeng Gao 0001, and Yong Jae Lee
Published: 2024
Full Text: View/download PDF

12. Efficient Modulation for Vision Networks.

Author: Xu Ma 0005, Xiyang Dai, Jianwei Yang, Bin Xiao 0004, Yinpeng Chen, Yun Fu 0001, and Lu Yuan
Published: 2024
Full Text: View/download PDF

13. Foundation Models for Biomedical Image Segmentation: A Survey.

Author: Ho Hin Lee, Yu Gu 0017, Theodore Zhao, Yanbo Xu, Jianwei Yang, Naoto Usuyama, Cliff Wong, Mu Wei, Bennett A. Landman, Yuankai Huo, Alberto Santamaría-Pang, and Hoifung Poon
Published: 2024
Full Text: View/download PDF

14. BiomedJourney: Counterfactual Biomedical Image Generation by Instruction-Learning from Multimodal Patient Journeys.

Author: Yu Gu 0017, Jianwei Yang, Naoto Usuyama, Chunyuan Li, Sheng Zhang 0012, Matthew P. Lungren, Jianfeng Gao 0001, and Hoifung Poon
Published: 2023
Full Text: View/download PDF

15. A Simple Framework for Open-Vocabulary Segmentation and Detection.

Author: Hao Zhang 0097, Feng Li 0040, Xueyan Zou, Shilong Liu, Chunyuan Li, Jianfeng Gao 0001, Jianwei Yang, and Lei Zhang 0001
Published: 2023
Full Text: View/download PDF

16. LACMA: Language-Aligning Contrastive Learning with Meta-Actions for Embodied Instruction Following.

Author: Cheng-Fu Yang, Yen-Chun Chen 0001, Jianwei Yang, Xiyang Dai, Lu Yuan, Yu-Chiang Frank Wang, and Kai-Wei Chang
Published: 2023
Full Text: View/download PDF

17. Visual In-Context Prompting.

Author: Feng Li 0040, Qing Jiang, Hao Zhang 0097, Tianhe Ren, Shilong Liu, Xueyan Zou, Huaizhe Xu, Hongyang Li, Chunyuan Li, Jianwei Yang, Lei Zhang 0001, and Jianfeng Gao 0001
Published: 2023
Full Text: View/download PDF

18. detrex: Benchmarking Detection Transformers.

Author: Tianhe Ren, Shilong Liu, Feng Li 0040, Hao Zhang 0097, Ailing Zeng, Jie Yang, Xingyu Liao, Ding Jia, Hongyang Li, He Cao, Jianan Wang, Zhaoyang Zeng, Xianbiao Qi, Yuhui Yuan, Jianwei Yang, and Lei Zhang 0001
Published: 2023
Full Text: View/download PDF

19. IMProv: Inpainting-based Multimodal Prompting for Computer Vision Tasks.

Author: Jiarui Xu, Yossi Gandelsman, Amir Bar, Jianwei Yang, Jianfeng Gao 0001, Trevor Darrell, and Xiaolong Wang 0004
Published: 2023
Full Text: View/download PDF

20. VCoder: Versatile Vision Encoders for Multimodal Large Language Models.

Author: Jitesh Jain, Jianwei Yang, and Humphrey Shi
Published: 2023
Full Text: View/download PDF

21. A Strong and Reproducible Object Detector with Only Public Datasets.

Author: Tianhe Ren, Jianwei Yang, Shilong Liu, Ailing Zeng, Feng Li 0040, Hao Zhang 0097, Hongyang Li, Zhaoyang Zeng, and Lei Zhang 0001
Published: 2023
Full Text: View/download PDF

22. LLaVA-Plus: Learning to Use Tools for Creating Multimodal Agents.

Author: Shilong Liu, Hao Cheng 0002, Haotian Liu, Hao Zhang 0097, Feng Li 0040, Tianhe Ren, Xueyan Zou, Jianwei Yang, Hang Su 0006, Jun Zhu 0001, Lei Zhang 0001, Jianfeng Gao 0001, and Chunyuan Li
Published: 2023
Full Text: View/download PDF

23. Learning from Rich Semantics and Coarse Locations for Long-tailed Object Detection.

Author: Lingchen Meng, Xiyang Dai, Jianwei Yang, Dongdong Chen 0001, Yinpeng Chen, Mengchen Liu, Yi-Ling Chen, Zuxuan Wu, Lu Yuan, and Yu-Gang Jiang
Published: 2023
Full Text: View/download PDF

24. GLIGEN: Open-Set Grounded Text-to-Image Generation.

Author: Yuheng Li, Haotian Liu, Qingyang Wu, Fangzhou Mu, Jianwei Yang, Jianfeng Gao 0001, Chunyuan Li, and Yong Jae Lee
Published: 2023
Full Text: View/download PDF

25. Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection.

Author: Shilong Liu, Zhaoyang Zeng, Tianhe Ren, Feng Li 0040, Hao Zhang 0097, Jie Yang, Chunyuan Li, Jianwei Yang, Hang Su 0006, Jun Zhu 0001, and Lei Zhang 0001
Published: 2023
Full Text: View/download PDF

26. GPT-4V in Wonderland: Large Multimodal Models for Zero-Shot Smartphone GUI Navigation.

Author: An Yan 0003, Zhengyuan Yang, Wanrong Zhu, Kevin Lin, Linjie Li, Jianfeng Wang, Jianwei Yang, Yiwu Zhong, Julian J. McAuley, Jianfeng Gao 0001, Zicheng Liu 0001, and Lijuan Wang
Published: 2023
Full Text: View/download PDF

27. Set-of-Mark Prompting Unleashes Extraordinary Visual Grounding in GPT-4V.

Author: Jianwei Yang, Hao Zhang 0097, Feng Li 0040, Xueyan Zou, Chunyuan Li, and Jianfeng Gao 0001
Published: 2023
Full Text: View/download PDF

28. LLaVA-Grounding: Grounded Visual Chat with Large Multimodal Models.

Author: Hao Zhang 0097, Hongyang Li, Feng Li 0040, Tianhe Ren, Xueyan Zou, Shilong Liu, Shijia Huang, Jianfeng Gao 0001, Lei Zhang 0001, Chunyuan Li, and Jianwei Yang
Published: 2023
Full Text: View/download PDF

29. Learning Customized Visual Models with Retrieval-Augmented Knowledge.

Author: Haotian Liu, Kilho Son, Jianwei Yang, Ce Liu 0001, Jianfeng Gao 0001, Yong Jae Lee, and Chunyuan Li
Published: 2023
Full Text: View/download PDF

30. Segment Everything Everywhere All at Once.

Author: Xueyan Zou, Jianwei Yang, Hao Zhang 0097, Feng Li 0040, Linjie Li, Jianfeng Gao 0001, and Yong Jae Lee
Published: 2023
Full Text: View/download PDF

31. An Empirical Study of Scaling Instruct-Tuned Large Multimodal Models.

Author: Yadong Lu, Chunyuan Li, Haotian Liu, Jianwei Yang, Jianfeng Gao 0001, and Yelong Shen
Published: 2023
Full Text: View/download PDF

32. LLaVA-Interactive: An All-in-One Demo for Image Chat, Segmentation, Generation and Editing.

Author: Wei-Ge Chen, Irina Spiridonova, Jianwei Yang, Jianfeng Gao 0001, and Chunyuan Li
Published: 2023
Full Text: View/download PDF

33. Multimodal Foundation Models: From Specialists to General-Purpose Assistants.

Author: Chunyuan Li, Zhe Gan, Zhengyuan Yang, Jianwei Yang, Linjie Li, Lijuan Wang, and Jianfeng Gao 0001
Published: 2023
Full Text: View/download PDF

34. Interfacing Foundation Models' Embeddings.

Author: Xueyan Zou, Linjie Li, Jianfeng Wang, Jianwei Yang, Mingyu Ding, Zhengyuan Yang, Feng Li 0040, Hao Zhang 0097, Shilong Liu, Arul Aravinthan, Yong Jae Lee, and Lijuan Wang
Published: 2023
Full Text: View/download PDF

35. LLaVA-Med: Training a Large Language-and-Vision Assistant for Biomedicine in One Day.

Author: Chunyuan Li, Cliff Wong, Sheng Zhang 0012, Naoto Usuyama, Haotian Liu, Jianwei Yang, Tristan Naumann, Hoifung Poon, and Jianfeng Gao 0001
Published: 2023
Full Text: View/download PDF

36. Semantic-SAM: Segment and Recognize Anything at Any Granularity.

Author: Feng Li 0040, Hao Zhang 0097, Peize Sun, Xueyan Zou, Shilong Liu, Jianwei Yang, Chunyuan Li, Lei Zhang 0001, and Jianfeng Gao 0001
Published: 2023
Full Text: View/download PDF

37. Multimodal Adaptive Distillation for Leveraging Unimodal Encoders for Vision-Language Tasks.

Author: Zhecan Wang, Noel Codella, Yen-Chun Chen 0001, Luowei Zhou, Xiyang Dai, Bin Xiao 0004, Jianwei Yang, Haoxuan You, Kai-Wei Chang, Shih-Fu Chang, and Lu Yuan
Published: 2022
Full Text: View/download PDF

38. Parameter-efficient Fine-tuning for Vision Transformers.

Author: Xuehai He, Chunyuan Li, Pengchuan Zhang, Jianwei Yang, and Xin Eric Wang
Published: 2022
Full Text: View/download PDF

39. CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks.

Author: Zhecan Wang, Noel Codella, Yen-Chun Chen 0001, Luowei Zhou, Jianwei Yang, Xiyang Dai, Bin Xiao 0004, Haoxuan You, Shih-Fu Chang, and Lu Yuan
Published: 2022

40. Generalized Decoding for Pixel, Image, and Language.

Author: Xueyan Zou, Zi-Yi Dou, Jianwei Yang, Zhe Gan, Linjie Li, Chunyuan Li, Xiyang Dai, Harkirat Behl, Jianfeng Wang, Lu Yuan, Nanyun Peng, Lijuan Wang, Yong Jae Lee, and Jianfeng Gao 0001
Published: 2022
Full Text: View/download PDF

41. ELEVATER: A Benchmark and Toolkit for Evaluating Language-Augmented Visual Models.

Author: Chunyuan Li, Haotian Liu, Liunian Harold Li, Pengchuan Zhang, Jyoti Aneja, Jianwei Yang, Ping Jin, Yong Jae Lee, Houdong Hu, Zicheng Liu 0001, and Jianfeng Gao 0001
Published: 2022
Full Text: View/download PDF

42. K-LITE: Learning Transferable Visual Models with External Knowledge.

Author: Sheng Shen, Chunyuan Li, Xiaowei Hu 0006, Yujia Xie, Jianwei Yang, Pengchuan Zhang, Anna Rohrbach, Zhe Gan, Lijuan Wang, Lu Yuan, Ce Liu 0001, Kurt Keutzer, Trevor Darrell, and Jianfeng Gao 0001
Published: 2022
Full Text: View/download PDF

43. Unified Contrastive Learning in Image-Text-Label Space.

Author: Jianwei Yang, Chunyuan Li, Pengchuan Zhang, Bin Xiao 0004, Ce Liu 0001, Lu Yuan, and Jianfeng Gao 0001
Published: 2022
Full Text: View/download PDF

44. Focal Modulation Networks.

Author: Jianwei Yang, Chunyuan Li, and Jianfeng Gao 0001
Published: 2022
Full Text: View/download PDF

45. Efficient Self-supervised Vision Transformers for Representation Learning.

Author: Chunyuan Li, Jianwei Yang, Pengchuan Zhang, Mei Gao, Bin Xiao 0004, Xiyang Dai, Lu Yuan, and Jianfeng Gao 0001
Published: 2021

46. VinVL: Making Visual Representations Matter in Vision-Language Models.

Author: Pengchuan Zhang, Xiujun Li, Xiaowei Hu 0006, Jianwei Yang, Lei Zhang 0001, Lijuan Wang, Yejin Choi 0001, and Jianfeng Gao 0001
Published: 2021

47. Grounded Language-Image Pre-training.

Author: Liunian Harold Li, Pengchuan Zhang, Haotian Zhang, Jianwei Yang, Chunyuan Li, Yiwu Zhong, Lijuan Wang, Lu Yuan, Lei Zhang 0001, Jenq-Neng Hwang, Kai-Wei Chang, and Jianfeng Gao 0001
Published: 2021

48. RegionCLIP: Region-based Language-Image Pretraining.

Author: Yiwu Zhong, Jianwei Yang, Pengchuan Zhang, Chunyuan Li, Noel Codella, Liunian Harold Li, Luowei Zhou, Xiyang Dai, Lu Yuan, Yin Li 0003, and Jianfeng Gao 0001
Published: 2021

49. TACo: Token-aware Cascade Contrastive Learning for Video-Text Alignment.

Author: Jianwei Yang, Yonatan Bisk, and Jianfeng Gao 0001
Published: 2021

50. Image Scene Graph Generation (SGG) Benchmark.

Author: Xiaotian Han, Jianwei Yang, Houdong Hu, Lei Zhang 0001, Jianfeng Gao 0001, and Pengchuan Zhang
Published: 2021

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Publication Year Range

Publication Type

Database

67 results on '"Jianwei Yang"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources