Author: "Chunyuan Zhang" / Publication Type: Conference Materials - Searchworks@Jio Institute Digital Library Search Results

1. BP-Im2col: Implicit Im2col Supporting AI Backpropagation on Systolic Arrays.

Author: Jianchao Yang, Mei Wen, Junzhong Shen, Yasong Cao, Minjin Tang, Renyu Yang, Jiawei Fei, and Chunyuan Zhang
Published: 2022
Full Text: View/download PDF

2. Automatic mapping and code optimization for OpenCL kernels on FT-matrix architecture (WIP paper).

Author: Xiaolei Zhao, Mei Wen, Zhaoyun Chen, Yang Shi, and Chunyuan Zhang
Published: 2021
Full Text: View/download PDF

3. SAI: Self-Adjusting Incremental Quantile Estimation for Sparse Training of Neural Networks on Hardware Accelerators.

Author: Jianchao Yang, Mei Wen, Minjin Tang, Junzhong Shen, and Chunyuan Zhang
Published: 2021
Full Text: View/download PDF

4. Efficient Mini-batch Training for Echo State Networks.

Author: Chunyuan Zhang, Chao Liu, and Jie Zhao
Published: 2020
Full Text: View/download PDF

5. Incremental Deployment of Programmable Switches for Sketch-based Network Measurement.

Author: Yang Shi, Mei Wen, and Chunyuan Zhang
Published: 2020
Full Text: View/download PDF

6. Towards High-Efficiency Data Centers via Job-Aware Network Scheduling.

Author: Yang Shi, Mei Wen, and Chunyuan Zhang
Published: 2020
Full Text: View/download PDF

7. HybridSketch: A Memory-centric Precise Approach for Flow Measurement.

Author: Xiaolei Zhao, Mei Wen, Minjin Tang, Qun Huang 0001, and Chunyuan Zhang
Published: 2020
Full Text: View/download PDF

8. Towards a Deep-Pipelined Architecture for Accelerating Deep GCN on a Multi-FPGA Platform.

Author: Qixuan Cheng, Mei Wen, Junzhong Shen, Deguang Wang, and Chunyuan Zhang
Published: 2020
Full Text: View/download PDF

9. Optimized HybridSketch: More Efficient with Analysis and Algorithm.

Author: Xiaolei Zhao, Mei Wen, Minjin Tang, Qun Huang 0001, and Chunyuan Zhang
Published: 2020
Full Text: View/download PDF

10. Towards Memory-Efficient Streaming Processing with Counter-Cascading Sketching on FPGA.

Author: Minjin Tang, Mei Wen, Junzhong Shen, Xiaolei Zhao, and Chunyuan Zhang
Published: 2020
Full Text: View/download PDF

11. SACC: Configuring Application-Level Cache Intelligently for In-Memory Database Based on Long Short-Term Memory.

Author: Jiawei Fei, Yang Shi, Mei Wen, and Chunyuan Zhang
Published: 2019
Full Text: View/download PDF

12. TBSW: Time-Based Sliding Window Algorithm for Network Traffic Measurement.

Author: Zijun Hang, Yang Shi, Mei Wen, and Chunyuan Zhang
Published: 2019
Full Text: View/download PDF

13. SWAP: a sliding window algorithm for in-network packet measurement.

Author: Zijun Hang, Yang Shi, Mei Wen, Wei Quan 0004, and Chunyuan Zhang
Published: 2019
Full Text: View/download PDF

14. KVSwitch: An In-network Load Balancer for Key-Value Stores.

Author: Yang Shi, Jiawei Fei, Mei Wen, and Chunyuan Zhang
Published: 2019
Full Text: View/download PDF

15. Towards a Uniform Architecture for the Efficient Implementation of 2D and 3D Deconvolutional Neural Networks on FPGAs.

Author: Deguang Wang, Junzhong Shen, Mei Wen, and Chunyuan Zhang
Published: 2019
Full Text: View/download PDF

16. An Efficient Design Flow for Accelerating Complicated-connected CNNs on a Multi-FPGA Platform.

Author: Deguang Wang, Junzhong Shen, Mei Wen, and Chunyuan Zhang
Published: 2019
Full Text: View/download PDF

17. GENIE: QoS-guided Dynamic Scheduling for CNN-based Tasks on SME Clusters.

Author: Zhaoyun Chen, Lei Luo 0002, Haoduo Yang, Jie Yu 0008, Mei Wen, and Chunyuan Zhang
Published: 2019
Full Text: View/download PDF

18. Multiple CNN-based Tasks Scheduling across Shared GPU Platform in Research and Development Scenarios.

Author: Zhaoyun Chen, Lei Luo 0002, Wei Quan 0004, Yang Shi, Jie Yu 0008, Mei Wen, and Chunyuan Zhang
Published: 2018
Full Text: View/download PDF

19. High performance graph analytics with productivity on hybrid CPU-GPU platforms.

Author: Haoduo Yang, Huayou Su, Qiang Lan, Mei Wen, and Chunyuan Zhang
Published: 2018
Full Text: View/download PDF

20. Towards a Multi-array Architecture for Accelerating Large-scale Matrix Multiplication on FPGAs.

Author: Junzhong Shen, Yuran Qiao, You Huang, Mei Wen, and Chunyuan Zhang
Published: 2018
Full Text: View/download PDF

21. Parallel programming course development based on parallel computational thinking.

Author: Juan Chen 0001, Li Shen 0007, Jianping Yin, and Chunyuan Zhang
Published: 2018
Full Text: View/download PDF

22. Towards a Uniform Template-based Architecture for Accelerating 2D and 3D CNNs on FPGA.

Author: Junzhong Shen, You Huang, Zelong Wang, Yuran Qiao, Mei Wen, and Chunyuan Zhang
Published: 2018
Full Text: View/download PDF

23. Winograd Algorithm for 3D Convolution Neural Networks.

Author: Zelong Wang, Qiang Lan, Hongjun He, and Chunyuan Zhang
Published: 2017
Full Text: View/download PDF

24. Optimizing OpenCL Implementation of Deep Convolutional Neural Network on FPGA.

Author: Yuran Qiao, Junzhong Shen, Dafei Huang, Qianming Yang, Mei Wen, and Chunyuan Zhang
Published: 2017
Full Text: View/download PDF

25. RVNet: A fast and high energy efficiency network packet processing system on RISC-V.

Author: Yanpeng Wang, Mei Wen, Chunyuan Zhang, and Jie Lin
Published: 2017
Full Text: View/download PDF

26. DCC: Distributed Cache Consistency.

Author: Shenling Liu, Chunyuan Zhang, and Yujiao Chen
Published: 2017
Full Text: View/download PDF

27. Multikernel Recursive Least-Squares Temporal Difference Learning.

Author: Chunyuan Zhang, Qingxin Zhu, and Xinzheng Niu
Published: 2016
Full Text: View/download PDF

28. Enabling Tissue-Scale Cardiac Simulations Using Heterogeneous Computing on Tianhe-2.

Author: Johannes Langguth, Qiang Lan, Namit Gaur, Xing Cai, Mei Wen, and Chunyuan Zhang
Published: 2016
Full Text: View/download PDF

29. Improve security and availability for cloud storage.

Author: Shenling Liu, Chunyuan Zhang, and Le Bo
Published: 2016
Full Text: View/download PDF

30. Scalable FPGA-based Architecture for High-Performance Per-Flow Traffic Measurement.

Author: Junzhong Shen, Mei Wen, Minjin Tang, Xiaolei Zhao, and Chunyuan Zhang
Published: 2020
Full Text: View/download PDF

31. Poster Abstract: A Template-based Framework for Generating Network Processor in FPGA.

Author: Zhuang Cao, Huayou Su, Qianming Yang, Mei Wen, and Chunyuan Zhang
Published: 2019
Full Text: View/download PDF

32. Poster Abstract: Deep Learning Workloads Scheduling with Reinforcement Learning on GPU Clusters.

Author: Zhaoyun Chen, Lei Luo 0002, Wei Quan 0004, Mei Wen, and Chunyuan Zhang
Published: 2019
Full Text: View/download PDF

33. Enable Scale and Aspect Ratio Adaptability in Visual Tracking with Detection Proposals.

Author: Dafei Huang, Lei Luo 0002, Mei Wen, Zhaoyun Chen, and Chunyuan Zhang
Published: 2015
Full Text: View/download PDF

34. Fast tracking via context depth model learning.

Author: Zhaoyun Chen, Lei Luo 0002, Mei Wen, and Chunyuan Zhang
Published: 2015
Full Text: View/download PDF

35. Automated Transformation of GPU-Specific OpenCL Kernels Targeting Performance Portability on Multi-Core/Many-Core CPUs.

Author: Dafei Huang, Mei Wen, Changqing Xun, Dong Chen, Xing Cai, Yuran Qiao, Nan Wu 0003, and Chunyuan Zhang
Published: 2014
Full Text: View/download PDF

36. A fault detection mechanism in a Data-flow scheduled Multithreaded processor.

Author: Jian Fu, Qiang Yang 0006, Raphael Poss, Chris R. Jesshope, and Chunyuan Zhang
Published: 2014
Full Text: View/download PDF

37. Rethread: A Low-Cost Transient Fault Recovery Scheme for Multithreaded Processors.

Author: Jian Fu, Qiang Yang 0006, Raphael Poss, Chris R. Jesshope, and Chunyuan Zhang
Published: 2014
Full Text: View/download PDF

38. Utilizing Multiple Xeon Phi Coprocessors on One Compute Node.

Author: Xinnan Dong, Jun Chai, Jing Yang, Mei Wen, Nan Wu 0003, Xing Cai, Chunyuan Zhang, and Zhaoyun Chen
Published: 2014
Full Text: View/download PDF