InferLine

Daniel Crankshaw; Gur-Eyal Sela; Xiangxi Mo; Corey Zumar; Ion Stoica; Joseph E. Gonzalez; Alexey Tumanov

doi:10.1145/3419111.3421285

Preprint2018

InferLine: ML Prediction Pipeline Provisioning and Management for Tight Latency Objectives

Daniel Crankshaw, Gur-Eyal Sela, Corey Zumar, Xiangxi Mo, Joseph E. Gonzalez, Ion Stoica, Alexey Tumanov

Article2017

Clipper: a low-latency online prediction serving system

Daniel Crankshaw, Xin Wang, Giulio Zhou, Michael J. Franklin, Joseph E. Gonzalez, Ion Stoica

Preprint2016

Clipper: A Low-Latency Online Prediction Serving System

Daniel Crankshaw, Xin Wang, Giulio Zhou, Michael J. Franklin, Joseph E. Gonzalez, Ion Stoica

Preprint2023

SuperServe: Fine-Grained Inference Serving for Unpredictable Workloads

Alind Khare, Dhruv Garg, Sukrit Kalra, Snigdha Grandhi, Ion Stoica, Alexey Tumanov

Article2021

Machine learning applications in large particle accelerator facilities: review and prospects

Wan Jinyu, Zheng Sun, Zhang Xiang, Bai Yu, Tsai Chengying, Paul Kim Ho Chu, Senlin Huang, Yi Jiao, Leng Yongbin, Biaobin Li, Jingyi Li, Nan Li, Lu Xiaohan, Meng Cai, Peng Yuemei, Sheng Wang, Chengyi Zhang

InferLine

Abstract

Discussion(0)

Related publications

InferLine: ML Prediction Pipeline Provisioning and Management for Tight Latency Objectives

Clipper: a low-latency online prediction serving system

Clipper: A Low-Latency Online Prediction Serving System

SuperServe: Fine-Grained Inference Serving for Unpredictable Workloads

Machine learning applications in large particle accelerator facilities: review and prospects