Research blog

Inference

Accelerate RL rollouts by up to 50% with distribution-aware speculative decoding

Zelei Shao, Vikranth Srivatsa, Sanjana Srivastava, Qingyang Wu, Alpay Ariyak, Xiaoxia Wu, Ameen Patel, Jue Wang, Percy Liang, Tri Dao, Ce Zhang, Yiying Zhang, Ben Athiwaratkun, Chenfeng Xu, Junxiong Wang

Architecture

Parcae: Doing more with fewer parameters using stable looped models

Hayden Prairie, Zachary Novack, Taylor Berg-Kirkpatrick, Dan Fu

Agents

EinsteinArena: Harnessing the collective intelligence of agents in the wild to advance science

Federico Bianchi,* Yongchan Kwon,* James Zou

Agents

AI for Systems: Using LLMs to Optimize Database Query Execution

Mehmet Hamza Erol, Xiangpeng Hao, Federico Bianchi, Ciro Greco, Jacopo Tagliabue, James Zou

No search result

Try expanding your search or changing the filters.