<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>Speaker: Professor Dejan Kostic, EPFL</div><div><div>Title: Predicting Faults in Heterogeneous, Federated Distributed Systems</div><div>Date/time: 2:00-3:00pm on Friday October 1</div><div>Location: CS 302</div><div><br></div><div>Abstract:</div><div><br></div><div>It is notoriously difficult to make distributed systems reliable. This</div><div>becomes even harder in the case of the widely-deployed systems that</div><div>become heterogeneous and federated. The set of routers in charge of</div><div>the inter-domain routing in the Internet is a prime example of such a</div><div>system. The unanticipated interaction of nodes under seemingly valid</div><div>configuration changes and local fault-handling can have a profound</div><div>effect. For example, the Internet has suffered from multiple IP prefix</div><div>hijackings, as well as performance and reliability problems due to</div><div>emergent behavior resulting from a local session reset. </div><div><br></div><div>We argue that the key step in making these systems reliable is the</div><div>need to automatically predict faults. In this talk, I will describe</div><div>the design and implementation of DiCE, a system that uses temporal and</div><div>spatial awareness to predict faults in heterogeneous, federated</div><div>systems. Our live evaluation in the testbed shows that DiCE quickly</div><div>and successfully predicts two important classes of faults, operator</div><div>mistakes and programming errors, that have plagued BGP routing in the</div><div>Internet.</div><div><br></div><div>Joint work with Marco Canini, Vojin Jovanovic, and Gautam Kumar</div></div><div><br></div><div>Bio: Dejan Kostić obtained his Ph.D. in Computer Science at the Duke <span class="st0">University</span>, under Amin Vahdat. He spent the last two years of his studies and a brief stay as a postdoctoral scholar at the <span class="st0">University</span> <span class="st0">of</span> California, San Diego. He received his Master <span class="st0">of</span> Science degree in Computer Science from the <span class="st0">University</span> <span class="st0">of</span> Texas at Dallas, and his Bachelor <span class="st0">of</span> Science degree in Computer Engineering and Information Technology from the <span class="st0">University</span> <span class="st0">of</span> <span class="st0">Belgrade </span>(<span class="st0">ETF</span>), Serbia. In January 2006, he started as a tenure-track assistant professor at the School of Computer and Communications Sciences at EPFL (Ecole Polytechnique Fédérale de Lausanne), Switzerland. In 2010, he received a European Research Council (ERC) Starting Investigator Award. His interests include <a name="OLE_LINK1">Distributed Systems, Computer Networks, Operating Systems, and Mobile Computing</a>.</div></body></html>