<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: arial,helvetica,sans-serif; font-size: 12pt; color: #000000'><div style="color:#000;font-weight:normal;font-style:normal;text-decoration:none;font-family:Helvetica,Arial,sans-serif;font-size:12pt;"><style>p { margin: 0; }</style><div style="font-family: arial,helvetica,sans-serif; font-size: 12pt; color: #000000"><b>Computational approaches for the DNA sequencing data deluge</b>
<br>
<b><a href="http://www.cbcb.umd.edu/%7Elangmead/" target="_blank">Ben Langmead</a></b>, <a href="http://www.umd.edu/" target="_blank">University of Maryland College Park</a>
<br>Tuesday, March 6, 2012, 4:30pm<br>Computer Science Small Auditorium (Room 105)<br>
<br>
Second-generation DNA sequencers are improving rapidly and are now 
capable of sequencing hundreds of billions of nucleotides of data in 
about a week for a few thousand dollars.  Consequently, sequencing has 
become a common tool in many fields of life science.  But with these 
developments comes a problem: growth in per-sequencer throughput is 
drastically outpacing growth in computer speed.  As the throughput gap 
widens over time, the crucial research bottlenecks are increasingly 
computational: computing, storage, labor, power.
<p><br>
</p><p>these lines, I will discuss collaborative scientific projects in 
epigenetics and gene expression profiling for which I provided novel 
computational methods in areas such as read alignment, text indexing, 
and data-intensive computing.  I will also discuss a new set of methods 
for very time- and space-efficient alignment of sequencing reads: Bowtie
 and Bowtie 2.  These tools build on the insight that the 
Burrows-Wheeler Transform and the FM Index, previously used for data 
compression and exact string matching, can be extended to facilitate 
fast and memory-efficient alignment of DNA sequences to long reference 
genomes such as the human genome.
</p>
<br>Ben Langmead is a Research Associate in the Department of Biostatistics 
at the Johns Hopkins Bloomberg School of Public Health.  He completed 
his Ph.D. in Computer Science in February 2012 at University of 
Maryland, advised by Steven L. Salzberg.  His research addresses 
problems at the intersection of computer science and genomics, and he is
 the author of several open source software tools for analysis of 
high-throughput genomics data, including Bowtie, Bowtie 2, Crossbow and 
Myrna.  His paper describing Bowtie won the Genome Biology award for 
outstanding paper published in 2009.  At Johns Hopkins, he collaborates 
with biostatisticians, biomedical engineers, biologists, and other 
computer scientists to develop methods for analyzing second-generation 
DNA sequencing data.
</div><br>_______________________________________________<br>talks mailing list<br>talks@lists.cs.princeton.edu<br>https://lists.cs.princeton.edu/mailman/listinfo/talks<br></div><br></div></body></html>