<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: arial,helvetica,sans-serif; font-size: 10pt; color: #000000'>Joshua Wetzel will present his research seminar/general exam on Friday January 17  <br>at 10AM in Room 302 (note room!).  The members of his committee are:  Mona Singh, <br>advisor, Olga Troyanskaya, and Tom Funkhouser.  Everyone is invited to attend his talk <br>and those faculty wishing to remain for the oral exam following are welcome to do so.<br>His abstract and reading list follow below.<br><br><hr id="zwchr"><div style="color:#000;font-weight:normal;font-style:normal;text-decoration:none;font-family:Helvetica,Arial,sans-serif;font-size:12pt;"><b></b><div dir="ltr"><div><br></div><div>
















<p class="MsoNormal"><b><span style="font-size:10pt;font-family:Helvetica">Abstract:</span></b></p>

<p class="MsoNormal"><span style="font-size:10pt;font-family:Helvetica"> </span></p>

<p class="MsoNormal"><span style="font-size:10pt;font-family:Helvetica">Protein-DNA interaction is a fundamental step in cellular
regulation.  Proteins known as
transcription factors (TFs) are produced in order to either enhance or repress
the expression of various gene products according to the particular needs of
the cell at a given moment.  They often
do so by binding to the genome in specific locations according to the amino
acid residues contained in their DNA-binding domain (DBD), which is the structural
unit of the protein that is often used to classify TFs into groups.  The largest class of TFs, comprising roughly
half of the annotated TFs in eukaryotes, is defined by a DBD known as a Cys<sub>2</sub>His<sub>2</sub>
zinc finger (C2H2-ZF).  While the
majority of DBDs can bind only a limited repertoire DNA sequences, members of the
C2H2-ZF class span an extremely wide variety of DNA binding preferences.  Moreover, these preferences appear to be
determined largely by the identity of amino acids occupying only a few key
positions of a structurally well-defined and semi-modular protein-DNA contact
interface. However, the rules that govern DNA-binding preferences remain
unclear, thwarting our ability to predict binding sites of endogenous C2H2-ZFs.  Due to the large number of possible amino-acid
combinations and the variety of DNA sequences they can potentially bind,
high-throughput interaction screens and rigorous computational methods are
necessary.</span></p>

<p class="MsoNormal"><span style="font-size:10pt;font-family:Helvetica"> </span></p>

<p class="MsoNormal"><span style="font-size:10pt;font-family:Helvetica">In my talk, I’ll discuss
the analysis of a high-throughput, randomized, synthetic screen of C2H2-ZF-DNA
functional interactions obtained via the bacterial one-hybrid selection
system.  After extensive filtering, the
data reveals hundreds to thousands of ‘canonical’ helices binding with varying
levels of affinity to each of the 64 possible 3bp DNA targets, providing the
most comprehensive view of C2H2-ZF-DNA interaction to date.  I will explain an information theoretic
analysis that validates an expanded view of the physical model for the
C2H2-ZF-DNA binding interface and show methods for inferring DNA-binding
profiles via integration of data from independent protein selections.  Additionally, I extend the predictive scope of
the data by adapting a classical nearest neighbors approach by leveraging
information related to the physical binding model and frequently observed amino
acid substitutions.  I will demonstrate
strong concordance between predicted binding profiles and their experimentally
determined counterparts within the synthetic context, as well as
generalizability of the data via prediction of binding profiles for naturally
occurring C2H2-ZFs.  Overall, the
analysis reveals a complex binding landscape for C2H2-ZFs, which shows both
agreement and conflict with previously proposed ‘codes’ of DNA-binding
specificity.</span></p>

<p class="MsoNormal"><span style="font-size:10pt;font-family:Helvetica"> </span></p>

<p class="MsoNormal"><b><span style="font-size:10pt">Reading List:</span></b></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">1.            Jones, N. C.
& Pevzner, P. A. <i>An Introduction to Bioinformatics Algorithms</i>. MIT
Press (2004).  (Textbook)</span></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">2.            Stormo, G. D.
& Zhao, Y. Determining the specificity of protein-DNA interactions. <i>Nat.
Rev. Genet.</i> <b>11,</b> 751–60 (2010).</span></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">3.            Persikov, A. V. &
Singh, M. An expanded binding model for Cys2His2 zinc-finger protein-DNA
interfaces.  <i>Phys. Biol.</i> <b>8</b>(3):035010
(2011).</span></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">4.            Noyes, M. et
al.  A systematic characterization of
factors that regulate Drosophila segmentation via a bacterial one-hybrid
system.  <i>Nucleic Acids Res.</i> <b>36</b>(8),
2547-60 (2008).</span></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">5.            Klug, A. The
discovery of zinc fingers and their applications in gene regulation and genome
manipulation. <i>Annu. Rev. Biochem.</i> <b>79,</b> 213–31 (2010).</span></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">6.            Jolma, A. <i>et
al.</i> DNA-binding specificities of human transcription factors. <i>Cell</i> <b>152,</b>
327–39 (2013).</span></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">7.            Benos, P. V.,
Lapedes, A. S. & Stormo, G. D. Probabilistic Code for DNA Recognition by
Proteins of the EGR Family. <i>J. Mol. Biol.</i> <b>323,</b> 701–727 (2002).</span></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">8.            Enuameh, M. S. <i>et
al.</i> Global analysis of Drosophila Cys</span><span style="font-family:Helvetica">₂</span><span style="font-family:Helvetica">-His</span><span style="font-family:Helvetica">₂</span><span style="font-family:Helvetica"> zinc finger proteins reveals a multitude of
novel recognition motifs and binding determinants. <i>Genome Res.</i> <b>23,</b>
928–40 (2013).</span></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">9.            Vaquerizas, J.
M., Kummerfeld, S. K., Teichmann, S. a & Luscombe, N. M. A census of human
transcription factors: function, expression and evolution. <i>Nat. Rev. Genet.</i>
<b>10,</b> 252–63 (2009).</span></p>

<p style="margin-left:32pt"><span style="font-family:Helvetica">10.         Persikov, A. V
& Singh, M. De novo prediction of DNA-binding specificities for Cys2His2
zinc finger proteins. <i>Nucleic Acids Res.</i> 1–12 (2013). </span></p></div><div class="gmail_extra"><br></div></div></div><br></div></body></html>