<div dir="ltr"><p dir="ltr" style="font-size:12.8px">Hi everyone!</p><p dir="ltr" style="font-size:12.8px"><span style="font-size:12.8px">This week at the </span><span style="font-size:12.8px">Applied</span><span style="font-size:12.8px"> </span><span style="font-size:12.8px">Statistics</span><span style="font-size:12.8px"> </span><span style="font-size:12.8px">Workshop we will be welcoming <b>Marie-Abele Bind</b></span><span style="font-size:12.8px">, Post-Doctoral Fellow at the Harvard University Center for the Environment. She will be presenting work provocatively entitled </span><span style="font-size:13px;font-family:arial"><b><i>Valid and Informative p-values from Big Data, Illustrated in an Epigenomic Cross-Over Experiment</i></b></span><b><i><font face="arial, sans, sans-serif">.</font></i></b><span style="font-size:12.8px">  Please find the abstract below and on the </span><a href="http://projects.iq.harvard.edu/applied.stats.workshop-gov3009/presentations/4132016-marie-abele-bind-harvard-title-coming-soon" style="font-size:12.8px" target="_blank">website</a><span style="font-size:12.8px"><a style="color:rgb(34,34,34)"></a>.</span></p><p dir="ltr" style="font-size:12.8px">As usual, we will meet in CGIS Knafel Room 354 from noon to 1:30pm, and lunch will be provided.  See you all there! To view previous Applied Statistics presentations, please visit the <a href="http://projects.iq.harvard.edu/applied.stats.workshop-gov3009/videos" target="_blank">website</a>.</p><p dir="ltr" style="font-size:12.8px">-- Aaron Kaufman</p><p dir="ltr" style="font-size:12.8px"><span style="font-size:12.8px">Title: </span><span style="font-size:13px;font-family:arial">Valid and Informative p-values from Big Data, Illustrated in an Epigenomic Cross-Over Experiment</span></p><p dir="ltr" style="font-size:12.8px"><font face="arial" style="font-size:12.8px">Abstract:</font><font face="arial, sans, sans-serif"> </font><span style="font-family:arial;font-size:13px">A common issue that arises with current analyses of epigenomic data is the repeated use of statistical tests. For example, consider 17 people in a randomized experiment measuring the results of exposure to two treatment conditions (e.g., clean air and ozone), with measurements at 484,531 epigenome locations, where the aim is to find the locations with an epigenetic effect (i.e., of clean air versus ozone). Here, we describe the use of randomization-based tests to obtain a Fisher exact p-value that is valid whatever the correlational structure of the data from the epigenomic locations. The power of the resultant test to detect real differences, however, requires the careful a priori selection of the single test statistic.</span></p><div><br></div>-- <br><div><div dir="ltr">Aaron R Kaufman<div>PhD Candidate, Harvard University</div><div>Department of Government</div><div><a href="tel:818.263.5583" value="+18182635583" target="_blank">818.263.5583</a></div></div></div>
</div>