¡Nuestros estudiantes en internados de verano 2016!

My name is Ilian Torres. I am currently an undergraduate student in the Department of Mathematics at the University of Puerto Rico, Río Piedras. This summer I had the honor of working at the Genomics Institute at the University of California Santa Cruz, thanks to the IDI-BD2K (Increasing Diversity in Interdisciplinary Big Data to Knowledge) program of the University of Puerto Rico Río Piedras funded by the NIH (National Institutes of Health.)

My summer consisted of workshops, recreational activities and working in the laboratory ( https://bd2ksummer.ucsc.edu ). We did numerous workshops such as Ethics workshops, Data Carpentry workshops, a Genomic Browser workshop, and workshops for applying to great opportunities like research symposiums and graduate school fellowships such as SACNAS and the NSF Graduate Research Fellowship. For recreational activities, we did many things from sporty-like soccer games and hiking to bonfires on the beach and small gatherings. I had the honor of working with three incredible mentors: Melissa Cline, Jeltja van Baron, and Holly Beale. My research consisted of quality control, analysis and raw genome sequencing to locate samples of questionable quality within a batch. The importance of this research is that in the near future we want to have databases of cancer-related genomes from various patients and their treatments and medication to do cross-examination with other patients. An example of this being that if patient A has a lung cancer with a genome sequence that is similar to patient B then the treatment that was used to cure patient A can be applied to patient B. The problem with this approach is that if the database has bad sequence data, erroneous solutions may be applied to a particular patient..

At the end of the program, I participated in the summer poster symposium at the University of California in Santa Cruz. This summer I had a very wonderful and unique experience and made friends not only with my comrades in the BD2K program, but also with my mentors. I learned what life as a grad student is all about. I also learned of all the great opportunities that research and graduate education provides. I recommend that every student should go through this experience at this or any internship at least once in their undergraduate career.

20160711_132135
Ilian Torres with some big data at the UC Santa Cruz Genomics Institute.

¡Nuestros estudiantes en internados de verano 2016!

Hola, mi nombre es Valerie Santiago González. Estoy en mi cuarto año en la UPR-RP. Y en este verano participé del programa “Harvard Summer Program in Biostatistics and Computational Biology”, gracias al programa IDI-BD2K. El proyecto de investigación en el que participé se llamó “Predicting Diabetes Diagnosis in African American Using Ensemble Machine Learning”. Utilizamos un paquete disponible en R llamado “SuperLearner” para “ensemble algorithms” para saber cúal era el mejor algoritmo para predecir diabetes y en un futuro predecir cualquier diagnóstico en los pacientes. Esta fue una nueva experiencia, aprendí mucho sobre la estadística ya que no tenía ningún conocimiento sobre esta materia.  Durante el internado nos ofrecieron 2 cursos graduados: Introducción a Bioestadística y Introducción a Epidemiología, en los que aprendí sobre estadística, epidemiología y la salud pública. Por lo que mucho que se aprende es que todos los estudiantes deben aprovechar oportunidades como estas y explorar nuevas materias debido a que ciencias de cómputos se puede relacionar con todo.

Valerie Santiago Gonzalez at the Harvard School of Public Health, Boston, Massachusetts.
Valerie Santiago Gonzalez at the Harvard School of Public Health, Boston, Massachusetts.

Seminar: “BIG DATA” y el futuro prometedor de la estadística aplicada

Recurso:

Dr. Rafael A. Irizarry
School of Public Health
Harvard University
Dana Farber Cancer Center
Professor of Biostatistics and
Computational Biology

Coordinadores:

Dra. Heidi Figueroa
Facultad de Ciencias Sociales

Dr. Humberto Cavallín
Escuela de Arquitectura

AGOSTO 24

11:30AM – 1:00PM

Anfiteatro Manuel Maldonado Denis
(CRA-108), Facultad de Ciencias Sociales
CONFERENCIA BIG DATA

¡Nuestros estudiantes en internados de verano 2016!

Mi nombre es Patricia Vera-González, soy estudiante de Matemáticas con concentración en pre-médica en la Universidad de Puerto Rico, Río Piedras. Este verano tuve la extraordinaria oportunidad de participar en el “Summer Program in Biostatistics and Computational Biology” en Harvard T.H. Chan School of Public Health en Boston, Massachusetts. Esta gran ocasión fue gracias al programa de IDI-BD2K (Increasing Diversity in Interdisciplinary Big Data to Knowledge) auspiciado por los National Institutes of Health (NIH). Gracias a este programa tuve la oportunidad de trabajar y aprender de los profesionales y líderes de la salud pública y bioestadísticas.

Mi verano consistió de numerosas actividades, cada una intelectualmente enriquecedoras. Aparte de tomar clases graduadas en bioestadísticas y epidemiología, participé en numerosos seminarios interdisciplinarios que variaban en numerosas ramas de la ciencia. Además tuve la oportunidad de formar parte de una investigación en genómica en el Dana Farber Cancer Institute junto al Dr. Rafael Irizarry. Mi proyecto utilizaba datos de fuentes públicas de dos estudios notorios que fueron publicados con resultados casi iguales: poder asociar la efectividad de una droga a cambios genéticos. Esto presenta el tema de “Precision Medicine”, que reconoce que cada individual varía en sus composición genética y que sus enfermedades y reacciones a los medicamentos son únicos, lo que presenta el objetivo de encontrar el medicamento propio para cada individuo. No obstante cuando ambos estudios fueron comparados en un tercer estudio, tenían correlaciones muy pobres. Esto presenta la controversia que hay en la rama, no solamente de genómica, sino de la ciencia y la importancia que es en poder reproducir resultados, más aún antes de comenzar ensayos clínicos. Esto dirigió que nuestro estudio se dividiera en dos fases: nuestro primer objetivo fue reproducir los datos del tercer estudio, y una vez teníamos los resultados determinamos otros métodos estadísticos para analizar la relación entre los dos estudios. Un obstáculo en nuestra investigación fue organizar y descifrar la data de los estudios, ya que fue mi primer experiencia en manejar “Big Data”, datos inmensos y complejos que presentan una gran dificultad en visualizar y analizarlos.

Al final del transcurso del verano presentamos nuestro estudio en Harvard T.H. Chan School of Public Health Annual Symposium: Pipelines into Biostatistics in The Dana Farber Cancer Institute, Yawkey Center. Este verano tuve la única experiencia de conectar con figuras reconocidas de la investigación en medicina y en bioestadística. Aprendí de la vida en escuela graduada y de las amplias oportunidades que puedo aplicar mis estudios. Es una experiencia enriquecedora que sería oportuna a cualquier estudiante graduado o sub-graduado que le interese ampliar su conocimiento de las ciencias y de temas controversiales y actuales en la rama de la medicina y salud pública.

Patricia Vera
Patricia Vera at the Dana Farber Cancer Institute, Boston Massachusetts.

Workshop: mRNAseq on non-model organisms

The Increasing Diversity in Interdisciplinary Big Data to Knowledge (IDI-Bd2K) project is pleased to announce a workshop on the analysis of mRNAseq data from non-model organisms. The workshop will be held Friday August 19 and Saturday August 20, 2016 in the Computer Science Department of the University of Puerto Rico, Rio Piedras.

The instructor will be Dr. C. Titus Brown, an Associate Professor from the University of California, Davis. Dr. Brown is a lead developer of the khmer software for processing next-generation sequencing data.

To register for the workshop, please fill in our online registration. Spaces are limited.

¡Nuestros estudiantes en internados de verano 2016!

Mi nombre es Josefina Correa Menendez. Este verano estuve en el Department of Biomedical Informatics en la Universidad de Pittsburgh, gracias al programa IDI-BD2K de la UPR-RP. Estuve trabajando en el desarrollo de un método para evaluar predicciones de interacciones entre proteínas. Estas predicciones son generadas a través del uso de machine learning. La motivación para el proyecto es la siguiente: las predicciones de interacciones entre proteínas son organizadas en orden decreciente según la probabilidad de interacción. Si una predicción es una interacción conocida, se le denota como positivo verdadero, mientras que si una interacción predecida no está dentro del conjunto de interacciones conocidas, se le denota como falso positivo. El conjunto de falsos positivos incluye posibles interacciones novedosas, que no han sido validadas experimentalmente. Para identificar buenos candidatos para validar, se establece una cota que separa los falsos positivos según su probabilidad: aquellos falsos positivos con una probabilidad alta pasan a ser categorizados como interacciones novedosas, mientras que los falsos positivos con una probabilidad baja se consideran falsos positivos. Un subconjunto de interacciones novedosas pasa a ser validado experimentalmente, mientras que los falsos positivos son descartados. Ahora, podría resultar que dentro de estas predicciones con probabilidad baja haya interacciones verdaderas, pero como su probabilidad es baja, rara vez pasan a ser validadas. El proyecto busca desarrollar un filtro adicional que permita identificar estos candidatos para pasar a validarlos.

Esta experiencia de internado fue muy provechosa ya que pude explorar una variedad de temas dentro del campo de la bioinformática a los cuales no había estado expuesta. Además de trabajar en este proyecto, exploré el uso de machine learning para predecir interacciones entre proteínas. También tuve el privilegio de asistir un curso corto de verano ofrecido por el Center for Causal Discovery, y de contribuir a editar y redactar partes de un artículo científico que escribió mi mentora y que fue aceptado para ser publicado.

Josefina at Pittsburgh.
Josefina at Pittsburgh.