¡Nuestros estudiantes en internados de verano 2016!

Mi nombre es Jean Karlo Rodriguez y soy estudiante de Ciencias de Cómputos en la UPRRP. Este verano estuve trabajando en la Universidad de California, Santa Cruz gracias al programa IDI-BD2K. Trabajé en el Genomics Institute, en el Laboratorio de Benedict Paten bajo la supervisión de Brian O’Connor. Participe en un proyecto que consistía en crear un “web service” en donde instituciones e investigadores podían almacenar y accesar su data para luego realizar análisis sobre ellos. La data con la cual estuve trabajando fue información de donantes y los análisis realizados a las muestras tomadas. Mi contribución en el proyecto consistió en crear un programa en Python que unía múltiples archivos de formato JSON, las cuales contenían la información de los donantes, ponerlos en un archivo nuevo y asignarle un índice a cada donante.

Además de trabajar en el proyecto, asistí a varios talleres sobre la preparación para solicitar a escuela graduada. Conocí a muchas personas amables que nunca olvidare y aprendí mucho sobre Genómica, Big Data y como crear software en esta área de investigación. Le recomiendo a todos y todas que no solo soliciten a este internado, sino a cualquier internado que esté interesado. No le tenga miedo ya que va a ser una experiencia muy positiva, vas a aprender más allá de lo que puedes aprender en un salón de clase y es una experiencia inolvidable.

Jean Rodriguez at UC Santa Cruz.
Jean Rodriguez at UC Santa Cruz.

¡Nuestros estudiantes en internados de verano 2016!

My name is Ilian Torres. I am currently an undergraduate student in the Department of Mathematics at the University of Puerto Rico, Río Piedras. This summer I had the honor of working at the Genomics Institute at the University of California Santa Cruz, thanks to the IDI-BD2K (Increasing Diversity in Interdisciplinary Big Data to Knowledge) program of the University of Puerto Rico Río Piedras funded by the NIH (National Institutes of Health.)

My summer consisted of workshops, recreational activities and working in the laboratory ( https://bd2ksummer.ucsc.edu ). We did numerous workshops such as Ethics workshops, Data Carpentry workshops, a Genomic Browser workshop, and workshops for applying to great opportunities like research symposiums and graduate school fellowships such as SACNAS and the NSF Graduate Research Fellowship. For recreational activities, we did many things from sporty-like soccer games and hiking to bonfires on the beach and small gatherings. I had the honor of working with three incredible mentors: Melissa Cline, Jeltja van Baron, and Holly Beale. My research consisted of quality control, analysis and raw genome sequencing to locate samples of questionable quality within a batch. The importance of this research is that in the near future we want to have databases of cancer-related genomes from various patients and their treatments and medication to do cross-examination with other patients. An example of this being that if patient A has a lung cancer with a genome sequence that is similar to patient B then the treatment that was used to cure patient A can be applied to patient B. The problem with this approach is that if the database has bad sequence data, erroneous solutions may be applied to a particular patient..

At the end of the program, I participated in the summer poster symposium at the University of California in Santa Cruz. This summer I had a very wonderful and unique experience and made friends not only with my comrades in the BD2K program, but also with my mentors. I learned what life as a grad student is all about. I also learned of all the great opportunities that research and graduate education provides. I recommend that every student should go through this experience at this or any internship at least once in their undergraduate career.

20160711_132135
Ilian Torres with some big data at the UC Santa Cruz Genomics Institute.

¡Nuestros estudiantes en internados de verano 2016!

Hola, mi nombre es Valerie Santiago González. Estoy en mi cuarto año en la UPR-RP. Y en este verano participé del programa “Harvard Summer Program in Biostatistics and Computational Biology”, gracias al programa IDI-BD2K. El proyecto de investigación en el que participé se llamó “Predicting Diabetes Diagnosis in African American Using Ensemble Machine Learning”. Utilizamos un paquete disponible en R llamado “SuperLearner” para “ensemble algorithms” para saber cúal era el mejor algoritmo para predecir diabetes y en un futuro predecir cualquier diagnóstico en los pacientes. Esta fue una nueva experiencia, aprendí mucho sobre la estadística ya que no tenía ningún conocimiento sobre esta materia.  Durante el internado nos ofrecieron 2 cursos graduados: Introducción a Bioestadística y Introducción a Epidemiología, en los que aprendí sobre estadística, epidemiología y la salud pública. Por lo que mucho que se aprende es que todos los estudiantes deben aprovechar oportunidades como estas y explorar nuevas materias debido a que ciencias de cómputos se puede relacionar con todo.

Valerie Santiago Gonzalez at the Harvard School of Public Health, Boston, Massachusetts.
Valerie Santiago Gonzalez at the Harvard School of Public Health, Boston, Massachusetts.

¡Nuestros estudiantes en internados de verano 2016!

Mi nombre es Patricia Vera-González, soy estudiante de Matemáticas con concentración en pre-médica en la Universidad de Puerto Rico, Río Piedras. Este verano tuve la extraordinaria oportunidad de participar en el “Summer Program in Biostatistics and Computational Biology” en Harvard T.H. Chan School of Public Health en Boston, Massachusetts. Esta gran ocasión fue gracias al programa de IDI-BD2K (Increasing Diversity in Interdisciplinary Big Data to Knowledge) auspiciado por los National Institutes of Health (NIH). Gracias a este programa tuve la oportunidad de trabajar y aprender de los profesionales y líderes de la salud pública y bioestadísticas.

Mi verano consistió de numerosas actividades, cada una intelectualmente enriquecedoras. Aparte de tomar clases graduadas en bioestadísticas y epidemiología, participé en numerosos seminarios interdisciplinarios que variaban en numerosas ramas de la ciencia. Además tuve la oportunidad de formar parte de una investigación en genómica en el Dana Farber Cancer Institute junto al Dr. Rafael Irizarry. Mi proyecto utilizaba datos de fuentes públicas de dos estudios notorios que fueron publicados con resultados casi iguales: poder asociar la efectividad de una droga a cambios genéticos. Esto presenta el tema de “Precision Medicine”, que reconoce que cada individual varía en sus composición genética y que sus enfermedades y reacciones a los medicamentos son únicos, lo que presenta el objetivo de encontrar el medicamento propio para cada individuo. No obstante cuando ambos estudios fueron comparados en un tercer estudio, tenían correlaciones muy pobres. Esto presenta la controversia que hay en la rama, no solamente de genómica, sino de la ciencia y la importancia que es en poder reproducir resultados, más aún antes de comenzar ensayos clínicos. Esto dirigió que nuestro estudio se dividiera en dos fases: nuestro primer objetivo fue reproducir los datos del tercer estudio, y una vez teníamos los resultados determinamos otros métodos estadísticos para analizar la relación entre los dos estudios. Un obstáculo en nuestra investigación fue organizar y descifrar la data de los estudios, ya que fue mi primer experiencia en manejar “Big Data”, datos inmensos y complejos que presentan una gran dificultad en visualizar y analizarlos.

Al final del transcurso del verano presentamos nuestro estudio en Harvard T.H. Chan School of Public Health Annual Symposium: Pipelines into Biostatistics in The Dana Farber Cancer Institute, Yawkey Center. Este verano tuve la única experiencia de conectar con figuras reconocidas de la investigación en medicina y en bioestadística. Aprendí de la vida en escuela graduada y de las amplias oportunidades que puedo aplicar mis estudios. Es una experiencia enriquecedora que sería oportuna a cualquier estudiante graduado o sub-graduado que le interese ampliar su conocimiento de las ciencias y de temas controversiales y actuales en la rama de la medicina y salud pública.

Patricia Vera
Patricia Vera at the Dana Farber Cancer Institute, Boston Massachusetts.

¡Nuestros estudiantes en internados de verano 2016!

Mi nombre es Josefina Correa Menendez. Este verano estuve en el Department of Biomedical Informatics en la Universidad de Pittsburgh, gracias al programa IDI-BD2K de la UPR-RP. Estuve trabajando en el desarrollo de un método para evaluar predicciones de interacciones entre proteínas. Estas predicciones son generadas a través del uso de machine learning. La motivación para el proyecto es la siguiente: las predicciones de interacciones entre proteínas son organizadas en orden decreciente según la probabilidad de interacción. Si una predicción es una interacción conocida, se le denota como positivo verdadero, mientras que si una interacción predecida no está dentro del conjunto de interacciones conocidas, se le denota como falso positivo. El conjunto de falsos positivos incluye posibles interacciones novedosas, que no han sido validadas experimentalmente. Para identificar buenos candidatos para validar, se establece una cota que separa los falsos positivos según su probabilidad: aquellos falsos positivos con una probabilidad alta pasan a ser categorizados como interacciones novedosas, mientras que los falsos positivos con una probabilidad baja se consideran falsos positivos. Un subconjunto de interacciones novedosas pasa a ser validado experimentalmente, mientras que los falsos positivos son descartados. Ahora, podría resultar que dentro de estas predicciones con probabilidad baja haya interacciones verdaderas, pero como su probabilidad es baja, rara vez pasan a ser validadas. El proyecto busca desarrollar un filtro adicional que permita identificar estos candidatos para pasar a validarlos.

Esta experiencia de internado fue muy provechosa ya que pude explorar una variedad de temas dentro del campo de la bioinformática a los cuales no había estado expuesta. Además de trabajar en este proyecto, exploré el uso de machine learning para predecir interacciones entre proteínas. También tuve el privilegio de asistir un curso corto de verano ofrecido por el Center for Causal Discovery, y de contribuir a editar y redactar partes de un artículo científico que escribió mi mentora y que fue aceptado para ser publicado.

Josefina at Pittsburgh.
Josefina at Pittsburgh.

¡Nuestros estudiantes en internados de verano 2016!

Soy Anibal Tornes Blanco y estoy en el Programa Interdisciplinario en la facultad de Ciencias Naturales en la UPR-Río Piedras. Al concluir mi segundo año en la universidad, se me dio una gran oportunidad para explorar mis horizontes en el campo de la Biología Computacional con los líderes en este campo.

Actualmente formo parte de la iniciativa de Big Data to Knowledge (BD2K), impulsado por el National Institutes of Health (NIH). Gracias la colaboración de la Universidad de Puerto Rico-Rio Piedras (UPRRP) y University of Pittsburgh (UPitt) soy parte del Internship in Biomedical Research, Informatics, and Computer Science (iBRIC). Mi proyecto durante este verano ha sido desarrollar un modelo de clasificación para mejorar la capacidad predictiva de datos de relevancia en los Electronic Medical Records (EMR). La popularidad de los EMR en los últimos años ha crecido exponencialmente, sin embargo, los doctores se encuentran ante el “Information Overload”. Este fenómeno se debe a que como seres humanos, nuestra capacidad de reconocer patrones entre resultados de laboratorios es limitado y podría llevar a diagnósticos erróneos. Por tal razón desarrollamos el Learning EMR (LEMR) con el fin de enseñarle a un sistema como predecir posibles condiciones de importancia y asistir a los doctores en sus diagnósticos.

El verano ha sido muy retante, pero mucho más enriquecedor. Les exhorto a que soliciten a experiencias como estas para crecer como individuos tanto en un aspecto personal como laboral. Somos casi un equipo de fútbol de puertorriqueños y nunca pensé que seria de esta forma. Explora tus horizontes y sal de tu “Comfort Zone”.

Anibal en su escritorio.
Anibal en University of Pittsburgh.

¡Nuestros estudiantes en internados de verano 2016!

Soy María del Carmen Ramos Álamo. Voy para mi cuarto año en la UPR-RP. Estoy haciendo 3 concentraciones: Matemáticas, Ciencias de Cómputos y Física.

Fui aceptada para participar durante este verano en uno de los programas del IDI-BD2K (Increasing Diversity in Interdisciplinary Big Data to Knowledge): iBRIC (internship for Biomedical Research, Informatics and Computer Science) en la Universidad de Pittsburgh. Esta ha sido mi primera experiencia de investigación e internado y confío que será la primera de muchas.

Para este proyecto me asignaron hacer varios algoritmos y programas para automatizar el proceso de analizar los resultados de laboratorios y clasificarlos con el propósito de que sea más fácil y rápido dar un diagnóstico. Para esto he tenido que aprender algunos nuevos lenguajes de programación y repasar otros que no usaba con frecuencia. He tenido que trabajar con R, Python, Java, SQL a la vez.

Estas 7 semanas que llevo por acá han sido de mucho crecimiento. No me arrepiento de haber participado de este internado y le recomiendo a todos los estudiantes que aprovechen estas experiencias.

Maria Ramos Alamo en su escritorio.
Maria del Carmen Ramos Alamo en Pittsburgh.

NSF REU Program in Medical Informatics (MedIX)

The NSF REU Program in Medical Informatics (MedIX) at DePaul University and University of Chicago enters its twelfth year. We are looking for bright undergraduate students to get involved in research in the area of Medical Informatics for the summer of 2016. Participants will receive a stipend of $5,000, travel support to/from the REU site, and subsistence allowance.

Important Dates:

  • March 4, 2016: Application submission deadline
  • March 30, 2016: Notification of decision
  • April 6, 2016: Confirmation of participation
  • June 13, 2016: MedIX Program Orientation
  • August 19, 2016: MedIX Program last day

Statistics on the previous REU MedIX Program (2005-2013):

  • 84% students had at least one research publication
  • 65 publications (9 journal papers, 46 conference papers, 10 extended abstracts)
  • 25% of students are in, or have finished, PhD programs; all received support
  • 18% of student participants have finished masters programs
  • 21% of student are in, or have finished, medical degrees; of those, six are active in research.

For the application form and additional information, please have your students visit the MedIX website at http://facweb.cdm.depaul.edu/research/vc/medix/index.htm or contact Dr. Daniela Raicu at draicu@cdm.depaul.edu.

Summer School for Computational Genomics, June 13-24, 2016.

The Icahn School of Medicine at Mount Sinai is currently accepting applications for the Summer School for Computational Genomics, June 13-24, 2016. The application deadline is March 1, 2016.

Description: Summer School for Computational Genomics – The Icahn School of Medicine at Mount Sinai (New York, NY). Our big data science summer program from June 13-24, 2016, is designed for graduate students and professionals who have a strong interest in the intersection of computer science, genetics, and medicine. There will be sessions on the human genome, genetic variation, and genome technologies, and there will be introductory sessions on Unix, Python, Galaxy Toolkit, and scripting. There will also be field trips to New York Genome Center, Columbia University, and Weill-Cornell Medical Center. This program is funded through NIH grant Big Data to Knowledge (BD2K) 1R25EB020393. Educational and housing costs are covered through this grant; travel stipends are also available. The selection process for participants is competitive, and those selected will be awarded the opportunity to be in the program. For more information and to apply: http://icahn.mssm.edu/creeds. Applicants must be U.S. citizens or permanent residents. This program strives to enhance the diversity of the biomedical big data workforce through recruitment of individuals from diverse racial, ethnic, cultural, and socioeconomic backgrounds.summerprogcompgenomics