Mi nombre es Josefina Correa Menendez. Este verano estuve en el Department of Biomedical Informatics en la Universidad de Pittsburgh, gracias al programa IDI-BD2K de la UPR-RP. Estuve trabajando en el desarrollo de un método para evaluar predicciones de interacciones entre proteínas. Estas predicciones son generadas a través del uso de machine learning. La motivación para el proyecto es la siguiente: las predicciones de interacciones entre proteínas son organizadas en orden decreciente según la probabilidad de interacción. Si una predicción es una interacción conocida, se le denota como positivo verdadero, mientras que si una interacción predecida no está dentro del conjunto de interacciones conocidas, se le denota como falso positivo. El conjunto de falsos positivos incluye posibles interacciones novedosas, que no han sido validadas experimentalmente. Para identificar buenos candidatos para validar, se establece una cota que separa los falsos positivos según su probabilidad: aquellos falsos positivos con una probabilidad alta pasan a ser categorizados como interacciones novedosas, mientras que los falsos positivos con una probabilidad baja se consideran falsos positivos. Un subconjunto de interacciones novedosas pasa a ser validado experimentalmente, mientras que los falsos positivos son descartados. Ahora, podría resultar que dentro de estas predicciones con probabilidad baja haya interacciones verdaderas, pero como su probabilidad es baja, rara vez pasan a ser validadas. El proyecto busca desarrollar un filtro adicional que permita identificar estos candidatos para pasar a validarlos.
Esta experiencia de internado fue muy provechosa ya que pude explorar una variedad de temas dentro del campo de la bioinformática a los cuales no había estado expuesta. Además de trabajar en este proyecto, exploré el uso de machine learning para predecir interacciones entre proteínas. También tuve el privilegio de asistir un curso corto de verano ofrecido por el Center for Causal Discovery, y de contribuir a editar y redactar partes de un artículo científico que escribió mi mentora y que fue aceptado para ser publicado.