Pasar al contenido principal
27/03/2025
INIA Las Brujas

Curso internacional: “Predicción de características complejas usando información genómica y ambiental masiva (‘Big Data’): conceptos, modelos, software y aplicaciones”

Banner BIG DATA

Entre el 10 y el 14 de marzo del 2025, INIA ofreció el curso internacional “Predicción de características complejas usando información genómica y ambiental masiva (‘Big Data’): conceptos, modelos, software y aplicaciones”.  El curso se dictó en idioma inglés.

El docente fue el Prof. Gustavo de los Campos (Ing. Agr., M.Sc., Ph.D.), Profesor de Epidemiologia y Bioestadística del Departamento de Estadística y Probabilidad de Michigan State University, EEUU. El Prof. de los Campos también está afiliado al Institute for Quantitative Health Science and Engineering de dicha Universidad.

La actividad fue organizada por Daniel Gianola y Olga Ravagnolo (ambos Ing. Agr., M. Sc., Ph. D.), y contó con el apoyo financiero de INIA, Aviagen (EEUU-Escocia), Bayer Crop Science (Alemania) y Corteva (EEUU). Se inscribieron 49 personas de nueve países; entre los aceptados, declinaron asistir 12 personas. El “número efectivo” de participantes oscilo entre 30-35 personas provenientes de Argentina, Brasil, Países Bajos, Perú, EEUU y Uruguay. Las disciplinas representadas incluyeron genética animal y vegetal, bioinformática, computación, estadística, forestación y medicina veterinaria.
El curso se llevó a cabo en el Institut Pasteur de Montevideo, y consistió en aproximadamente 35 horas teórico-practicas. El temario incluyo los siguientes puntos:

1- Predicción Genómica de Características Complejas: Principios
2- Selección de Variables Usando Regresión sobre Marcadores Individuales.
3- Estimación con “encogimiento” 
4- Regresion bayesiana y selección de Variables.
5- Regresión semi-paramétrica y RKHS (“Reproducing Kernel Hilbert Spaces”)
6- Predicción Genómica usando XGBoost.
7- GBLUP (BLUP Genómico) .
8- Predicción Genómica Multi-caracter/Multi-ambiente.
9- Integración de covariables ambientales en la Predicción Genómica.
10- Transferencia de Aprendizaje.

El ambiente computacional se focalizó en el lenguaje de programación “R”, que es open-source y se emplea para análisis estadístico, visualización, gráficas, y machine learning. También se trabajó en el contexto de Github, una plataforma basada en la web que facilita almacenar y compartir códigos y documentos varios. El paquete de R más empleado fue BGLR (Bayesian General Linear Regression), desarrollado por el Prof. de los Campos y usado extensivamente en producción vegetal y animal para investigación en del área de selección genómica.