¿Dónde nacen las estrellas, dónde se posa un agujero negro supermasivo o dónde abundan hidrógeno, oxígeno o nitrógeno? Estas son las pistas que persiguen los astrónomos, ya que les permiten determinar qué compone una galaxia. Aunque los diagramas que las explican se han analizado manualmente desde hace décadas, toman mucho tiempo y requieren de un esfuerzo mayor; ahora, un algoritmo entrenado con aprendizaje de máquina (machine learning) hace la tarea en solo minutos ayudando a desentrañar los misterios del universo en el que vivimos.
La era tecnológica ha impactado todas las áreas del conocimiento,
y el cosmos no se ha quedado atrás, un campo en el que la investigadora
Katherine Andrea Caballero Soto, magíster en Astronomía de la Universidad
Nacional de Colombia (UNAL), se aventuró queriendo complementar, a través de
inteligencia artificial (IA), la mirada de los grandes telescopios que toman
registros fotométricos y espectroscópicos de galaxias y estrellas, las cuales
varían según su composición o su distancia.
Estar a una distancia de años luz de la Tierra ya no es un
inconveniente para encontrar el núcleo de una galaxia activa, una en la que
fantaseamos con que haya algún lugar parecido a nuestro planeta, o en donde tal
vez haya formas de vida que desconocemos.
De hecho, desde la década de 1980 expertos y científicos
elaboran diagramas que muestran los elementos que componen los núcleos de estos
sistemas galácticos, pero la información que recopila un telescopio o una
técnica de observación llega a ser tanta, que se hace casi imposible hacer
cálculos rápidos y sencillos.
Por eso la investigadora Caballero implementó distintos
algoritmos de machine learning en el estudio de los núcleos
activos de galaxias (AGN), pues quería saber si la potencia de estos avances de
IA son tales que, aquellas clasificaciones manuales que hacen astrónomos
profesionales y que pueden tomar horas o hasta días, ahora se realicen en cuestión
de segundos.
Los AGN son regiones extremadamente brillantes en el centro
de una galaxia que se alimentan por el material que cae en agujeros negros
gigantes supermasivos; emiten luz y energía en todas las longitudes de onda,
desde rayos X hasta ondas de radio.
Su estudio ha despertado el interés de los científicos
porque entenderlas nos daría una visión de cómo han evolucionado históricamente
tanto las galaxias como los agujeros negros; cómo se comporta el cosmos en
estas inmensas concentraciones de energía, e incluso cómo se podría haber
distribuido la materia oscura en el universo.
Para desarrollar su propuesta, la investigadora utilizó la
base de datos astronómicos Sloan Digital Sky Survey (SDSS), una de las más
detalladas del mundo y de acceso gratuito, que tiene información sobre las
líneas de emisión, unas “firmas” espectrales específicas de luz que hablan
acerca de los materiales y elementos que componen una galaxia. De esta se
recopiló la información de unas 250.000 galaxias.
Para eso se tuvieron en cuenta variables como la baja
densidad de electrones en el espacio, la cual hace que existan mayores
probabilidades de que se presenten transiciones prohibidas de los átomos
ionizados como OIII, NII, SII, o líneas espectrales de hidrógeno H-alfa (Hα) y
H-beta (Hβ), características principales que permiten determinar si el objeto
es una galaxia de núcleo activo, o si por el contrario es formadora estelar.
Los datos se complementaron con los registros de fotometría
de estas galaxias, imágenes de distintos rangos de brillo y filtros de color
que emiten estas estructuras cósmicas. Tomando estas características se
entrenaron distintos algoritmos es busca de aquel que pudiera clasificar con
precisión el tipo de galaxia del que se estaba hablando; estas podían ser: (i)
de núcleo activo, en las que abundan oxígeno, nitrógeno y azufre, (ii)
estelares, en las que nacen estrellas y el elemento principal es hidrógeno, y
(iii) una combinación de ambas.
Según la investigadora, “de todos los algoritmos que se
desarrollaron en el lenguaje de programación Python, el de redes neuronales
obtuvo el mejor desempeño, pues alcanzó alrededor de un 99 % de eficiencia
en la identificación de estas galaxias: de 250.000, clasificó alrededor de
248.000”.
“Estamos viendo la astronomía a través de los ojos del
aprendizaje de máquina, ya que optimiza el trabajo y permite tener la
información y parametrización correcta de cualquier objeto celeste, lo que
posibilita estudiar no solo las galaxias sino también las estrellas y
nebulosas, e incluso clasificar ondas gravitacionales”, agrega.
Por otro lado, indica que “es una herramienta que queda
abierta al público, ya que el código con el que se generó el algoritmo está
disponible para que cualquier investigador lo utilice; y en la literatura sobre
el tema no había acceso, lo que quiere decir que usaban lenguajes de
programación no gratuitos y con información muy específica”.
Se espera que este desarrollo se convierta en una plataforma
web en la que los interesados utilicen el algoritmo para determinar el tipo de
galaxia que están estudiando, o que quieren analizar más a fondo.