Training Set Maker¶
El Training Set Maker es un pipeline que realiza el crossmatch espacial entre un catálogo de redshifts previamente registrado y el catálogo LSST Object, con el objetivo de crear training sets para algoritmos de photo-z basados en aprendizaje automático. Utiliza la biblioteca LSDB, desarrollada por LINCC Frameworks, para gestionar de forma eficiente los datos distribuidos espacialmente y ofrecer flexibilidad en los observables incluidos en el training set.
Ejecución mediante el sitio web de Photo-z Server¶
El pipeline puede ejecutarse a través del sitio web del Photo-z Server, que proporciona una interfaz intuitiva para configurar los parámetros del crossmatch, seleccionar los contenidos deseados y elegir el formato de salida.
Al ejecutar el pipeline desde la interfaz del Photo-z Server, el usuario debe proporcionar la siguiente información:
-
Nombre del training set
Un nombre corto y descriptivo que se utilizará para registrar el resultado en el sistema y encontrarlo en la lista de productos en búsquedas futuras.
No es necesario elegir un nombre único; el sistema añadirá automáticamente un número de ID interno al nombre del producto para garantizar su unicidad. -
Descripción (opcional)
Cualquier observación o nota sobre la muestra. -
Seleccionar el catálogo de redshifts para el crossmatch
Elija entre los catálogos de redshift de referencia ya registrados y enumerados en el menú.
Puede ser el resultado de una ejecución previa del pipeline Combine Redshift Catalogs o un catálogo personalizado cargado previamente por el usuario. -
Seleccionar el catálogo de objetos (datos fotométricos)
Elija entre los releases de LSST disponibles, p. ej., DP0.2, DP1, etc.- Tipo de flujo (Flux type): seleccione qué columnas de flujo se utilizarán durante el crossmatch. Las opciones se generan dinámicamente según el catálogo seleccionado, p. ej.,
cModel,gaap1p0,psf, etc. - Aplicar corrección por extinción mediante mapas de polvo (dustmaps)
Seleccione qué mapa de polvo (en caso de haberlo) se utilizará para corregir los flujos fotométricos por enrojecimiento. - Convertir flujos en magnitudes
Marque esta opción para convertir los flujos en magnitudes. La conversión se realiza mediante la fórmula:
\[ mag = -2.5 * \log_{10}(flux) + 31.5 \]donde \(flux\) es el valor en la columna de flujo seleccionada.
- Tipo de flujo (Flux type): seleccione qué columnas de flujo se utilizarán durante el crossmatch. Las opciones se generan dinámicamente según el catálogo seleccionado, p. ej.,
-
Seleccionar las configuraciones del crossmatch
- Distancia umbral (arcsec): distancia máxima permitida entre las fuentes emparejadas.
- Número de vecinos: número de coincidencias más cercanas que se recuperarán.
Seleccione 1 para una correspondencia uno a uno, o un número mayor para recuperar múltiples coincidencias.
-
Seleccionar galaxias únicas (próximamente)
En casos de múltiples coincidencias, aplicar un criterio de deduplicación (opción aún no implementada). -
Formato de salida
Elija entre los formatos admitidos: Parquet, CSV, FITS o HDF5.
Ejemplo 1: Training set con galaxias simuladas de DP0.2¶
Warning
Sección en construcción
Ejemplo 2: Training set con galaxias observadas de DP1¶
Warning
Sección en construcción
Ejecución mediante la API de Photo-z Server¶
Warning
Sección en construcción