Saltar a contenido

Training Set Maker

El Training Set Maker es un pipeline que realiza el crossmatch espacial entre un catálogo de redshifts previamente registrado y el catálogo LSST Object, con el objetivo de crear training sets para algoritmos de photo-z basados en aprendizaje automático. Utiliza la biblioteca LSDB, desarrollada por LINCC Frameworks, para gestionar de forma eficiente los datos distribuidos espacialmente y ofrecer flexibilidad en los observables incluidos en el training set.

Ejecución mediante el sitio web de Photo-z Server

El pipeline puede ejecutarse a través del sitio web del Photo-z Server, que proporciona una interfaz intuitiva para configurar los parámetros del crossmatch, seleccionar los contenidos deseados y elegir el formato de salida.

Al ejecutar el pipeline desde la interfaz del Photo-z Server, el usuario debe proporcionar la siguiente información:

  1. Nombre del training set
    Un nombre corto y descriptivo que se utilizará para registrar el resultado en el sistema y encontrarlo en la lista de productos en búsquedas futuras.
    No es necesario elegir un nombre único; el sistema añadirá automáticamente un número de ID interno al nombre del producto para garantizar su unicidad.

  2. Descripción (opcional)
    Cualquier observación o nota sobre la muestra.

  3. Seleccionar el catálogo de redshifts para el crossmatch
    Elija entre los catálogos de redshift de referencia ya registrados y enumerados en el menú.
    Puede ser el resultado de una ejecución previa del pipeline Combine Redshift Catalogs o un catálogo personalizado cargado previamente por el usuario.

  4. Seleccionar el catálogo de objetos (datos fotométricos)
    Elija entre los releases de LSST disponibles, p. ej., DP0.2, DP1, etc.

    • Tipo de flujo (Flux type): seleccione qué columnas de flujo se utilizarán durante el crossmatch. Las opciones se generan dinámicamente según el catálogo seleccionado, p. ej., cModel, gaap1p0, psf, etc.
    • Aplicar corrección por extinción mediante mapas de polvo (dustmaps)
      Seleccione qué mapa de polvo (en caso de haberlo) se utilizará para corregir los flujos fotométricos por enrojecimiento.
    • Convertir flujos en magnitudes
      Marque esta opción para convertir los flujos en magnitudes. La conversión se realiza mediante la fórmula:
    \[ mag = -2.5 * \log_{10}(flux) + 31.5 \]

    donde \(flux\) es el valor en la columna de flujo seleccionada.

  5. Seleccionar las configuraciones del crossmatch

    • Distancia umbral (arcsec): distancia máxima permitida entre las fuentes emparejadas.
    • Número de vecinos: número de coincidencias más cercanas que se recuperarán.
      Seleccione 1 para una correspondencia uno a uno, o un número mayor para recuperar múltiples coincidencias.
  6. Seleccionar galaxias únicas (próximamente)
    En casos de múltiples coincidencias, aplicar un criterio de deduplicación (opción aún no implementada).

  7. Formato de salida
    Elija entre los formatos admitidos: Parquet, CSV, FITS o HDF5.

Ejemplo 1: Training set con galaxias simuladas de DP0.2

Warning

Sección en construcción

Ejemplo 2: Training set con galaxias observadas de DP1

Warning

Sección en construcción

Ejecución mediante la API de Photo-z Server

Warning

Sección en construcción


Última actualización: 28 de noviembre de 2025