MedGemma: Ahora compatible con DICOMweb e imágenes médicas

by Editor de Tecnologia

El equipo de Google Health AI Developer Foundations presentó MedGemma a principios de este año, en mayo, y posteriormente, en julio, lanzó una variante multimodal de 27 mil millones de parámetros, junto con el codificador de visión de MedGemma: MedSigLIP. Nos sentimos muy gratificados por la gran variedad de adaptaciones de modelos, artículos de investigación y aplicaciones que MedGemma ha generado en el ámbito académico y en la industria.

Nuestro objetivo es adaptarnos a las necesidades de los investigadores, desarrolladores y profesionales clínicos en su proceso de integración. En las primeras versiones, priorizamos la simplicidad, construyendo las indicaciones de imagen a partir de píxeles decodificados de formatos de imagen no médicos como JPEG y PNG, y alimentando al modelo fragmentos de registros médicos en formato JSON o como texto plano.

Sin embargo, reconocemos las complejidades de integrar MedGemma en los flujos de trabajo clínicos de manera interoperable. Por ello, protocolos estándar como Digital Imaging and Communications in Medicine (DICOM) y Fast Healthcare Interoperability Resources (FHIR) son cruciales para su integración. Hoy, nos complace anunciar que hemos simplificado el proceso para los desarrolladores que trabajan con estos formatos de datos.

Integración con DICOMweb

Estamos lanzando un nuevo contenedor Docker para MedGemma que acepta imágenes médicas como enlaces DICOMweb.

Puede utilizar este nuevo contenedor Docker o el código fuente directamente para implementar servicios MedGemma compatibles con DICOM en cualquier plataforma de computación. No obstante, si es usuario de Google Cloud Platform (GCP) y sus datos se almacenan en Cloud DICOM Store, visite la sección «Comenzar» de esta publicación para poner en marcha recursos precompilados en Vertex Model Garden en cuestión de minutos.

leer más  Pokémon 2026: Nuevo juego y Mundial en San Francisco

Cabe destacar que, desde su creación, el contenedor MedSigLIP ha tenido una comprensión nativa de DICOM; aquí tiene el contenedor público, el código fuente del contenedor y la especificación de la API.

Cuando sus aplicaciones interactivas orientadas al usuario deban procesar modalidades complejas como la patología digital de imágenes de portaobjetos completos (WSI) o imágenes radiológicas multidimensionales como la tomografía computarizada (TC) o la resonancia magnética (RM), la lectura de imágenes en el lado del servidor optimiza el rendimiento de la red y evita las restricciones de carga útil de la API. Además, esta arquitectura refuerza la seguridad en tránsito y garantiza un preprocesamiento de datos consistente y determinista.

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.