Durante mucho tiempo, los investigadores han tenido dificultades para representar y generar modelos de Representación de Fronteras (B-rep) de manera efectiva, recurriendo habitualmente a métodos complejos basados en grafos que separan la geometría y la topología. Ahora, Jiahao Li, Yunpeng Bai (Universidad Nacional de Singapur) y Yongkang Dai (Universidad Politécnica del Noroeste), junto con Guo y colaboradores, presentan un nuevo enfoque, BrepARG, que codifica de forma única la geometría y la topología de B-rep en una única secuencia de tokens holística. Este avance permite la aplicación de potentes marcos generativos basados en secuencias, previamente inaccesibles para el modelado de B-rep, y demuestra un rendimiento de última generación. Al representar todo el B-rep como una secuencia jerárquica de tokens, BrepARG no solo valida una nueva viabilidad para la generación de B-rep, sino que también abre interesantes vías para futuras investigaciones en este campo.
Concretamente, BrepARG emplea un proceso de tokenización jerárquica, creando tres tipos distintos de tokens: tokens de geometría y posición que capturan las características geométricas, y tokens de índice de cara que representan las conexiones topológicas. El equipo logró una construcción de secuencia holística construyendo primero bloques de geometría, que representan caras y aristas, utilizando estos tokens, y luego secuenciando estos bloques con un esquema consciente de la topología. Este meticuloso proceso culmina en una representación de secuencia completa y holística de todo el modelo B-rep.
Este avance supone una desviación significativa de los métodos existentes que se basan en el aprendizaje por etapas o en arquitecturas de múltiples componentes, que a menudo conducen a representaciones fragmentadas y a una mayor complejidad del modelo. Al representar holísticamente los datos de B-rep, BrepARG elimina la necesidad de estas complejas canalizaciones, permitiendo que el modelo capture la plena heterogeneidad e interdependencia inherentes a las estructuras de B-rep. El trabajo abre posibilidades para automatizar y mejorar los procesos de modelado CAD, ofreciendo un enfoque más eficiente y racionalizado para la generación de modelos sólidos. El entrenamiento de BrepARG requirió aproximadamente 1,2 días utilizando 4 GPU NVIDIA H20, mientras que la inferencia en una sola RTX 4090 tarda alrededor de 1,5 segundos por B-rep, lo que demuestra su eficiencia práctica.
Además, el estudio demuestra la eficacia del marco autorregresivo en la co-generación de formas geométricas y conexiones topológicas en una sola secuencia unificada. Los investigadores detallan un nuevo algoritmo de cuantificación escalar uniforme para codificar las posiciones 3D en tokens de posición, y un autoencoder variacional cuantificado por vectores (VQ-VAE) para generar tokens de geometría a partir de primitivas geométricas muestreadas por UV. Estas innovaciones técnicas contribuyen a la solidez general y al rendimiento del marco BrepARG, consolidando su posición como una solución líder para la generación de B-rep.
Método de los Científicos
La innovación fundamental radica en representar la geometría y la topología completas de B-rep como una única secuencia de tokens, facilitando el modelado autorregresivo directo y eliminando las representaciones fragmentadas comunes en los enfoques anteriores. Los investigadores desarrollaron un sistema de tres tokens para codificar los datos de B-rep: tokens de geometría que representan las características geométricas, tokens de posición que codifican las posiciones 3D mediante un nuevo algoritmo de cuantificación escalar uniforme, y tokens de índice de cara que capturan la información topológica. La geometría y la topología de las caras y los bordes se discretizan por separado, con primitivas geométricas muestreadas por UV y tokenizadas mediante el mapeo de latentes de autoencoder variacional (VQ-VAE) a índices de libro de códigos utilizando la búsqueda del vecino más cercano. Posteriormente, el equipo construyó bloques de geometría, cada uno de los cuales comprende los tres tipos de tokens y representa una sola cara o borde, formando la base para la construcción de la secuencia.
Los experimentos emplearon un esquema de secuenciación consciente de la topología para organizar los bloques de cara y borde, aplicando un ordenamiento causal al tiempo que se preservan las relaciones estructurales locales, un paso crítico para mantener la integridad de B-rep. Las secuencias de bloques de cara y borde se ensamblaron entonces con los marcadores necesarios para crear la representación de secuencia holística final, lista para el modelado autorregresivo. Para aprovechar esta representación, los científicos implementaron un transformador de solo decodificador multicapa con enmascaramiento causal, entrenándolo para predecir el siguiente token de la secuencia y aprender la distribución conjunta de los elementos geométricos y topológicos. Este marco autorregresivo permite la co-generación de formas y conexiones en una sola secuencia, logrando la generación de secuencias B-rep de extremo a extremo.
BrepARG alcanza una validez del 87,6% en conjuntos de datos DeepCAD
El equipo midió el rendimiento utilizando varias métricas clave, incluyendo Cobertura (COV), Discrepancia Media Máxima (MMD), Divergencia de Jensen-Shannon (JSD), Novedad, Unicidad y Validez, para evaluar rigurosamente los modelos B-rep generados. Estas mediciones confirman el rendimiento superior del modelo en comparación con los métodos de referencia como DeepCAD, BrepGen y DTGBrepGen. El equipo de investigación también investigó la eficiencia del entrenamiento y la inferencia, revelando que BrepARG requiere solo 1,2 días para el entrenamiento utilizando cuatro GPU H20, en comparación con los 7,5 días de BrepGen y los 3,0 días de DTGBrepGen. El tiempo de inferencia con una sola GPU RTX4090 se midió en 1,5 segundos para BrepARG, significativamente más rápido que los 8,4 segundos de BrepGen y los 3,6 segundos de DTGBrepGen.
Un análisis más profundo, utilizando el muestreo de núcleo con diferentes valores de ‘p’, demostró que el ajuste de este parámetro permite un control flexible sobre la diversidad y la validez de los modelos generados, un valor de p de 0,9 produjo los mejores resultados generales. La generación condicionada por clase se demostró con éxito prefijando la secuencia de entrada con un token específico de la clase durante el entrenamiento y la inferencia, lo que permite al modelo generar B-reps adaptados a categorías específicas, como los muebles. Estos hallazgos destacan la importancia de considerar las relaciones topológicas al construir la representación de secuencia de tokens holística.,.
BrepARG desbloquea la generación de B-rep basada en transformadores con un control sin precedentes
Este enfoque reformula la generación de B-rep como una tarea de modelado de secuencias, lo que permite la aplicación de arquitecturas generativas basadas en secuencias, como los transformadores, previamente no disponibles para B-rep, para aprender conjuntamente los detalles geométricos y las restricciones topológicas en un proceso unificado. Los experimentos revelan que un recorrido basado en la búsqueda en profundidad combinado con una estrategia de asignación de índice máximo captura eficazmente la conectividad local, lo que conduce a una geometría más coherente y a una generación más estable. Los autores reconocen las limitaciones relacionadas con la complejidad de modelar modelos B-rep altamente intrincados y las demandas computacionales de los modelos autorregresivos. El trabajo futuro podría explorar métodos para mejorar la eficiencia del proceso autorregresivo y extender el marco para manejar estructuras B-rep más complejas. Este avance allana el camino para nuevas direcciones en el modelado generativo de B-rep, lo que podría reducir los errores en varias etapas y la sobrecarga computacional en las aplicaciones de diseño y fabricación.
