Alibaba: CosyVoice 3, AgentScope y Qoder Teams impulsan la IA empresarial

by Editor de Tecnologia

Esta semana, CosyVoice 3, el modelo de voz de código abierto recientemente lanzado por Alibaba, es compatible con nueve idiomas y alcanza un rendimiento de última generación en múltiples puntos de referencia establecidos; AgentScope lanza actualizaciones para mejorar el soporte al desarrollo y la implementación de agentes de IA de nivel de producción; mientras tanto, se lanza un plan Teams para empoderar a las empresas con un desarrollo impulsado por IA escalable, seguro y listo para la producción.

Alibaba Lanza CosyVoice 3, un Modelo de Síntesis de Voz Multilingüe de «Cero Disparo» que Avanza en el Estado del Arte

Alibaba ha puesto a disposición del público CosyVoice 3, un modelo de síntesis de voz multilingüe que supera significativamente a su predecesor en cuanto a consistencia del contenido, similitud del hablante y naturalidad prosódica.

En el núcleo del modelo se encuentra un tokenizador de voz novedoso que mejora una amplia gama de capacidades de comprensión y análisis del habla, incluyendo el reconocimiento automático del habla (ASR), el reconocimiento de la emoción en el habla, la identificación del idioma, la detección de eventos de audio y el análisis del hablante. Además, el modelo introduce un nuevo método de optimización de recompensa diferenciable (DiffRO) para el post-entrenamiento, que optimiza directamente los tokens de voz. Esta técnica es particularmente efectiva para los modelos de síntesis de voz basados en modelos de lenguaje de gran tamaño (LLM), permitiendo una generación de voz más precisa y expresiva.

Entrenado con un extenso conjunto de datos de 1 millón de horas de audio, el modelo está disponible en dos variantes, con 0.5 mil millones y 1.5 mil millones de parámetros respectivamente. CosyVoice 3 es compatible con nueve idiomas, incluyendo inglés, chino, alemán, español, francés, italiano, japonés, coreano y ruso. Alcanza un rendimiento de última generación (SOTA) en múltiples puntos de referencia establecidos.

leer más  Gemini 3.1 Pro: Google lanza su nuevo modelo de IA

Como modelo de generación de voz de «cero disparo», CosyVoice 3 marca un gran avance en la síntesis de voz multilingüe y de alta fidelidad, abriendo el camino a aplicaciones de voz más versátiles, naturales y conscientes del contexto en escenarios del mundo real, como asistentes virtuales, narración de audiolibros/podcasts, automatización del servicio al cliente, producción de voces en off para videos y juegos cortos, y generación de diálogo interactivo en entornos educativos.

Los desarrolladores de todo el mundo ahora pueden acceder al modelo en Hugging Face, Github y ModelScope y experimentar con el modelo en el sitio demo.

Image1

CosyVoice3 logra un rendimiento notable en la consistencia del contenido

AgentScope Lanza Actualizaciones Importantes para Agentes de IA Listos para la Producción

Alibaba Tongyi Lab ha anunciado actualizaciones a AgentScope, su marco de desarrollo de agentes de IA, centrándose en escenarios de aplicación más amplios, una infraestructura más sólida y una mejor preparación para la producción, con el fin de mejorar el desarrollo y la implementación de agentes de IA de nivel de producción.

En el lado de la aplicación, AgentScope ha evolucionado desde proporcionar capacidades fundamentales, como investigación profunda, uso del navegador y planificación, hasta ofrecer aplicaciones de agentes optimizadas para escenarios y listas para usar. Por ejemplo, Alias es un agente listo para la producción que cambia dinámicamente entre modos generales y especializados (por ejemplo, Análisis Financiero, Ciencia de Datos), admite la implementación local con un solo clic y sirve como una plantilla personalizable para soluciones específicas del dominio. EvoTraders simula equipos de inversión del mundo real y utiliza el sistema de memoria ReMe para el refinamiento de la estrategia. Tanto Alias como EvoTraders ofrecen interfaces altamente personalizables para configurar conjuntos de herramientas, indicaciones y lógica de orquestación, y se pueden utilizar directamente o ampliar para integrar herramientas, datos y flujos de trabajo empresariales propios.

leer más  Liberty Mutual: Estrategia de Datos e IA para el Crecimiento
Image2

En la capa fundamental, AgentScope introduce Agent Skill, un marco de habilidades dinámicas plug-and-play que permite a los agentes componer capacidades de forma flexible para tareas complejas. También introduce AgentScope-Studio, un entorno de desarrollo visual con flujos de mensajes de doble vista, seguimiento del estado ReAct e integración de OpenTelemetry para mejorar la eficiencia de la depuración y la experiencia del desarrollador.

Para la implementación, AgentScope-Runtime v1.0 introduce un paradigma de «caja blanca» que equilibra la facilidad de uso con la flexibilidad. Los desarrolladores ahora pueden controlar con precisión el ciclo de vida de la aplicación del agente sin sacrificar la simplicidad. El entorno de ejecución admite de forma nativa la colaboración multiagente, permitiendo compartir sesiones, memoria y conjuntos de herramientas personalizables para una coordinación eficiente e incluso permite la orquestación entre marcos para garantizar la coherencia desde el desarrollo hasta la producción. También cuenta con una matriz de sandbox compuesta por múltiples tipos, que cubre entornos locales y en la nube en una variedad de tipos de dispositivos, proporcionando una ejecución segura y aislada para el control del navegador, las operaciones de archivos y la automatización móvil, todo ello con extensibilidad basada en MCP.

El ecosistema AgentScope también incluye SparkChat con una interfaz web integrada para la interacción visual instantánea y AgentScope-Java v1.0 para pilas Java empresariales.

Las últimas actualizaciones de AgentScope ya están disponibles públicamente en GitHub, ofreciendo a las empresas y a los desarrolladores acceso a un ecosistema de desarrollo de agentes más robusto y listo para la producción.

Qoder Lanza el Plan Teams para Acelerar la Codificación de IA de Nivel Empresarial

leer más  B-Human: Robots campeones de fútbol humanoide en Alemania

Qoder, una plataforma de codificación agentic construida para el desarrollo de software del mundo real, ha lanzado Qoder Teams, un nuevo plan diseñado para empoderar a empresas de diferentes tamaños con un desarrollo impulsado por IA escalable, seguro y listo para la producción.

El plan Teams ofrece capacidades de nivel empresarial, incluyendo servicios de conocimiento avanzados, mayor conciencia del contexto y desarrollo basado en especificaciones. También ofrece una suite flexible de herramientas, como el IDE de Qoder, el plugin de Qoder para IDEs JetBrains y la CLI de Qoder, para integrarse sin problemas en diversos flujos de trabajo del equipo y entornos de desarrollo existentes.

Las características empresariales clave mejoran aún más la oferta: facturación centralizada, integración de inicio de sesión único (SSO) y el próximo soporte para grupos de créditos compartidos. Con esta próxima funcionalidad, las organizaciones podrán comprar créditos de IA de forma colectiva y asignarlos dinámicamente a los equipos, permitiendo una gestión de recursos flexible y basada en el uso.

Al integrar las funciones de IA en el entorno de desarrollo, Qoder ayuda a los equipos de ingeniería a optimizar la codificación, reducir el cambio de contexto y acelerar la entrega, todo ello sin comprometer la seguridad ni la calidad del código.

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.