Soluciones de procesamiento de datos

Procesamiento de datos

Motores de datos listos para la IA.

NVIDIA cuDF | NVIDIA cuVS

Descripción

Nuevas demandas de datos

Para transformar su empresa, los agentes de IA necesitan acceso continuo a sus datos, lo que sobrecarga la infraestructura de datos no diseñada para bucles de razonamiento de agentes.

Al acelerar el procesamiento de datos estructurados y no estructurados con NVIDIA cuDF y NVIDIA cuVS, las empresas pueden satisfacer las nuevas exigencias de volumen y velocidad de datos de la IA, al tiempo que aprovechan la infraestructura de datos en la que han invertido durante años.

Los motores de datos más populares del mundo se ejecutan en la plataforma de computación acelerada, lo que ayuda a los agentes a acceder a datos estructurados en forma de tablas y datos no estructurados en forma de archivos PDF, correos electrónicos, imágenes y vídeos en toda la empresa.

NVIDIA cuDF y cuVS adoptados por las principales plataformas de datos del mundo

Descubra cómo las principales plataformas de datos utilizan NVIDIA cuDF y cuVS para acelerar el análisis estructurado y la búsqueda vectorial no estructurada de datos listos para IA.

Ventajas

Transforme sus datos para la IA

Aumentos masivos de rendimiento

La plataforma de computación acelerada proporciona una aceleración hasta 20 veces superior para el procesamiento de datos, lo que permite a las empresas actuar con mayor rapidez con nuevos casos de uso. 

Ahorro de costes significativo

Al ejecutarse en la pila optimizada de NVIDIA, las organizaciones han ahorrado un 80 % en costes o más, lo que ayuda a su infraestructura de datos a hacer más con menos.

Fácil de adoptar

Los motores de análisis y datos vectoriales más populares del mundo tienen aceleradores directos para facilitar la adopción, incluidos Apache Spark, OpenSearch y más.

Datos listos para la IA

Con el contexto del 90 % de los datos empresariales almacenados en archivos PDF, mensajes y correos electrónicos con NVIDIA cuVS, y los datos de referencia de terabytes de datos estructurados procesados en minutos con NVIDIA cuDF, sus datos están listos para la IA de agentes. 

Productos

CUDA-X para procesamiento de datos

cuDF y cuVS son kits de herramientas CUDA-X™ y se basan en primitivas de CUDA® altamente optimizadas para acelerar el ecosistema de procesamiento de datos.

cuDF para datos estructurados

  • Acelera los motores de análisis en las GPU de NVIDIA
  • Incluye aceleradores directos para Apache Spark, Presto, Polars y DuckDB 
  • Ejecuta consultas analíticas en minutos en lugar de horas

cuVS para datos no estructurados

  • Búsqueda vectorial acelerada por GPU y creación de índices para canalizaciones de RAG e IA
  • Se integra con OpenSearch, Elastic, Milvus y más
  • Reduce los tiempos de creación de índices vectoriales de horas a minutos

Usuarios

Ecosistema de procesamiento de datos

Desde consultas SQL analíticas hasta búsquedas vectoriales, las organizaciones están adoptando la plataforma de computación acelerada de NVIDIA en sus plataformas de datos existentes para acelerar las canalizaciones listas para la IA.

Procesamiento de datos con NVIDIA Vera

En el caso de las empresas que ejecutan cargas de trabajo de la IA de agentes a escala, los agentes de IA aumentan drásticamente las consultas simultáneas y continuas a pequeña escala de datos empresariales estructurados. NVIDIA Vera tiene 1,2 TB/s de ancho de banda de memoria y una interconexión de alta velocidad en el chip que proporciona el rendimiento por núcleo, el alto rendimiento y la previsibilidad con carga que admite el mayor volumen y velocidad de las consultas. En el caso del motor de análisis Starburst, NVIDIA Vera procesó las consultas 3 veces más rápido en comparación con x86, lo que redujo la ejecución de las consultas de minutos a segundos, mientras que el motor de transmisión Redpanda experimentó una mejora de 6 veces en p99 en comparación con x86, lo que mejora la fiabilidad del motor de datos.

PRÓXIMAMENTE.

Recursos

Lo último en procesamiento de datos

NVIDIA cuDF y cuVS adoptados por las principales plataformas de datos del mundo

La plataforma de computación acelerada de NVIDIA está impulsando el procesamiento moderno de datos empresariales. Estas bibliotecas se integran con los motores de datos de código abierto más utilizados del mundo (los desarrolladores las descargan más de 200 millones de veces al mes) y se aprovechan en todas las plataformas de datos empresariales, bases de datos y lagos de datos.

Cómo Snap escaló las pruebas A/B con NVIDIA cuDF

Snap procesa más de 10 petabytes al día para pruebas A/B con más de 940 millones de usuarios. La aceleración de Apache Spark con NVIDIA cuDF en Google Cloud proporcionó tiempos de ejecución 4 veces más rápidos y un ahorro de costes del 76 %.

Aceleración del análisis a gran escala con Velox y NVIDIA cuDF

IBM y NVIDIA integran cuDF con el motor de ejecución Velox, lo que permite ejecutar consultas nativas de GPU para Presto y Apache Spark, lo que proporciona análisis hasta 12 veces más rápidos que los sistemas que solo utilizan CPU.

Los datos son la verdad de fondo y el contexto para la IA

Escuche las opiniones del director ejecutivo Jensen Huang sobre el papel del ecosistema de procesamiento de datos en la era de la IA de agentes.

IBM reinventa el procesamiento de datos

El motor de análisis SQL de IBM watsonx.data Presto se acelera con cuDF para lograr un incremento de velocidad de 5 veces y un ahorro de costes del 83 %.

Procesamiento de 100 millones de filas de datos en menos de 2 segundos con Polars

Polars GPU Engine ejecuta código de Polars en las GPU para lograr aceleraciones masivas.

Próximos pasos

¿Desea obtener más información?

Obtenga las últimas noticias sobre procesamiento de datos, contenido y eventos.

cuDF

Kit de herramientas de código abierto para datos estructurados que utiliza el paralelismo de GPU y el ancho de banda de memoria para acelerar los flujos de trabajo de procesamiento y análisis de datos.

cuVS

Biblioteca de código abierto para búsqueda vectorial no estructurada y agrupación de datos que permite búsquedas vectoriales y creaciones de índices más rápidas.

Regístrate para recibir noticias sobre ciencia de datos