Datenverarbeitungslösungen

Datenverarbeitung

Für KI geeignete Daten-Engines.

NVIDIA cuDF | NVIDIA cuVS

Überblick

Neue Datenanforderungen

Um Ihr Unternehmen zu transformieren, benötigen KI-Agenten kontinuierlich Zugriff auf Ihre Daten, was die Dateninfrastruktur belastet, die nicht für agentische Reasoning-Schleifen entwickelt wurde.

Durch eine beschleunigte Verarbeitung unstrukturierter und strukturierter Daten mit NVIDIA cuDF und NVIDIA cuVS können Unternehmen den neuen KI-Anforderungen hinsichtlich Datenvolumen und -geschwindigkeit gerecht werden und ihre über Jahre hinweg aufgebaute Dateninfrastruktur nutzen.

Die weltweit beliebtesten Daten-Engines laufen auf der beschleunigten Computing-Plattform und ermöglichen es Agenten, im gesamten Unternehmen auf strukturierte Daten aus Tabellen und unstrukturierte Daten aus PDFs, E-Mails, Bildern und Videos zuzugreifen.

NVIDIA cuDF und cuVS werden von weltweit führenden Datenplattformen eingesetzt

Erfahren Sie, wie führende Datenplattformen NVIDIA cuDF und cuVS nutzen, um strukturierte Analysen und unstrukturierte Vektorsuche für KI-fähige Daten zu beschleunigen.

Vorteile

Transformieren Sie Ihre Daten für KI

Enorme Leistungssteigerungen

Die beschleunigte Computing-Plattform bietet eine bis zu 20-fache Beschleunigung der Datenverarbeitung und ermöglicht es Unternehmen, bei neuen Anwendungsfällen schneller zu agieren.

Signifikante Kosteneinsparungen

Durch die Ausführung auf dem NVIDIA-optimierten Stack konnten Unternehmen 80 % der Kosten oder mehr einsparen, sodass Ihre Dateninfrastruktur mit weniger Aufwand mehr leisten kann.

Einfach zu implementieren

Die weltweit beliebtesten Analyse- und Vektordaten-Engines verfügen über Drop-in-Beschleuniger, um die Einführung zu erleichtern, dazu gehören Apache Spark, OpenSearch und andere.

KI-fähige Daten

Da 90 % der Daten von Unternehmen in Form von PDF-Dateien, Nachrichten und E-Mails mit NVIDIA cuVS vorliegen, und dank der Referenzdaten aus Terabytes strukturierter Daten, die mit NVIDIA cuDF in wenigen Minuten verarbeitet werden, sind Ihre Daten bereit für agentische KI.

Produkte

CUDA-X für Datenverarbeitung

cuDF und cuVS sind CUDA-X™-Toolkits, die auf hochoptimierten CUDA®-Primitiven basieren, um das Datenverarbeitungsökosystem zu beschleunigen.

cuDF für strukturierte Daten

  • Beschleunigt Analyse-Engines auf NVIDIA-GPUs
  • Beinhaltet Drop-in-Beschleuniger für Apache Spark, Presto, Polars und DuckDB
  • Führt analytische Abfragen in Minuten statt Stunden aus

cuVS für unstrukturierte Daten

  • GPU-beschleunigte Vektorsuche und Indexerstellung für RAG- und KI-Pipelines
  • Integriert sich in OpenSearch, Elastic, Milvus etc.
  • Reduziert die Erstellungszeit von Vektorindizes von Stunden auf Minuten

Benutzer

Datenverarbeitungsökosystem

Von analytischen SQL-Abfragen bis hin zur Vektorsuche implementieren Unternehmen die beschleunigte Computing-Plattform von NVIDIA in ihre bestehenden Datenplattformen, um KI-fähige Pipelines zu beschleunigen.

Datenverarbeitung auf NVIDIA Vera

Für Unternehmen, die agentische KI-Workloads in großem Maßstab ausführen, ermöglichen KI-Agenten eine drastische Steigerung der gleichzeitigen, kontinuierlichen Abfragen strukturierter Unternehmensdaten kleinerer Größenordnung. NVIDIA Vera verfügt über eine Speicherbandbreite von 1,2 TB/s und eine Hochgeschwindigkeits-On-Chip-Fabric, die eine hohe Leistung pro Kern, einen hohen Durchsatz und Vorhersagbarkeit unter Last bietet und somit das gestiegene Volumen und die höhere Geschwindigkeit von Abfragen unterstützt. Für die Starburst-Analyse-Engine hat NVIDIA Vera im Vergleich zu x86 Abfragen dreimal schneller verarbeitet und die Abfrageausführung von Minuten auf Sekunden reduziert, während die Streaming-Engine Redpanda eine sechsfache Verbesserung bei p99 im Vergleich zu x86 verzeichnet hat, was die Zuverlässigkeit der Daten-Engine erhöht.

IN KÜRZE VERFÜGBAR.

Ressourcen

Das Neueste in der Datenverarbeitung

NVIDIA cuDF und cuVS werden von weltweit führenden Datenplattformen eingesetzt

Die beschleunigte Computing-Plattform von NVIDIA treibt die moderne Unternehmensdatenverarbeitung voran. Diese Bibliotheken sind in die weltweit am häufigsten verwendeten Open-Source-Daten-Engines integriert. Sie werden monatlich über 200 Millionen Mal von Entwicklern heruntergeladen und in verschiedenen Unternehmensdatenplattformen, Datenbanken und Data Lakes genutzt.

Wie Snap A/B-Tests mit NVIDIA cuDF skaliert hat

Snap verarbeitet täglich mehr als 10 Petabyte für A/B-Tests bei über 940 Millionen Benutzern. Die Beschleunigung von Apache Spark mit NVIDIA cuDF auf Google Cloud führte zu 4-mal schnelleren Laufzeiten und einer Kosteneinsparung von 76 %.

Beschleunigung umfangreicher Analysen mit Velox und NVIDIA cuDF

IBM und NVIDIA integrieren cuDF in die Velox-Ausführungs-Engine, wodurch eine GPU-native Abfrageausführung für Presto und Apache Spark ermöglicht wird und eine bis zu 12-mal schnellere Analyse als bei reinen CPU-Systemen.

Daten sind die Grundlage und der Kontext für KI

Erfahren Sie, welche Gedanken CEO Jensen Huang zur Rolle des Datenverarbeitungsökosystems im Zeitalter der agentischen KI hat.

IBM erfindet die Datenverarbeitung neu

Die SQL-Analyse-Engine Presto von IBM watsonx.data erreicht durch cuDF eine 5-fache Beschleunigung und eine Kosteneinsparung von 83 %.

Verarbeitung von 100 Millionen Datenzeilen in unter 2 Sekunden mit Polars

Die GPU-Engine von Polars führt Polars-Code auf GPUs aus und sorgt so für massive Geschwindigkeitssteigerungen.

Nächste Schritte

Sie möchten mehr erfahren?

Erhalten Sie aktuelle Neuigkeiten, Inhalte und Veranstaltungshinweise zum Thema Datenverarbeitung.

cuDF

Ein Open-Source-Toolkit für strukturierte Daten, das GPU-Parallelität und Speicherbandbreite nutzt, um Datenverarbeitungs- und Analyseabläufe zu beschleunigen.

cuVS

Open-Source-Bibliothek für unstrukturierte Vektorsuche und Daten-Clustering, die schnellere Vektorsuchen und Indexerstellung ermöglicht.

Melden Sie sich an, um Neuigkeiten aus der Welt der Datenwissenschaft zu erfahren