Datenknappheit bremst die KI-Innovation im Industriesektor. Unser Partner NETZSCH, ein zukunftsorientiertes Unternehmen, das über seine Corporate-Venturing-Einheit NEDGEX neue Geschäftsmodelle im Industriesektor erkundet, hat sich mit uns zusammengeschlossen, um die Grenzen der KI-Datengenerierung in der Maschinenbauindustrie zu erweitern.
Diese Zusammenarbeit zielte darauf ab, eine häufige Herausforderung in KI-Projekten anzugehen: den Mangel an Trainingsdaten. Daher wollten wir eine Lösung entwickeln, die die Generierung von KI-Trainingsdaten mithilfe von CAD-Dateien automatisiert und ein KI-Training von Anfang bis Ende, ausgehend von einem CAD-Modell, ermöglicht.
Herausforderung
Das Training von KI-Modellen erfordert enorme Mengen an präzisen Daten, doch viele Industrieunternehmen stehen vor der Herausforderung, diese Datensätze effizient und kostengünstig zu produzieren. Obwohl CAD-Dateien für Teile und Maschinen in der Regel verfügbar sind, ist der manuelle Prozess der Generierung von Trainingsdaten—wie das Aufnehmen von Fotos und deren Kennzeichnung—zeitaufwändig und kostspielig und steht oft in keinem Verhältnis zu den erzielten Ergebnissen. Diese Ineffizienz stellt eine erhebliche Hürde für schnelle und erschwingliche KI-Entwicklung dar und begrenzt das Innovationspotenzial.
Wir wollten dieses Problem lösen, indem wir den Prozess der Generierung von Trainingsdaten aus CAD-Dateien automatisierten, sodass KI-Modelle ohne Zugriff auf reale Daten trainiert werden können. Die Vision war klar: CAD-Dateien auf eine Plattform hochladen, die erforderlichen Trainingsdaten generieren und den KI-Trainingsprozess automatisieren—all das über eine einzige Schnittstelle.
Lösung
Wir leiteten die technische Entwicklung dieser Lösung, indem wir ein System aufbauten, das es Benutzern ermöglicht, CAD-Dateien hochzuladen, die dann durch eine Pipeline verarbeitet werden, um hochwertige Trainingsdaten für KI-Modelle zu erstellen.
Die Architektur wurde für Skalierbarkeit und Benutzerfreundlichkeit entworfen. Nachdem die CAD-Dateien hochgeladen wurden, werden sie in ein gemeinsames Format normalisiert und dann durch eine Reihe von Schritten geleitet. Diese Schritte beinhalten die Verwendung von Blender zur Simulation und zum Rendern von Bildern mit unterschiedlichen Materialien, Texturen, Winkeln, Beleuchtung und Zoomstufen. Das Endergebnis ist ein standardisierter Datensatz, der direkt innerhalb der Plattform zum Trainieren von KI-Modellen verwendet wird.
Wir nutzten Docker für die Containerisierung, um sicherzustellen, dass das System Aufgaben je nach Infrastrukturbedarf sowohl sequenziell als auch parallel effizient verwalten kann. Durch die Vorbereitung des Backends für Orchestrierungstools wie Kubernetes, HashiCorp Nomad und Docker Swarm stellten wir sicher, dass das System mit wachsender Nachfrage skalieren kann. Der gesamte Prozess—von der Datennormalisierung über das Rendern von Bildern bis hin zum KI-Training—läuft automatisch ab, ohne dass menschliches Eingreifen erforderlich ist.
Ergebnis
Dieser innovative Ansatz führte zur Erstellung eines voll funktionsfähigen Prototyps und bewies, dass KI-Training durch automatisierte Datengenerierung nicht nur machbar, sondern auch hocheffizient ist. Benutzer können nun CAD-Dateien hochladen, Datensätze generieren und nahtlos voll trainierte KI-Modelle erhalten—all das ohne den Bedarf an realen Daten.
Durch die Automatisierung der Datengenerierung und des KI-Trainings zeigte das Projekt das Potenzial, die Datenknappheit—eine große Hürde im Industriesektor—zu überwinden. Dadurch ist der Grundstein gelegt, um ähnliche Lösungen in Branchen zu skalieren, in denen der Zugang zu Trainingsdaten ein kritischer Engpass ist.
Wenn Ihr Unternehmen daran interessiert ist, innovative KI-Lösungen zu erkunden und datenbezogene Herausforderungen zu überwinden, ist NeuroForge bereit, Ihre Ideen zum Leben zu erwecken. Kontaktieren Sie uns, um zu erfahren, wie wir Ihnen helfen können, die Kraft der KI mit maßgeschneiderten Lösungen zu nutzen, die auf Ihre Bedürfnisse zugeschnitten sind.