Manchmal hat man das Gefühl, KI sei einfach nur ein weiteres Tool im Werkzeugkasten. Kurz installieren, ein bisschen trainieren, fertig. Wer so denkt, wird auf die Nase fallen – früher oder später. Denn KI ist kein Plugin. Sie verändert, wie wir Software denken, wie wir Systeme bauen, wie wir Produktarchitektur gestalten.
Ein bekanntes Problem: Unternehmen wollen KI einsetzen, sind aber architektonisch nicht vorbereitet. Selbst wenn das Proof of Concept läuft, scheitert es dann aber an der Integration. Warum? Weil der Tech-Stack nicht mitgedacht wurde. Oder schlimmer: Weil man dachte, es brauche gar keinen neuen Stack. Die Folge: Teure Proof of Concepts, die nie produktiv gehen, und eine wachsende Kluft zwischen dem, was KI leisten könnte, und dem, was die IT-Infrastruktur zulässt. Deswegen gehen wir mit unseren Kunden das Thema KI Integration holistisch an. Wenn sie mit dem AI Supercharger Programm starten, begleiten wir sie immer mit Experten aus Strategie und Entwicklung, sodass ihr KI-Projekt auch wirklich nachhaltig im Unternehmen funktioniert und den gewünschten Mehrwert bringt.
So sieht ein KI-Stack im besten Fall aus
Ein KI-System besteht nicht nur aus einem Modell. Es ist ein Ökosystem und es braucht Struktur. Das genaue Stack passen wir immer an das individuelle Projekt an, doch grundsätzlich wird das Tech Stack bei uns in vier Ebenen unterteilt:
Datenebene
Alles steht und fällt mit den Daten. Es ist die Grundlage für alles rund um Zugriff, Qualität, Format und Datenschutz. Ohne gutes Data Engineering kannst du den Rest direkt lassen.
Modellebene
Hier denken die meisten dann an KI-Entwicklung: Foundation Models, Fine-Tuning, Retrieval. Aber: Nur weil ein Modell groß ist, heißt das nicht, dass es passt. Die Kunst liegt in der Auswahl, Kombination und Anpassung. Und ja, manchmal reicht auch ein kleineres Modell, wenn es richtig integriert ist.
Applikationsebene
Was bekommt der User eigentlich zu sehen? Gute KI braucht klare Interaktion: APIs, Chat-UIs, Kontextsteuerung. Wir achten bewusst darauf, dass die KI nicht überladen ist, sondern genau auf die Bedürfnisse der Nutzer:innen ausgelegt ist und natürlich auch ihre Erfahrungen mit dem Umgang mit KI. Die KI kann noch so gut sein, wenn die User Experience schlecht ist, wird sie nicht verwendet.
Infrastruktur
Cloud, On-Prem, Hybrid? Die Wahl der richtigen Infrastruktur kommt ganz auf die Bedürfnisse des Unternehmens an: Manche Kunden brauchen volle Kontrolle, andere wollen Geschwindigkeit und Skalierung. Wichtig ist, dass der Stack flexibel bleibt, inklusive Updatefähigkeit, Versionierung und DevOps-Prozesse. Dabei spielen auch Faktoren wie Kosten und Energieeffizienz eine entscheidende Rolle, denn die Wahl der Infrastruktur bestimmt direkt die laufenden Betriebskosten eines KI-Systems.
Eine übergreifende Ebene: Governance und Sicherheit
Quer über alle vier Ebenen liegt ein entscheidender Aspekt: Governance. Wer darf auf welche Daten zugreifen? Wie stellen wir sicher, dass die KI fair und nachvollziehbar agiert (Responsible AI)? Wie schützen wir Modelle und APIs vor Missbrauch? Diese Fragen müssen von Anfang an in der Architektur verankert werden, um Compliance und Vertrauen sicherzustellen.
Bau den Stack von Anfang an mit. Nicht als Add-on, sondern als zentrales Architekturkonzept.
Self-Hosting vs. API
Die große Frage: Willst du die Kontrolle oder die Bequemlichkeit?
Open Source Modelle wie LLaMA geben dir volle Kontrolle, sind aber wartungsintensiv. Dafür kannst du genau steuern, wie deine Daten genutzt werden. Das ist ein riesen Thema, gerade im B2B.
Proprietäre APIs wie OpenAI oder Anthropic bieten fantastische Performance, schnelle Integration und weniger Infrastruktur-Overhead. Aber du musst ihnen vertrauen, technisch wie vertraglich.
Was machen wir bei SHAPE?
Kommt drauf an. Für Use Cases mit sensiblen Daten oder speziellen Anforderungen bauen wir eigene Pipelines mit gehosteten Modellen. Für schnelle Prototypen oder Marketing-Cases setzen wir auf APIs. Wichtig ist: Unternehmen müssen ganz klar auswählen, welche Art von KI die Richtige für ihren Use Case ist. Aber keine Sorge, unsere KI-Experten nehmen solche Themen mit in der Beratung auf.
Skalierbarkeit und Wartbarkeit
Ein 70-Milliarden-Parameter-Modell klingt erstmal geil, bis du es hosten musst. Das Hosting eines solchen Modells kann schnell Hardware-Kosten im fünf- bis sechsstelligen Bereich verursachen, noch bevor die erste Anfrage verarbeitet wurde.
Größer ist nicht immer besser. Genau wie bei der üblichen Softwareentwicklung ist Skalierbarkeit und Wartbarkeit ein wichtiges Thema, um ein digitales Produkt für langfristige Funktionalität zu bauen. Komplexe Software muss gut strukturiert sein, sodass sich zukünftige Updates und Erweiterungen problemlos integrieren lassen.
Modellgrößen und Infrastruktur müssen zur Realität passen. Auch was Energieverbrauch, Inferenzzeit oder Latenz angeht. Wer alles selbst hostet, braucht mehr als eine GPU. Und zwar nicht nur technisch, auch personell.
CI/CD für KI sind ein Muss. Modelle entwickeln sich weiter, neue Versionen gibt es alle paar Monate und die Prompting-Strategien ändern sich. Daher brauchst du ein unbedingt System, das mitlernt, nicht eines, das nach drei Monaten veraltet ist.
Testbarkeit und Monitoring sind nicht nice-to-have. Sie sind Pflicht. Sonst hast du ein Blackbox-System, das niemand mehr versteht.
Integration in bestehende Systeme
Die größte Herausforderung ist fast nie das Modell. Es ist die Integration.
Bei SHAPE denken wir KI nicht als separate Schicht, sondern als „Inside-Komponente“. Sie muss in Prozesse zurückwirken, nicht nur als Output, sondern als Teil des Systems. Das gelingt nur mit einem stabilen Architektur-Setup, das APIs sauber nutzt und auf Events reagieren kann.
Fazit
Wer heute KI einführen will, muss den Stack gleich mitdenken. Architektur ist längst nicht mehr nur Technik, sondern gehört zur langfristigen Strategie. Sie entscheidet, ob deine KI-Initiative Wirkung entfaltet, oder als Proof of Concept in der Schublade landet.
Wenn du wissen willst, wie ein moderner KI-Stack bei dir aussehen kann: Sag Bescheid. Oder noch besser, lass uns direkt gemeinsam reinschauen.
Du willst sofort loslegen? Dann schau dir unser AI Supercharger Programm an. Drei Schritte, die dich strukturiert und praxisnah KI-ready machen, ohne Buzzword-Bingo.
Starte mit dem AI Quick Check und finde in fünf Minuten heraus, wo dein Unternehmen aktuell steht. Kostenlos, anonym und ohne E-Mail.
Und wenn du danach direkt einsteigen willst, schick uns einfach eine Mail. Wir setzen uns zusammen und machen deine Architektur fit für KI.
Roman Petersen Chief Technology Officer
Roman entwickelt maßgeschneiderte Lösungen – für nachhaltige, innovative Produkte mit Mehrwert.