Neuigkeiten Timeline

Immobilien
Juni 3, 2026

Lebensmittelmarkt Immobilien Makler

Computer, Information, Telekommunikation
Juni 3, 2026

Parasoft beseitigt Abhängigkeitsengpässe bei Softwarebereitstellung

Unternehmen, Wirtschaft, Finanzen
Juni 3, 2026

TGI AG Investieren in Gold: FMA – Anordnung gegen die TGI AG – fachanwaltliche Vertretung – Rückabwicklung der Goldmodelle

Immobilien
Juni 3, 2026

Supermarkt Immobilien Makler: Holger Ballwanz Immobilien

Tourismus, Reisen
Juni 3, 2026

Urlaub mit Hund – neues Buch bei Amazon für alle Hundebesitzer und die es werden möchten

Unternehmen, Wirtschaft, Finanzen
Juni 3, 2026

Rockstone News – Homerun Resources: Die Entstehung des Silica Valley in Bahia

Garten, Bauen, Wohnen
Juni 3, 2026

Beton-Pumpen-Service & Verleih löst alle Probleme

IT, NewMedia, Software
Juni 3, 2026

SEPPmail auf der Public-IT-Security 2026: sichere E-Mail-Kommunikation für Behörden und öffentliche Verwaltung

Freizeit, Buntes, Vermischtes
Juni 3, 2026

Reisen mit den Vierbeinern: Das sind die haustierfreundlichsten beliebten Urlaubsdestinationen

IT, NewMedia, Software
Juni 3, 2026

Untersuchung von Censys: 6.502 Tankfüllstandsmesser in Tankstellen öffentlich über das Internet erreichbar

Umwelt, Energie
Juni 3, 2026

Entgasung und Spülung von LNG-Tanks: sicherer Umgang mit LNG

IT, NewMedia, Software
Juni 3, 2026

HiScout mit Modul für Geheim und Sabotageschutz für GIT SICHERHEIT AWARD nominiert

IT, NewMedia, Software
Juni 3, 2026

Alternative zu Palantir: Neo4j übernimmt GraphAware und startet graphbasierte Analyseplattform

IT, NewMedia, Software
Juni 3, 2026

Vom SEF-Netzwerk in die Produktion: PS Industry setzt ganzheitliche Digitalisierungsstrategie um

Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark

OvAItion Private LLM verbessert sich im Q4-Benchmark trotz höherer Datenkomplexität deutlich und rückt erstmals in den Leistungsbereich führender Modelle vor – bei voller Datenhoheit und C5-Sicherheit.

Spezialisierung schlägt Größe: Insiders Technologies veröffentlicht neuen LLM-Benchmark

Insiders Technologies veröffentlicht aktuellen Benchmarking-Report.

Kaiserslautern, 11. Dezember 2025 – Insiders Technologies, technologisch führender Anbieter von Software für Intelligent Automation (IA), kann in der neuesten, vierten Ausgabe seines LLM Benchmarks einen deutlichen Qualitätssprung des eigenen OvAItion Private LLM verzeichnen. Das Modell verbessert sich trotz verdoppeltem Datenumfang und erheblich komplexerer Dokumente um mehr als zwei Prozentpunkte gegenüber dem Vergleich im dritten Quartal und rückt erstmals in den Leistungsbereich von Top-Modellen wie Claude 4.5 Haiku vor. Generell zeichnet der Benchmark ein klares Bild: Die entscheidenden Fortschritte im IDP-Umfeld entstehen zunehmend durch Spezialisierung, nicht durch immer größere Foundation-Modelle.

Das OvAItion Private LLM vereint hohe Performance mit voller Datenhoheit, C5-zertifizierter Sicherheit und stabilen Verarbeitungszeiten. Es wird künftig das bisherige Private LLM ablösen und weiter auf die IDP-Anforderungen der Insiders Kunden und Partner zugeschnitten. Laufendes Finetuning, optimierte Trainings und zusätzliche Daten basierend auf jahrelanger Erfahrung sorgen auch in Zukunft für eine kontinuierliche Verbesserung.

Die Spitze rückt zusammen – mit verlangsamtem Fortschritt und Schwachpunkten

Im vierten Quartal hat Insiders Technologies das Benchmarking deutlich erweitert. Dazu wurde der Testdatensatz nahezu verdoppelt und um anspruchsvollere Dokumententypen ergänzt. Dadurch sank das generelle Score-Niveau leicht, die Aussagekraft konnte im Hinblick auf reale produktive Workflows jedoch erneut gesteigert werden. Insgesamt testete das Team im vierten Quartal 24 Large Language Modelle, darunter Claude 4.5 Sonnet, GPT-5.1 und Gemini 3 Pro. Modelle mit überholten Nachfolgern oder geringerem Relevanzbezug wurden nicht berücksichtigt.

Die Ergebnisse zeigen ein immer enger zusammenrückendes Spitzenfeld: Viele Modelle bewegen sich im Bereich 80 bis 88 Punkte. Foundation-Modelle, die bewusst breit aufgestellt sind und auf riesigen, oft unspezifischen Daten trainiert werden, liefern weiterhin gute Resultate, doch der Fortschritt verlangsamt sich hier. Reasoning-Modelle erreichen zwar hohe Scores, sind im laufenden IDP-Betrieb aber häufig zu langsam oder zu kostenintensiv. Datenschutz bleibt zudem ein zentraler Schwachpunkt global gehosteter Modelle. Obwohl der Anteil in der EU betriebener Modelle im Benchmark bewusst steigt, bleibt er im Markt nach wie vor gering.

Die wichtigsten Erkenntnisse des Q4-Benchmarks:

– die Entwicklung großer Foundation-Modelle stagniert im IDP-Kontext
– reine Reasoning-Modelle sind leistungsstark, aber betrieblich schwer planbar
– echte Fortschritte kommen aus Spezialisierung und gezielten Trainingsmethoden
– Performance und regulatorische Sicherheit bleiben selten in Einklang
– das OvAItion Private LLM erzielt den eindeutig größten Fortschritt im Feld

Der Benchmark stärkt den Best-of-Breed-Ansatz von Insiders. Über die OvAItion Engine können Unternehmen LLMs flexibel kombinieren und nach Kriterien wie Performance, Latenz, Kosten oder Dunkelverarbeitung auswählen. Funktionen wie Green Voting sorgen für automatische Validierung und geringere Nachbearbeitung. Kunden müssen sich damit nicht zwischen Leistung und Sicherheit entscheiden, sondern können die jeweils beste Modellkombination für ihre Prozesse einsetzen.

„Man braucht nicht automatisch die neuesten oder teuersten Modelle, um im IDP-Einsatz gute Ergebnisse zu erzielen“, erklärt Dr. Alexander Lück, Team OvAItion/Data Management und Verantwortlicher für das LLM Benchmarking bei Insiders Technologies. „Unser Vergleich zeigt wieder, dass der größte Qualitätssprung nicht von generischen Foundation-Modellen, sondern von modellseitiger Spezialisierung kommt. Immer wichtiger werden zudem Kriterien wie Datenhoheit, Sicherheit, Stabilität, Anpassbarkeit und kontrollierbare Kosten.“

Die vollständige Benchmarking-Ausgabe Q4 2025 bietet einen aktuellen Überblick über die Leistungsfähigkeit der relevanten Modelle und dient als verlässliche Orientierung für IDP-Verantwortliche. Für individuelle Benchmarkings mit eigenen Use Cases stehen die KI-Expertinnen und -Experten von Insiders zur Verfügung.

Hier kann das Insiders LLM Benchmarking Q4-2025 kostenlos bezogen werden:
https://insiders-technologies.com/de/insiders-llm-benchmarking-dezember-2025/

Weitere Informationen über den Hersteller intelligenter Software für Prozessautomatisierung auf Basis von KI: https://www.insiders-technologies.com/

Insiders Technologies ist technologisch führender und marktetablierter Anbieter von Software zur intelligenten Automatisierung von Geschäftsprozessen (Intelligent Automation, IA). Mehr als 6.000 Kunden aus allen Branchen vertrauen bei der Optimierung ihrer dokumentzentrierten Geschäftsprozesse auf die innovativen Lösungen des Produkthauses aus Kaiserslautern. Als erfolgreichstes Spin-Off des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) hat es sich Insiders zur Aufgabe gemacht, modernste KI in echten Kundennutzen zu überführen. Dank neuester Deep Learning-Technologien verstehen die Software-Lösungen heterogene Inhalte, extrahieren geschäftsrelevante Informationen, automatisieren Transaktionen und verkürzen Reaktionszeiten. Dabei sind der technologische Pioniergeist und die Agilität ein Garant für kontinuierliche Innovationen und Produkte am Puls der Zeit. https://www.insiders-technologies.com/

Firmenkontakt
Insiders Technologies GmbH
Lisa Holländer
Brüsseler Str. 1
67657 Kaiserslautern
+49 631 92081 1620
https://www.insiders-technologies.com/

Pressekontakt
bloodsugarmagic GmbH & Co. KG
Bernd Hoeck
Gerberstr. 63
78050 Villingen-Schwenningen
+49 7721 9461 220
http://www.bloodsugarmagic.com

(Visited 23 times, 1 visits today)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert