Wissen, das die Maschine versteht

Shownotes

Eine Art Landkarte für Wissen: Personen, Firmen, Dinge als Knoten, Verbindungen dazwischen. So funktionieren Wissensgraphen und sie stecken heute hinter rund 30 Prozent aller Google-Anfragen. In der neuen Folge von "Wissen2Wirtschaft …und zurück" spricht Selina Hare mit Prof. Dr. Axel Ngonga, einem der weltweit führenden KI-Wissenschaftler und Leiter der Fachgruppe Data Science am Heinz Nixdorf Institut der Universität Paderborn.

Es geht um Wissensgraphen als Grundlage für erklärbare KI, um die Frage, warum Sprachmodelle uns so oft nach dem Mund reden, um den Lebenszyklus von KI und darum, wie kleine und mittlere Unternehmen konkret von KI profitieren können. Außerdem verrät Ngonga, was er als Musiker von KI-generierter Musik hält.

Jetzt reinhören! "Wissen2Wirtschaft" – den Podcast der Universität und der Wirtschaftsförderung Paderborn – gibt's überall, wo es Podcasts gibt.

Alle Infos: www.wissen2wirtschaft.de

Prof. Dr. Axel Ngonga

Kontakt: https://www.uni-paderborn.de/person/65716

Heinz Nixdorf Institut

Website: https://www.hni.uni-paderborn.de/
LinkedIn: https://www.linkedin.com/company/heinz-nixdorf-institut/

SFB/TRR 318 "Constructing Explainability"

Website: https://trr318.uni-paderborn.de/
LinkedIn: https://www.linkedin.com/company/trr-318-constructing-explainability/

Wirtschaftsförderung Paderborn

Website: https://wfg-pb.de/
LinkedIn: https://www.linkedin.com/company/wfg-pb/
Instagram: https://www.instagram.com/wfg.paderborn/
Facebook: https://www.facebook.com/WFGPB

Universität Paderborn

Website: https://uni-paderborn.de/
LinkedIn: https://www.linkedin.com/school/uni-paderborn/
Instagram: https://www.instagram.com/uni_paderborn/
Facebook: https://www.facebook.com/unipaderborn/

Moderatorin Selina Hare

LinkedIn: https://www.linkedin.com/in/selina-hare-0424201a6/
Instagram: https://www.instagram.com/selina_c.est.la.vie/

ams Radio und MediaSolutions (Podcastfabrik)

LinkedIn: https://www.linkedin.com/company/ams-radio-und-mediasolutions/
Instagram: https://www.instagram.com/amsradioundmediasolutions/

Transkript anzeigen

00:00:03: Buchstaben, Klammern, Pfeile, Gleichzeichen.

00:00:06: Die mathematischen Formeln, die sich über das Whiteboard erstrecken sehen unfassbar kompliziert aus und überfordern mein Gehirn.

00:00:13: Prof.

00:00:13: Dr.

00:00:14: Axel Ngonga nimmt einen Stift und erklärt was er hiermit berechnen will.

00:00:18: Er schließt entspannt mit den Worten Das ist eigentlich alles was wir machen.

00:00:22: Wir lachen weil wir beide wissen dass ich es trotzdem nicht begriffen habe.

00:00:26: Was ich aber weiß, der KI-Forscher begeistert mit seiner Expertise und seiner lockeren Art.

00:00:32: Nach Büchern sucht man in seinem Beruf vergeblich – zu analog sagt er!

00:00:37: Dafür steht ein riesiges Paket unter der Tafel.

00:00:40: Darin eine neue E-Gitarre.

00:00:42: Und als er erzählt wie sehr er sich freut diese auszuprobieren leuchten seine Augen genauso wie beim Erläutern seiner

00:00:49: Formeln.".

00:00:52: Ich weiß nicht, ob es so klug ist mich hier zu outen aber meine aktuelle Bildschirmzeit liegt so bei vier Stunden.

00:01:03: Davon bin ich bis zu drei Stunden auf Social Media unterwegs.

00:01:09: zum Glück muss ich mich dafür aber nicht schlecht fühlen weil Statistiken zur Folge ist es so, dass wir Deutschen uns im Durchschnitt zwei Komma fünf bis drei Stunden täglich auf Instagram und Co bewegen.

00:01:20: Und das liegt ich nehme an da können einige zustimmen nicht an uns.

00:01:25: schuld sind die Plattformen weil die kennen uns so saugut.

00:01:30: Das is wirklich schwer fällt abzuschalten.

00:01:33: Doom Scrolling Ist vielen ein Begriff also Reels Tiktoks Content Suchten Bis Die Augen Wirklich Sechzehn Zu Neun Sind.

00:01:41: je länger man will, desto besser passen irgendwie dann auch die Inhalte.

00:01:46: Auf einmal bekommen wir alles mögliche rund um ein bestimmtes Thema angezeigt plus die passende Werbung dazu.

00:01:52: Algorithmen werden also immer besser, werden immer individueller Auch mithilfe von sogenannten Wissensgrafen.

00:02:00: Wir klären heute, was es damit auf sich hat.

00:02:03: Und damit herzlich willkommen zu einer neuen Folge von Wissen zur Wirtschaft – dem Podcast in dem wir zeigen wie Spitzenforschung der Universität Paderborn direkt in die lokale Wirtschaft wirkt und umgekehrt!

00:02:16: Heute geht es um das Thema künstliche Intelligenz und ich freue mich sehr darüber, bei einem Mann im Büro zu sitzen der von der Stanford University zu den besten KI-Forscher innen weltweit gezählt wird.

00:02:29: Professor Dr.

00:02:29: Axeln Gonga Hallo!

00:02:31: Danke dass ich hier sein darf.

00:02:33: Danke, dass ich dieses Interview mitmachen darf.

00:02:37: Seit Jahrzehnten sind Sie Professor für Data Science an der Universität Paderborn und seit Juli-Zwzl.

00:02:46: Leiter der Fachgruppe Data Science am Heinz-Nixdorf-Institut dem interdisziplinären Forschungsinstitut der Uni Paderborne.

00:02:53: Außerdem leiden sie auch zahlreiche nationale und internationale Forschungsgruppen.

00:03:00: Woher kommt denn bitte diese große Faszination für künstliche Intelligenz?

00:03:05: Das ist eine sehr gute Frage, woher kommt die Faszion.

00:03:09: Ich habe mich schon immer für Zahlen interessiert und ich habe mich auch immer für Biologie interessiert.

00:03:17: Und es scheint so als lege die Verknüpfung zwischen Biologie und Zahlen genau im Bereich KI.

00:03:24: Ich meine, ich bin nicht der Einzige, der das so gesehen hat oder sieht.

00:03:29: Alan Turing hat z.B.

00:03:31: Papers in der Biologie verfasst und in der Informatik gilt ja als Vater der KI, dementsprechend die Verknüpfung gab es schon immer bei mir.

00:03:41: Und ich habe in einem YouTube Video gesehen dass Sie eine Frage beantwortet haben.

00:03:46: da ging's um Kreativität und sie haben gesagt KI kann Kreativity simulieren und ob sie selbst kreativ ist oder sein kann, das weiß man noch gar nicht so genau.

00:03:58: Jetzt weiß ich aber auch über sie dass die Musiker sind und da wollte ich Sie direkt mal am Anfang fragen was sie denn von KI generierter Musik zu halten als KI Forscher aber auch als Musiker?

00:04:09: Sehr viel, sehr viel KI-generierte Musik.

00:04:13: Die ist ja dahingehend generiert, dass sie trainiert wurde.

00:04:16: und zwar gibt es wieder etwas wir als Menschen musikalisch hinbekommen haben und wenn wir das zusammenbündeln können gerne lassen können, die uns gefällt.

00:04:26: Warum nicht?

00:04:26: Aber sie würden es trotzdem nicht aufgeben selbst Musik zu machen?

00:04:29: In

00:04:29: keinster Weise!

00:04:30: Es ist ja eine völlig andere Art des Zugangs zur Musik.

00:04:33: Einmal bin ich konsumiere ich Musik und da konsumier' ich gerne gute Musik.

00:04:37: aber ich generiere auch Musik und produziere Musik.

00:04:41: Da ist es mir wichtig, dass ich spiele.

00:04:43: Okay!

00:04:44: Ich finde das super interessant weil viele sagen ja bei KI-generierter Musik die kann irgendwie vielleicht doch nicht so sehr die Emotionen von Menschen berühren, weil sie eben ja nicht menschlich gemacht ist?

00:04:55: Das würden Sie dann trotzdem auch anders sehen?

00:04:57: Das sehe ich anders und ich gehöre erst zu der Spätzelsmensch und kann durchaus sagen, dass es sehr schöne KI-Reneräte Musik gibt,

00:05:08: Das finde ich total faszinierend.

00:05:10: Ich zähle auch dazu, ich höre auch gerne AI-generierte Musik und war mir aber noch nicht so richtig sicher.

00:05:16: muss ich mich da jetzt schlechtfühlen oder nicht gegenüber wirklich echten Musiker inwiegen?

00:05:20: Kein Starweise!

00:05:25: Wo in Ihrem persönlichen Alltag können Sie eigentlich gar nicht mehr auf KI verzichten?

00:05:31: Na, ich meine es ist ganz klar das KI sehr viele Arbeitsvorgänge erleichtert und auch beschleunigt.

00:05:37: Und ich glaube tatsächlich dass ich meinen Arbeitsalltag tatsächlich gar nicht mal auf KI verzichten kann.

00:05:43: Es aber bereits seit Jahren so vor dem KI-Boom war's, sodass wir sehr viele Methoden aus dem Gebiet halt benutzt haben.

00:05:51: Ja, im Arbeitsleben ist KI für mich dann zentral.

00:05:53: In meinem auch zugegebener Maßen um mich auf dieses Interview hier vorzubereiten habe ich auch mit KI gearbeitet.

00:05:59: Auch das zeichnet

00:06:00: mir.

00:06:00: Okay?

00:06:01: Weil ich mir einfach ein paar Begriffe vorher erklärt, erklären lassen habe sage ich jetzt mal.

00:06:08: Das werden wir vielleicht später auch noch einmal merken.

00:06:10: aber kommen wir doch nochmal zuerst zurück zur Forschung.

00:06:14: in ihrer Forschung geht es um die Schnittstelle zwischen Menschen Maschine und Daten.

00:06:19: richtig

00:06:20: Vor allem setzen Sie sich wissenschaftlich mit maschinellen Lernverfahren auseinander.

00:06:25: Aber was bedeutet das eigentlich?

00:06:27: Das ist eine sehr gute Frage!

00:06:29: Was ist ein maschinelles Lern-Verfahren?

00:06:31: Im Grunde genommen geht es darum, zu lernen und lernen werde ich gleich definieren.

00:06:38: aber zu lernen wie man aus einer bestimmten... Eingabe eine bestimmte Ausgabe generieren.

00:06:43: Wer kennt das alle aus der Schulmathematik?

00:06:45: Dafür braucht man Funktionen, also eine Funktion nimmt ja ne Eingabeklassischerweise x im Schulunterricht und da wird ein y draus.

00:06:52: Und die Frage in Maschinen lernen ist wie kriege ich dann raus welche Funktion f letztendlich zu einer bestimmten Menge von Eingaben-Ausgabe paaren passt?

00:07:02: Darum geht es eigentlich ziemlich trivial.

00:07:05: Absolut, das sehe ich ganz genau so!

00:07:09: Ja vielleicht komme ich nochmal noch mehr dahinter je länger wir miteinander sprechen heute.

00:07:14: aber danke für diese Erklärung.

00:07:15: erstmal woran forschen Sie denn hier mit Ihrem Team?

00:07:19: Ganz konkret.

00:07:20: Ich versuche das kompakt darzustellen.

00:07:23: Fundamental geht es uns darum wie wir Nummer eins diese X, die diese Daten am besten repräsentieren.

00:07:31: Da machen wir sehr viel Forschung im Bereich Wissensgrafen.

00:07:34: Klassischerweise wird seine X immer schnell lernen eben in Vektoren und am Ende haben wir eine Ausgabe, die ist entweder kontinuierlich.

00:07:45: das heißt eine reale Zahl oder die ist diskretive, ihr sollst da bestimmt nicht ein Menge.

00:07:51: Das Problem mit diesem Zugang ist es gibt sehr viele Probleme, aber ganz wichtig ist die Erklärbarkeit.

00:07:57: Wenn wir einmal eine Ausgabe haben möchten wir gerne nachvollziehen können wie f funktioniert und unsere Funktion funktioniert und wie sie aus x eben y macht.

00:08:06: und vectorial geht das zwar Aber ziemlich schlecht und wir haben einen völlig anderen Zugang.

00:08:14: Wir sagen eigentlich diese Daten klassischerweise eben Punkte in einem größeren Grafen, das sind Verbindungen zwischen Entitäten und wenn wir lernen möchten, wir tatsächlich Lernverfahren haben die in der Lage sind erklärbare Funktionen zu generieren.

00:08:28: Sprich unsere Eingaben sind klassischer Weise Elemente aus dem sogenannten Wissensgrafen wo wir Verbindung zwischen Entitäten im Grunde genommen modellieren.

00:08:36: Unsere Ausgaben sind Modelle die verbalisiert werden können, sprich aus denen man natürlich Sprache generieren kann.

00:08:43: Und somit haben wir erklärbare Lernverfahren.

00:08:45: Das ist im Grunde genommen das, wie wir uns auseinandersetzen.

00:08:48: Es gibt noch viel drum rum aber es ist der Kern des

00:08:51: Sachen.".

00:08:51: Jetzt ist es ja so dass KI sich unglaublich schnell entwickelt in letzter Zeit!

00:08:56: Wie schafft es denn hier auch ihr Team von Uni Paderborn am Wald zu bleiben und immer auf dem neuesten Stand zu sein?

00:09:04: generell einfach so schnell weiterentwickelt.

00:09:07: Wir haben da zwei Zugänge zu Ängel Nummer eins, wir benutzen KI und KI so verstehen im folgenden Sinne es gibt sehr viele Papiere die geschrieben werden.

00:09:13: ich glaube sie sind ungefähr drei tausend im Jahr oder im Monat auf jeden Fall Tausende.

00:09:18: und das ist halt natürlich die Frage wie distilliert man die Quintessenz dieser Papiere?

00:09:22: Und dass kann man eigentlich ziemlich gut mit KI machen.

00:09:25: Auf der anderen Seite ist jetzt so wir setzen uns mit einer sehr spezifischen Art von KI auseinander.

00:09:29: wir können natürlich nicht alles mögliche im Bereich KI hier untersuchen und geben uns zurückste Mühe, eben zu den Spitzenreitern zu gehören.

00:09:38: Das heißt wir bestimmen im Grunde genommen mit was der Stand der Technik ist und das hilft dass man auch den Stand der technik kennt.

00:09:44: Ja,

00:09:44: absolut.

00:09:45: Die Paderborner Informatik, die belegt in international anerkannten Rankings wie dem CHE-Ranking und dem Leidenranking regelmäßig wirklich Spitzenplätze.

00:09:55: sicherlich spielt dabei auch das Netzwerk auf diesem Feld eine Rolle.

00:10:00: Beispielsweise beschäftigt sich das Sale-Netzwerk zudem auch noch die Universität Bielefeld, die THOWL und die Hochschule Bielefield gehört aktuell mit der zentralen Frage Wie baut man KI so dass sie ein Leben lang vernünft?

00:10:14: und sichere Ergebnisse liefern kann, oder gibt es so etwas wie ein Lebenszyklus von KI?

00:10:20: Und muss man sie vielleicht irgendwann mal abschalten.

00:10:24: Was ist da jetzt eigentlich der neuste Stand der Forschung?

00:10:27: Gibt es schon eine Erkenntnis, muss man KI irgendwann abschalten oder... Es ist

00:10:31: tatsächlich sehr komplex!

00:10:34: Sie haben ja auch eingangs gesagt, KI lernen dazu Absolut korrekt.

00:10:39: Und wenn wir sie halt mit Daten fördern, ist immer die Frage besonders, wenn es personenbezogene Daten sind was passiert denn?

00:10:45: Wenn man so ein Modell einmal nicht mehr benutzt?

00:10:48: wie schafft man's mal?

00:10:49: eins dass das Modell tatsächlich die Daten vergisst, dass es gelernt hat?

00:10:53: und das ist eine nicht triviale Fragestellung.

00:10:56: Und Nummer zwei, wenn wir ein Modell einmal archiviert haben.

00:10:59: Wer hat noch Rechte drauf?

00:11:01: Also es sind auch sehr viele Fragestellungen, die eigentlich wenig mit Informatik zu tun haben, die wir da berücksichtigen müssen.

00:11:07: Aber ja, es gibt eine Lebenszyklus von KI.

00:11:09: Ja, wir müssen uns Gedanken drum machen wie wir KI abschalten und es ist nicht trivial.

00:11:13: Wir arbeiten daran was wir aber raus bekommen haben in verschiedenen Methoden, wie wir viel aus KI wieder löschen können von dem, was sie halt gelernt haben.

00:11:24: Wir haben noch keine Formalen garantieren, dass wir alles löschen.

00:11:27: Da arbeiten wir noch dran!

00:11:28: Auch den Infrastruktur-Software Innovation Campus Paderborn wollen wir an dieser Stelle nicht unerwähnt lassen.

00:11:34: Das ist ein interdisziplinärer Forschungs- und Innovationscampus Und hier arbeiten Wirtschaft und Wissenschaft wirklich Hand in Hand an den digitalen Lösungen der Zukunft.

00:11:44: Was macht denn für Sie ganz persönlich Paderborne als Forschungsstandort aus?

00:11:50: Warum arbeiten sie hier so

00:11:52: gerne?!

00:11:53: Paderborn ist dahingehend optimal, dass wir das zwei Faktoren zusammenkommen.

00:11:58: Auf der einen Seite haben wir sehr viele, sehr Forschungsaffine-Unternehmen in Unumpaderborn und die Uni ist klein genug, dass man schnell umsetzen kann was man umsetzten möchte aber groß genug, auch größere Sachen, also größere Forschungsprojekte umzusetzen können.

00:12:18: Das ist wirklich optimal von der Kombination her.

00:12:20: Wir haben halt Fragestellungen aus Unternehmen, die auch sehr divers sind aber die wissenschaftlich relevant sind.

00:12:26: Wer können sie dann tatsächlich nicht nur bearbeiten sondern auch allgemeine Lösungen schaffen, die wir nicht nur nach Palabon, sondern halten die ganze Welt und exportieren können?

00:12:36: Und wir haben deinsprechend für mich nicht besonders um einfach Rechenpower, wir haben die Rechen power um diese Lösung wirklich umsetzen zu können.

00:12:45: Was war da jetzt in den letzten Jahren so eine Frage, die immer wieder an sich herangetragen wurde?

00:12:49: Wo sie eine Lösung für finden sollten, wollten mussten.

00:12:53: Na einmal ging es um Sprachmodelle und zwar haben wir ... Letztendlich ist es so in der Welt, dass es ungefähr, ich glaube weniger Szene-Unternehmen gibt die ungefähr neunzig Prozent der Sprachmodelle im Grunde genommen berechnet haben.

00:13:06: Und das ist natürlich immer die Frage was ist mit die Rechtoproblematik?

00:13:09: ganz zentral auf der einen Seite.

00:13:11: Auf der anderen Seite ist es Unternehmen dürfen mehr und müssen tatsächlich auch ihre Ergebnisse erklären können entsprechend des KI Acts.

00:13:19: Da war eine wichtige Fragestellung Können wir hier LLMs berechnen oder Feintschuhen sodass sie halt auch in den Unternehmen eingesetzt werden können?

00:13:26: unter gewissen Sicherheitseinschränkungen.

00:13:28: Das konnten wir zum Beispiel hier problemlos angehen.

00:13:33: Ein anderes zentrales Thema der Arbeit ihres Informatikteams sind sogenannte Wissensgrafen, die hatte ich ja ganz am Anfang schon einmal erwähnt.

00:13:41: es gab auch schon viel internationale Anerkennung für die Ergebnisse dieser Forschung Und hier habe ich dann tatsächlich mal ChatGPT mir zur Seite genommen, um mich da mal so ein bisschen einzulesen in dieses Thema.

00:13:55: Und ChatGBT hat mir das so erklärt – stell dir eine Art Landkarte für Wissen vor!

00:14:00: Jede Person, Firma oder Sache ist ein Punkt.

00:14:03: Verbindung zeigen wie diese Dinge zusammenhängen.

00:14:06: Also ein Wissensgraf ist ein Netzwerk aus Wissen, dass zeigt, wie Dinge miteinander verbunden sind.

00:14:12: Geht das annähernd in die richtige Richtung?

00:14:15: Ja Auf jeden Fall.

00:14:18: Wir reden von Knoten, nicht von Punktenweibpunkte.

00:14:20: klassischerweise halt eine geometrische Position haben aber es sind Knotens in sich sogenannten Entitäten.

00:14:27: die sind über Kanten.

00:14:30: Kanten ist eigentlich falsch technisch aber ich werde trotzdem den Begriff verwenden wenn ich auf meine Wissenschaftskollegen und Kollegen bringen mich nicht um Aber es geht ja, wir haben halt Kanten die gewisse Eigenschaften haben zum Beispiel Namen und wenn wir dann sagen wollen dass eine bestimmte Entität mit einer anderen Entität verknüpft euch ist.

00:14:47: Sagen wir nicht nur das sie miteinander verknüpft sind sondern auch wie sie miteinander verknüpft sind.

00:14:51: Was öfters nicht erwähnt wird von SchaffTPT ist, dass wir noch ein Datenschema haben.

00:14:55: Und da steht letztendlich unser Domänenwissen also die sogenannte Domänonthologie und ihr beschreibt was man logisch eben was der logische Schlüsse wird sehen können wenn mir einmal bestimmte Aussagen einmal vorliegen haben.

00:15:10: Wozu dient diese Forschung?

00:15:12: Also was haben wir so konkret im Alltag eigentlich von Wissensgrafen und ihren Ergebnissen auch aus der Forschung?

00:15:18: Sie benutzen vermutlich jeden Tag Wissensgrafen, ohne es zu wissen.

00:15:23: Dreißig Prozent der Anfragen von Google werden von Wissengrafen beantwortet.

00:15:26: Jedes Mal dass sie zum Beispiel... Sie haben immer diese kleine Box rechts.

00:15:29: wo ist halt was sich man sucht nach Paderborn findet ein paar Bilder welche Uhrzeit wie das Wetter ist und so weiter.

00:15:34: Das ist ein Ausschnitt aus dem Google-Wissen-Sgrafen.

00:15:37: Aussprechend Wissenschrafen sind tatsächlich das verbindende Element mittlerweile zwischen Semantikergo, Bedeutung Weltwissen und KI's.

00:15:46: Und wir setzen uns damit auseinander wie wir diese Daten Nummer eins sauber speichern können, wie wir daraus Logie schließen können was wie wir halt mit Unkonsistenzen umgehen können und natürlich auch wie wir darauf lernen können.

00:16:00: das ist auch ganz zentral.

00:16:01: Was ist so ihre Traumvorstellung?

00:16:03: Wie Wissensgrafen eines Tages funktionieren?

00:16:07: Interessante Frage.

00:16:09: Ich glaube, die tun schon was sie tun sollten.

00:16:12: Die sind aber das große Problem, dass sie mit Inkonsistenzen nicht ganz umgehen können.

00:16:17: Also klassischerweise hat man drei Probleme mit Wissensgrafen.

00:16:21: Nummer eins, wenn man die einmal extraiert und es in klassischer Weise unterschiedliche Entitäten oder Organisationen, die die extraieren dann hat man unterschiedliche Sichten der Welt.

00:16:31: Man muss die miteinander zusammenführen.

00:16:33: Und wenn man sie miteinander zusammen führt gibt es immer Inkonsistenz.

00:16:36: Das ist immer die Frage wie Wie lösen wir in Konsistenzen auf oder können wir Verfahren bauen, die mit den Konsistenz klarkommen?

00:16:43: Das Problem Nummer zwei ist die Größe.

00:16:46: Wir haben ungefähr zweihundert Milliarden Aussagen auf unseren Zaubern rumliegen, die halt die Welt beschreiben um der Wissen das neuen Bruchteil von dem was man eigentlich aussagen könnte.

00:16:56: Sie sind mal gefragt wie speichert man das sauber?

00:16:58: und natürlich wie sorgt man dafür dass man auch alles an Wissen nutzt wenn man Fragen beantwortet?

00:17:04: Und Nummer drei natürlich Verbindung mit Maschinen lernen.

00:17:06: Ich habe eingangs erwähnt, klassische Verfahren funktionieren vektoriell, sprich die gehen davon aus dass wir es mit Vektoren in irgendeinem Vektorraum zu tun haben.

00:17:14: Wissensgrafen sind a priori keine Vektornen.

00:17:16: diese Verknüpfung da arbeiten wir auch dran.

00:17:18: mein Traum wäre natürlich das wir Wissenschrafen als Grundlage für maschinelles Längen allgemein verwenden und dass wir somit erklärbare KI-Verfahren haben so dass menschenmaschinen und Daten wirklich sauber miteinander zusammenarbeiten können.

00:17:32: Gibt es eigentlich irgendwo da draußen im Netz auch ein Wissensgraf über mich?

00:17:37: Weil ich habe ja wirklich, wie ich das schon am Anfang gesagt habe.

00:17:39: Das Gefühl dass Instagram die sozialen Netzwerke mich so gut kennen.

00:17:44: Also gibt es da irgendwo auch so einen kleinen Knotenpunkt Selina her und von dem aus gehen ganz viele.

00:17:50: Auf jeden Fall, kann ich ihn noch zeigen?

00:17:51: Okay also das existiert, also so arbeiten dann wahrscheinlich auch Algorithmen oder die Wissensgrafen sich merken.

00:17:57: okay Selina hat sich dafür interessiert.

00:18:00: das könnte sie denn jetzt auch interessieren?

00:18:03: Nicht ganz!

00:18:04: Die meisten Verfahren sind vektorealer Natur sprich die wissen dass es bestimmte Entitäten gibt.

00:18:09: diese Entitäten sind klassischerweise Vektoren also sogenannte Einbettungen und was sie gerade erwähnt sind, sogenannte Recommendation Engines.

00:18:18: Und die schauen sich im Grunde genommen eine Population an und sagen, ähnliche Leute werden halt ähnlicher Bedürfnisse haben, sprich wenn man sie halt einmal entsprechend passend gruppiert hat kann man halt sagen Person X hat Video Y gefallen.

00:18:33: dementsprechend gehen wir das halt weiter am weiteren Personen, die halt innerhalb der Gruppe sind.

00:18:38: Das kann man präziser ausdrücken, aber das ist die Grundidee.

00:18:42: Aber das hat auch ein bisschen was mit Wissensgrafen zu tun?

00:18:46: Es kommt darauf an... Also einmal, man kann es vektorell repräsentieren.

00:18:49: Es gibt größere Unternehmen wie Facebook, wir halten Wissenschrafen tatsächlich explizite.

00:18:52: Also Meta heißen sie mittlerweile ein Produkt von Meta und ich glaube Instagram gehört auch Meta.

00:18:58: Und die benutzen sehr große Wissen-Sgraven, das ist bekannt.

00:19:03: Ich weiß aber da ich dort nicht arbeite, kann ich Ihnen nicht genau sagen wo die Wissen, wo Sie Wissengrafen einsetzen, wo nicht.

00:19:09: Es ist aber bekannt, dass es größere Wissensgrafen zu Personenprodukten und Werbung gibt.

00:19:14: Und die sind natürlich auch dafür benutzt werden.

00:19:18: Sehr krass auf jeden Fall.

00:19:19: Super interessant!

00:19:20: Mit den Wissenschrafen ist auch immer der Begriff Semantik-Web ganz eng verbunden.

00:19:27: Semantick bedeutet Bedeutung?

00:19:29: Das weiß ich noch.

00:19:30: aus meinem Germanistik-Studium an der Uni Paderborn habe ich doch ein bisschen

00:19:33: was behalten.

00:19:35: Und auch hier habe ich trotzdem Chatchi B.T.

00:19:37: noch mal hinzugezogen und zwar hat die oder der... Ich bin mir doch nicht so ganz sicher, manchmal sage ich sie Chachy B. T., weil ich einfach das Gefühl habe, ich möchte dass sie weiblich ist und manchmal sage aber auch einfach er was ist Chachie B.t.

00:19:53: bei ihnen eigentlich?

00:19:54: Das ist

00:19:54: ein Transformer.

00:19:55: dementsprechend es ist ein R.

00:19:57: Also wie auch immer, ChurchBiti hat mir gesagt im heutigen Web stehen überall Texte Bilder und Daten.

00:20:05: Das sind für Computer aber oft nur lose Informationen.

00:20:08: das Semantik-Web ist ein intelligentes Netz aus Wissen, dass Zusammenhänge versteht.

00:20:14: Das soll für die Wirtschaft ein echter Game Changer sein, aber wie profitierenden Unternehmen auch hier vor Ort ganz konkret von so einem Semantic Web?

00:20:25: Die ich nicht wohnen von Chat-TBT ist leider inkorrekt.

00:20:30: Beim Semantikwerk war eigentlich eine Vision, und zwar kommt aus dem Paper aus einem Jahr zwei Tausend Eins wenn mich nicht alles täuchte.

00:20:39: Und da war die Idee tatsächlich das wir jetzt, was wir jetzt Agentic AI nennen.

00:20:44: Sprich man hatte eine explizite Repräsentation von Wissen und hatte Softwareagenten, die jeweils Repräzentation oder... Ja, letztendlich digitale Repräsentanten von Individuen waren und die konnten halt miteinander reden.

00:20:58: Dadurch dass das Wissen explizit gemacht wurde, konnten sie halt sich austauschen in einem formalen Sprache.

00:21:06: Das ist die Grundidee hinter dem Semantik-Websprich.

00:21:08: Wir haben nicht mehr Dokumente, die letztendlichen die wichtigsten Entitäten im Web sind sondern vielmehr wissen oder letztendliche Wissensgrafen wenn man es genau nimmt.

00:21:20: Und man hat Agenten, die halt diese Wissensgrafen verstehen und eben daraus Schlüsse ziehen können.

00:21:26: Sie können dementsprechend auch bestimmte Aktivitäten durchführen.

00:21:32: Für Unternehmen war das dahingehend wichtig, dass explizite Semantik auch bedeutet, dass die Agenten der Unternehmen tatsächlich weitere Daten nicht nur aufnehmen können sondern auch verarbeiten, daraus neue Schlüssen ziehen können Unternehmen im Netz oder halt auch in der Realität, also in der nicht digitalen Welt zu agieren haben.

00:21:54: Mittlerweile ist es so dass das Semantik-Web benutzt wird?

00:21:59: Es ist halt, da sich die Realität... Also jedes Mal, dass ja halt sowas wie Idealorde der gleichen Benutzung als Plattform.

00:22:06: Da steckt tatsächlich eine Ontologie dahinter, da stecken ganz konkrete Attribute von Produkten, die man halt benutzen kann, Produkte und Produktpreise miteinander zu vergleichen.

00:22:16: Das wird benutzt.

00:22:20: Wir profitieren Unternehmen ganz konkret davon im Grunde genommen.

00:22:28: AI Act, wenn man drüber nachdenkt dass wir die Aussagen beziehungsweise die KI muss jetzt präzise austrücken das versuche ich gerade die ganze Zeit okay folgendes Wenn wir eine KI getriebenen Entscheidung haben dann müssen wir ja tatsächlich in der Lage sein als Unternehmen zu sagen Das ist der Grund warum die KI so entschieden hat.

00:22:47: Man braucht Erklärbarkeit Und Wissensgrafen sind aus meiner Perspektive der Zugang dazu, dass wir KI-Systeme bauen können.

00:22:56: Die in der Lage sind ihre Aussagen bzw.

00:22:58: ihre Entscheidung auch sauber nachvollziehbar und auch logisch zu begründen.

00:23:04: Sprich im Grunde genommen haben werden alle Unternehmen der Welt was davon haben wenn wir einmal solche KI Systemen offen macht haben.

00:23:12: kommen Sie gerade zu einem Punkt, den ich auch gerne noch ansprechen würde.

00:23:16: Und zwar merkt man ja jetzt schon generell dass selbst wenn ihre Arbeitsfelder jetzt rund um KI erstmal abstrakt klingen trotzdem bewegen wir uns ja voll in unserer Lebensrealität also in meiner in unserer in der von auch lokalen Unternehmen tatsächlich und das gilt eben auch besonders für den Sonderforschungsbereich indem sie Mitglied sind und zwar geht es da um Constructing, explainability.

00:23:45: Und das haben Sie ja gerade auch beschrieben, oder?

00:23:48: Dass eine KI eben nicht nur einfach ne Antwort ausspuckt sondern eben auch erklären kann wie kommt sie darauf und dass man das nachvollziehen kann.

00:23:58: Das ist ja so ein Unterprojekt glaube ich.

00:24:01: auch dieser Forschung mit dem Namen C-null-sieben fand ich ganz witzig, dass es sehr nah an Christiano Runein aus Zürich kürze ist.

00:24:08: Kann

00:24:08: man sich sehr

00:24:10: gut merken!

00:24:15: Das erforschen sie tatsächlich?

00:24:17: Genau,

00:24:18: richtig.

00:24:18: Ja!

00:24:19: Es geht nicht nur in den C-Zero-Sieben darum, aber es wird eine sehr interessante Verknüpfung, und zwar jetzt ist leider technisch.

00:24:28: Und zwar werden Sprachmodelle, ChatGPT hier ein gutes Beispiel so trainiert, dass denen erst mal Sprache beigebracht wird – das ist sogenanntes unüberwachtes Lernen, wie denen beigebracht, wie man sauber Fragen beantwortet einen dritten Schritt wie den beigebracht, wie man Antworten generiert die den Nutzen gefallen.

00:24:47: Die mir gefallen?

00:24:48: Richtig!

00:24:48: Aber das heißt ja nicht...

00:24:49: Es geht nicht um Wahrheit, es ist aber ein anderes Thema tatsächlich.

00:24:52: Da können wir uns eine andere Frage darüber unterhalten und es ist wirklich sehr faszinierend.

00:24:56: Was da spannend ist, wenn man unsere Systeme dahingehend optimiert dass sie Antworten genirrieren, die einem gefallen, optimieren wir die nicht.

00:25:06: letztens nicht darum dass sie Anworten generieren, die nachvollzogen werden können Und genau darum geht es in C.o.sieben, dass wir Systeme bauen also nicht nur Sprachmodelle sondern auch Datenrepräsentation dahinter und das ist Retriever Augmented Generations Keyword so dass wir am Ende uns Daten so merken also auch Hintergrund wissen dass wir Antworten generieren können die von den Nutzenden besser verstanden werden können.

00:25:34: Okay ja und davon hätten wir jetzt tatsächlich alle was auch im Alltag.

00:25:39: Das

00:25:39: ist das Ziel.

00:25:39: Ja

00:25:41: Also wäre KI künftig weniger ein Werkzeug wie jetzt vielleicht, sondern eher ein Gesprächspartner?

00:25:48: Da kommen wir in schwierige – richtig philosophische Gewässer – Gesprächspartner.

00:25:56: Es kommt darauf an wenn man Partner definiert und was ein Gesprich ist aber es wäre auf jeden Fall KIs wären dann Entitäten mit denen wir uns so weit austauschen könnten dass wir ausreichend viel lernen könnten, um besser unsere Aufgaben bewältigen zu können.

00:26:11: Das kann man definitiv so sagen.

00:26:14: Weil jetzt ist es tatsächlich ja noch manchmal so... Es gibt auch Reels dazu und mir selbst ist das auch schon passiert, dass man eine Frage stellt, man eine Antwort bekommt von LGBT und genau weiß, das stimmt so nicht oder ich das dann irgendwie nochmal gegoogelt habe und dann gemerkt habe okay die hat mir da Quatsch erzählt.

00:26:31: Jetzt bin ich grad wieder bei der weiblichen Bezeichnung.

00:26:34: Das ist auch nicht fair, aber da hab' ich gemerkt, das ist falsch und dann habe ich noch mal mit ihr gesprochen und gesagt Entschuldigung, aber ich weiß dass es nicht stimmt.

00:26:43: Und dann hat die geantwortet Ah ja danke für den Hinweis!

00:26:46: Das ist natürlich total richtig.

00:26:47: Es ist ganz anders Und so konnte man ein unendlich langes Gespräch führen Mit ihr und sie halt quasi immer wie Sie schon gesagt haben mir irgendwie nach dem Mund geredet So ein bisschen Genau

00:26:57: und das ist Halbphase drei.

00:26:59: Das ist dann mal Reinforcement Learning with Human Feedback.

00:27:02: Und da geht es jetzt nicht darum, dass man Antworten generiert, wo Menschen sagen ja das ist eine tolle Antwort, genau so eine Antwort hätte ich haben wollen ohne dass man sich viel Gedanken macht ob die Antwort wirklich stimmt.

00:27:13: Klassischerweise gibt es eine sehr hohe Korrelation zwischen Stimmen gefallen aber dies nicht bei hundert Prozent

00:27:18: Wenn wir jetzt wieder zurückkommen, wirklich in die Lebensrealität auch von Unternehmen hier in der Region.

00:27:25: Wie kann die KI generell aber vielleicht auch eben solche intelligenteren Sprachmodelle oder welche Branchen könnten effizienter arbeiten?

00:27:35: Alle tatsächlich!

00:27:37: Wir haben uns das ein bisschen genauer angeschaut und es gibt ja sehr viele Prozesse in den Unternehmen, die letztendlich von allen Unternehmen durchgemacht werden.

00:27:46: Wir hatten neue Leute, Akquirieren von Ressourcen allgemein.

00:27:50: Und da ist es ja so dass sehr viel noch manuell passiert und man kann einiges nicht nur automatisch sind sondern tatsächlich fairer gestalten in dem man halt eben KI-Getriebenessysteme nutzt.

00:28:03: In den jeweiligen Aktivitäten vom Unternehmen kommt das natürlich immer drauf an.

00:28:07: ich meine wenn ein Unternehmen sagen wir Bei einem Dachdecker ist es ganz klar, man muss sich ums Dach kümmern.

00:28:15: Da wird, wenn später bald embodied intelligence ist, also Roboter tatsächlich helfen können.

00:28:21: aber soweit sind wir noch nicht.

00:28:23: Aber bei mehr sogenannten Knowledge-Worker, sprich bei Unternehmen die eher mit Daten beschäftigen und Daten verarbeiten, sagen wir aller Aura-Colors dergleichen ist das ganz klar dass man sehr viele Schritte automatisieren kann und auch automatisierend wird.

00:28:38: Bei der Frage, welche konkreten KI-Lösungen sind für mittelständische Unternehmen sinnvoll hilft ja auch das Kompetenzzentrum Arbeitswelt Plus.

00:28:47: Hier werden Erkenntnisse aus der Arbeitsforschung rund um KI zusammengebracht Und die Ansätze, die werden wirklich praktisch getestet einmal in größeren Betrieben als sogenannte Leuchtturmprojekte und zum anderen in kleineren und mittleren Unternehmen über Transferprojekten.

00:29:03: Dabei wird vor allem auch daran gearbeitet das Beschäftigte so gut wie möglich dafür qualifiziert werden.

00:29:11: also Wie wichtig ist es?

00:29:12: Auch rund um die KI Forschung den Menschen quasi mit einzubeziehen und nicht zu vergessen dass Da ja auch irgendwann mal jemand mit der KI zusammenarbeiten muss.

00:29:25: Zusammenarbeiten, das ist halt immer... Das ist die Frage!

00:29:29: Also wir bauen ja sehr unterschiedliche KI-Systeme.

00:29:31: manche sind im Backend, sprich sie leben auf irgendwelchen Savern und werden tatsächlich nur von doch sehr technisch geprägten Personen benutzt.

00:29:41: Aber sobald wir in Interaktion mit Mitarbeitenden kommen, die eben eher wenig mit diesem technischeren KI-Welt zu tun haben.

00:29:50: Es ist uns wichtig dass die Modelle die wir bauen das ich wie ich vorhin erwähnt habe erklärbar sind und zwar nicht nur Text generieren welcher nach Erklärung aussieht sondern wirklich erklären wie sie sich verhalten.

00:30:05: Das ist auch der Grund warum wir hier Wissensgrafen untersuchen weil wir davon ausgehen oder wissen, dass die Modelle, die wir generieren, logisch Konsistenz sind und dementsprechend echte Erklärungen generieren können.

00:30:16: Aus meiner Perspektive ist das zentrale, dass Mitarbeitende und KI sich so weit austauschen können, dass sich die Mitarbeiter mitgenommen fühlen und es nicht nur wenn KI sich auch wirklich erklären kann.

00:30:32: Auch die Wissenschaft kann durch die Forschung an der KI, mit der KI natürlich auch sich weiterentwickeln.

00:30:39: Was genau erhoffen Sie sich für die Wissenschaft?

00:30:42: Wie die Wissenschaft profitiert von Ihrer Forschung?

00:30:44: Es gibt schon einiges was umgesetzt ist.

00:30:46: ich glaube meine Lieblingsreferenz ist Terence Tau.

00:30:49: das ist einer der weltweit besten Mathematiker und er schreibt mittlerweile Beweise mit KI-Unterstützung Und in der Mathematik ist man ja sehr extrem strikt.

00:30:59: es muss ja ein Beweis sein und er kann halt mit KI-Unterstützung Teile seiner Beweise verfassen.

00:31:04: Und genau da möchte ich hin, also es gibt sehr viele Arbeiten die wir machen müssen als Wissenschaftlerinnen und Wissenschaftler, die tatsächlich gar nicht notwendig sind aus meiner Perspektive, die ich gerne einer KI überlassen wollen würde.

00:31:18: in meinen App-Strike schreiben ist langweilig.

00:31:23: Im Grunde genommen ist es ja ein Verkaufsbriefing, wenn man's genau nimmt.

00:31:27: Und das ist uninteressant aus Sicht einer Wissenschaftlerin oder einer Wissenschaftlerin.

00:31:33: Aber es gibt... Und in meines Gebauch Hypotesen, das Testen von Hypothesen.

00:31:37: Wir testen sehr viele Hypothese, wir gehen die durch.

00:31:40: manche kann man tatsächlich aus der Literatur heraus gleich verwerfen aber wie ich erwähnt habe es sind mehrere tausend Papers im Jahr geschrieben werden zu unseren jeweiligen Forschungsfragen und eben diese Arten von Interaktion wo man halt sehr viel Hypothesin bereits los werden kann um sich schneller effizienter darauf auf dazu konzentrieren was eigentlich eventuell Neue Erkenntnisse bringt.

00:32:02: das, würde ich halt auch gerne mit Kis zusammen machen.

00:32:04: Es passiert immer mehr, immer häufiger... Ich glaube es geht besser!

00:32:10: Da werden wir also hinkommen in ein paar Jahren.

00:32:14: Das hoffe ich!

00:32:17: Zum Abschluss möchte ich Ihnen noch eine letzte Frage stellen und zwar bevor wir zu unseren Blitzfragen kommen.

00:32:28: Und zwar, Sie haben in einem YouTube-Video der Uni Paderborn auf die Frage.

00:32:34: Wann wird die KI den Menschen ersetzen?

00:32:36: Geantwortet hoffentlich nie!

00:32:39: Das impliziert aber – das ist Ihrer Meinung nach immer noch die Möglichkeit gibt – dass das passiert?

00:32:45: Es kommt immer darauf an was vorher ein Ersetzungsoperator hier gemeint ist.

00:32:49: heißt es jetzt funktional im Sinne dessen was der Mensch macht in der Arbeit?

00:32:55: ja ich glaube Das wird passieren zum Teil und das ist bereits passiert in den Bereich Softwareentwicklung.

00:33:01: Zum Beispiel gibt es viele Arbeiten, Dokumentationen insbesondere die halt mittlerweile von KI übernommen werden wo KI einfach besser sind.

00:33:09: Und das schafft aber freie Räume und es ist wirklich eine gesellschaftliche Frage dass wir mit diesen Freiräumen machen.

00:33:16: und was ich mir hoffentlich nie meine ist tatsächlich dass ich hoffe dass wir nicht zu einer KI-Gesellschaft wären wo der Mensch nichts mehr zu sagen hat sondern KI nutzen, um den Menschen zu dienen.

00:33:29: Dann würde ich sagen kommen wir an dieser Stelle zu unseren Blitzfragen die ich allen unseren Gästen immer am Ende einer Folge stelle und die erste wäre was bedeutet für sie Transfer?

00:33:42: Dinge von A nach B bringen?

00:33:43: aber in der Wissenschaft bedeutet das im Grunde genommen aus wissenschaftlichen Ergebnissen eben Firmen Unternehmen oder da gleich machen.

00:33:50: Die zweite Frage ist wie hat Paderborn Sie geprägt?

00:33:53: Ich habe gelernt, ein vielseitigerer Wissenschaftler zu sein.

00:33:58: Und die dritte Frage?

00:33:59: Woran werden Sie in zehn Jahren forschen?

00:34:02: Wenn ich das rauskriege, woran ich Ihnen zwei Wochen forschen werde, kann ich die Frage beantworten!

00:34:09: Vielen, vielen Dank Prof.

00:34:10: Dr.

00:34:11: Axel Ngonga dass ich heute bei Ihnen sein durfte.

00:34:14: Ich liebe es wie begeistert und leidenschaftlich Sie sind.

00:34:18: man merkt das wirklich in jeder Antwort Und wie wir auch in dieser Folge gemerkt und gelernt haben Das Ihre Forschung wirklich ja einen absoluten Impact hat auf unsere Lebensrealität und auch die der lokalen Unternehmen hier vor Ort.

00:34:32: deswegen vielen, vielen dank für dieses tolle Gespräch

00:34:35: und

00:34:36: euch empfehle ich natürlich auch anderen Folgen reinzuhören von Wissentour Wirtschaft.

00:34:41: Lasst gerne eine Bewertung da und empfehlt diesen Podcast auch gerne weiter, wenn ihr euch gefällt!

00:34:47: Vielen Dank und bis zum nächsten Mal!

00:35:00: Tschüss!

00:35:06: Konzeption und inhaltliche Begleitung Johanna Pietsch & Tobias

00:35:11: Vorwerk

00:35:12: Sound- und Postproduktion AMS Podcastfabrikstudio Spielefeld Alle Episoden auf wissentowirtschaft.de, podcastfabrikt.de und überall wo es Podcast gibt.