Der Weg nach KAI

Michael Berndt
Since 05/2024 47 Episoden
O1-Pro, DeepSeek, QwQ-32B und Gemini 2 Flash: Neue Möglichkeiten, neue Regeln

18.12.2024 24 min

Der Weg nach KAI – Episode 47: O1-Pro, DeepSeek, QwQ-32B und Gemini 2 Flash: Neue Möglichkeiten, neue Regeln Diese Episode beginnt mit einer liebevollen Reminiszenz an Douglas Adams' "Per Anhalter durch die Galaxis" und zieht dabei Parallelen zwischen dem fiktiven Supercomputer Deep Thought und den neuesten KI-Modellen wie DeepSeek. Sie eröffnet den Dialog über moderne "Reasoner" - KI-Systeme, die für logisches Denken und komplexe Schlussfolgerungen optimiert wurden. Wir widmen uns besonders den bemerkenswerten Fortschritten chinesischer KI-Entwickler. Mit DeepSeek und Alibabas QWQ-32B-Preview werden zwei Modelle vorgestellt, die trotz ihrer vergleichsweise bescheidenen Größe beeindruckende Leistungen zeigen und damit die bisherigen Annahmen über den technologischen Rückstand Chinas widerlegen. Ein weiterer Schwerpunkt liegt auf OpenAIs aktueller Produktoffensive, insbesondere der Einführung von O1-Pro und des neuen Premium-Angebots "ChatGPT Pro". Wir analysieren die Vor- und Nachteile dieser Angebote sowie deren Preisgestaltung und weitreichende Implikationen für professionelle Anwender. Anhand konkreter Beispiele aus der Softwareentwicklung und der medizinischen Forschung sehen wir das praktische Potenzial moderner KI-Systeme, am Beispiel der innovativen Anwendung von Gaming-Konzepten in der Krebsforschung durch Dr. Derya Unutmaz. Abschließend untersuchen wir die Entwicklung kleinerer, aber hocheffizienter Modelle wie Gemini 2 Flash von Google mit seinen multimodalen und agentischen Fähigkeiten. 
Digitale Transformation 2025: Cursor, MCP und die kundenorientierte Automatisierung

06.12.2024 22 min

Der Weg nach KAI – Episode 46: Digitale Transformation 2025: Cursor, MCP und die kundenorientierte Automatisierung  Diesmal thematisieren wir die Konsequenzen der KI-gestützten Softwareentwicklung und neue Standards für die Integration von KI in Unternehmensumgebungen. Die Integrated Development Environments (IDEs) ermöglichen durch KI-Unterstützung das Programmieren auch für Laien. Das Entwicklungstool "Cursor" zeigt, wie KI-Agenten eigenständig Code erstellen, testen und optimieren. Die Software führt viele Arbeitsschritte vollautomatisiert durch und benötigt nur bei kritischen Aufgaben eine Zugriffs-Erlaubnis. Diese Entwicklung führt in den nächsten Jahren absehbar zu einer Fülle spezialisierter Software-Lösungen. Des Weiteren beschäftigen wir uns mit dem neuen Model Context Protocol (MCP) von Anthropic, das als standardisierte Schnittstelle zwischen KI-Systemen und Unternehmensinfrastrukturen funktioniert. MCP arbeitet wie ein Universalübersetzer zwischen verschiedenen Datenquellen und KI-Modellen. Die Client-Server-Architektur ermöglicht eine flexible Kommunikation mit internen und externen Datenbanken.
Think Slow – Train Fast: Neue KI-Architekturen vs. "Digitale Inzucht"

20.11.2024 26 min

Der Weg nach KAI – Episode 45: Think Slow – Train Fast: Neue KI-Architekturen vs. "Digitale Inzucht" Diesmal untersuchen wir die massiven Veränderungen in der KI-Modell-Entwicklung. Denn die bisherige Entwicklungsstrategie der KI-Branche, die auf dem Prinzip "mehr Daten, größere Modelle" basierte, stößt an ihre Grenzen. Die Trainingskosten erreichen Milliardenbeträge, während qualitativ hochwertige Trainingsdaten zunehmend knapper werden. Ein vielversprechender neuer Ansatz ist die Optimierung der "Test-Time-Performance". Statt in immer größere Modelle zu investieren, wird mehr Rechenzeit in die eigentliche Antwortfindung investiert. Ein Modell mit 20 Sekunden Bedenkzeit kann so die Leistung eines 100.000-fach länger trainierten Modells erreichen. Ein Forschungsteam des MIT entwickelte nun die Methode des "Test Time Training", bei der sich KI-Modelle während der Inferenzzeit selbst auf spezifische Aufgaben trainieren.  Die Zukunft der KI-Entwicklung liegt wohl in der Kombination von langsamem, gründlichem Denken ("Think Slow") und schneller Anpassungsfähigkeit ("Train Fast"). 
Die Habermas Maschine und .lumen Glasses: KI für die Konfliktlösung und Teilhabe

12.11.2024 16 min

Der Weg nach KAI - Episode 44: Die Habermas Maschine und .lumen Glasses: KI für die Konfliktlösung und Teilhabe Diesmal widmen wir uns zwei KI-Entwicklungen, die als Vermittler bzw. Wahrnehmungsübersetzer funktionieren.  Im ersten Teil wird die innovative .lumen Brille vorgestellt, eine technologische Alternative zu Blindenführhunden. Diese KI-gestützte Brille, die 2025 für etwa 5000 Dollar auf den Markt kommen soll, nutzt fortschrittliche 3D-Sensoren und haptisches Feedback, um blinden Menschen mehr Selbstständigkeit zu ermöglichen. Die Brille verwendet zwei spezielle Tiefenkameras zur dreidimensionalen Umgebungserfassung und navigiert ihre Träger durch sanfte Vibrationen an der Stirn. Mit sechs integrierten Kameras und Mikrofonen kann das System in Echtzeit zwischen begehbaren und unpassierbaren Flächen unterscheiden. Der zweite Teil der Episode beschäftigt sich mit der von Google DeepMind entwickelten "Habermas Machine", einem KI-System zur Vermittlung in politischen und gesellschaftlichen Konflikten.  Das System arbeitet mit zwei verschiedenen KI-Modellen: eines sammelt die unterschiedlichen Perspektiven wertfrei, während das andere nach Wegen sucht, diese zusammenzubringen. Die KI nutzt fortschrittliche Sprachverarbeitungsalgorithmen, um nicht nur explizite Aussagen, sondern auch Nuancen in der Kommunikation zu erkennen. Sie analysiert Tonfall, Kontext und implizite Bedeutungen, um wiederkehrende sprachliche Muster zu identifizieren, die auf Unsicherheiten, Vorbehalte oder versteckte Zustimmung hinweisen. 
Die Zukunft der Business-Automatisierung: Von starren Regeln zu Multi-Agenten-Systemen

05.11.2024 18 min

Der Weg nach KAI – Episode 43: Die Zukunft der Business-Automatisierung: Von starren Regeln zu Multi-Agenten-Systemen In der 43. Folge von "Der Weg nach Kai" steht die Entwicklung von Automatisierungsprozessen im Mittelpunkt. Die Reise beginnt mit einem kurzen historischen Rückblick. Und die zentrale Erkenntnis lautet: Der Erfolg von Automatisierungen entscheidet sich nicht im Standardfall, sondern im gekonnten Umgang mit Ausnahmen. Mit der verstärkten Verbreitung von KI-Agenten steht der Welt der Automatisierung ein fundamentaler Wandel bevor. Anders als starre, regelbasierte Systeme können diese aus Erfahrungen lernen, Kontext verstehen und flexibel auf unvorhergesehene Situationen reagieren. Sie entwickeln selbstständig Strategien, kommunizieren natürlichsprachlich und können sogar kreative Lösungen generieren. Wir gehen noch einmal erklärend auf das "Swarm"-Framework von OpenAI ein, das wie ein effizienter Projektmanager funktioniert, der die Kommunikation zwischen KI-Agenten organisiert. Die Standard Operating Procedures (SOPs) dienen dabei als flexible Leitlinien, die Ziele, Prozesse und rechtliche Grenzen definieren.
Das Zeitalter der KI-Agenten beginnt: Claude Sonnet 3.5 NEW, Microsoft Copilot Studio, Google Jarvis, OpenAI Swarm

28.10.2024 17 min

Der Weg nach KAI – Episode 42: Das Zeitalter der KI-Agenten beginnt: Claude Sonnet 3.5 NEW, Microsoft Copilot Studio, Googls Jarvis, OpenAI Swarm In der 42. Episode von "Der Weg nach KAI" geht es primär um die Veröffentlichung von Claude Sonnet 3.5 NEW, dem neuen KI-Modell von Anthropic. Dieses Modell zeigt beeindruckende Verbesserungen in verschiedenen Bereichen wie Programmierung und Bilderkennung. Doch die eigentliche Sensation ist die neue PC-Handling-Funktion, die es Sonnet 3.5 ermöglicht, direkt mit der Benutzeroberfläche eines Computers zu interagieren.  Dieser dezentrale Ansatz eröffnet völlig neue Möglichkeiten der Mensch-Maschine-Interaktion. Besonders für Menschen mit eingeschränkter Mobilität oder Sehkraft bietet diese Technologie neue Chancen. Sonnet 3.5 stellt auch einen wichtigen Schritt in Richtung Künstlicher Allgemeiner Intelligenz dar. Doch Anthropic ist nicht das einzige Unternehmen, das an KI-Agenten arbeitet. Auch OpenAI, Microsoft und Google entwickeln ähnliche Lösungen. Microsoft plant mit Copilot Studio die Einführung von spezialisierten KI-Agenten für Unternehmen, während Google mit Projekt Jarvis an einer KI arbeitet, die den Webbrowser eines Nutzers übernehmen kann. Zusätzlich beschäftigen wir uns mit OpenAIs "Swarm"- Framework, einer Open-Source-Plattform für Multi-Agenten-Systeme. Swarm ermöglicht es, KI-Agenten zu erstellen, die autonom zusammenarbeiten und Aufgaben untereinander weitergeben können. Dieses Framework spielt eine wichtige Rolle in OpenAIs Vision von natürlicher Interaktion zwischen Mensch und KI. Die Vision eines KI-gesteuer...
O1-Preview und O1-Mini: Das Konzept der "Reasoning Tokens" und konkrete Einsatzszenarien

21.10.2024 23 min

Der Weg nach KAI – Episode 41: O1-Preview und O1-Mini: Das Konzept der "Reasoning Tokens" und konkrete Einsatzszenarien  In dieser Episode befassen wir uns ausführlich mit OpenAIs neuen O1-Modellen und auch mit deren Bedeutung für die Entwicklung einer Künstlichen Allgemeinen Intelligenz.  Die O1-Serie umfasst zwei Modelle: O1-Preview für komplexe Probleme und O1-Mini für schnellere Routineaufgaben. Beide Modelle zeichnen sich durch eine verbesserte Architektur aus, die auf tieferes Denken und Problemlösung ausgerichtet ist. Ein Kernkonzept sind die "Reasoning Tokens", die dem Modell ermöglichen, Probleme intern zu zerlegen und durchdachte Lösungen zu entwickeln. Wir untersuchen die Unterschiede zu früheren OpenAI-Modellen wie GPT-4 oder 4o, besonders in den Bereichen wie kreatives Schreiben, wissenschaftliche Textanalyse und Mathematik. Auch die Anwendungsmöglichkeiten in der Geschäftswelt sind Thema, wobei die aktuellen Einschränkungen wie fehlende Multimodalität oder Datenupload berücksichtigt werden.
KAI 2027: OpenAIs O1, die Rolle der Robotik und das neue Unternehmertum (Teil 4)

25.09.2024 20 min

Der Weg nach KAI – Episode 40: KAI 2027: OpenAIs O1, die Rolle der Robotik und das neue Unternehmertum (Teil 4)  Im vierten Teil über die Auswirkungen eine Künstlichen Allgemeinen Intelligenz untersuchen wir die potenzielle Entstehung von Ein-Personen-Unternehmen mit Millionenumsätzen, die durch KI-basierte virtuelle Organisationen ermöglicht werden. Wir betrachten, wie autonome KI-Agenten verschiedene Geschäftsprozesse automatisieren können, darunter Kommunikation, Kundensupport, Datenanalyse, Marketing, Projektmanagement und Finanzverwaltung. Der menschliche Unternehmer übernimmt dabei die Rolle des "Human in the Loop", der kritische Entscheidungen trifft und die Gesamtstrategie bestimmt. Ein wichtiger Aspekt ist die Ankündigung von Sam Altman, CEO von OpenAI, dass die nächste Stufe der KI-Entwicklung, die "Agents", möglicherweise schon Ende 2024 verfügbar sein könnte.  Auch die Veränderungen in der Softwareentwicklung sind Thema, wobei prognostiziert wird, dass natürliche Sprache die neue Programmiersprache werden könnte, unterstützt durch viele neue KI-Tools , die den Entwicklungsprozess erheblich beschleunigen. Abschließend vertiefen wir die Auswirkungen dieser Entwicklungen auf Berufsbilder und die Ausbildung junger Menschen. 
KAI 2027: OpenAIs O1, die Rolle der Robotik und das neue Unternehmertum (Teil 3)

23.09.2024 19 min

Der Weg nach KAI – Episode 39: KAI 2027: OpenAIs O1, die Rolle der Robotik und das neue Unternehmertum (Teil 3)    Im dritten Teil der vierteiligen Episode von "Der Weg nach KAI" untersuchen wir die Konsequenzen, die sich durch die Künstliche Allgemeine Intelligenz ab dem Jahr 2027 ergeben.  Der Fokus liegt dabei auf dem Jahr 2027 und den emergenten Phänomenen, die durch autonome KAI-Systeme entstehen könnten. Wir beginnen mit der Erklärung des Begriffs Emergenz und wie dieser sich auf die Entwicklung von KI-Modellen übertragen lässt.  Dabei wird die Parallele zum menschlichen Gehirn gezogen und erläutert, wie sowohl künstliche als auch biologische neuronale Netzwerke komplexe Fähigkeiten durch Selbstorganisation und Selbstlernen entwickeln.  Wir untersuchen die potenziellen Auswirkungen der KAI auf verschiedene Bereiche wie soziale Netzwerke und das Finanzwesen und deren Einfluss auf traditionelle Strukturen, insbesondere im Bildungs- und Gesundheitssektor.  Am Beispiel der Medizin zeigt sich, wie sich die Ausbildung und Praxis von Ärzten verändern könnte, wobei die Bedeutung menschlicher Qualitäten wie Empathie und Kommunikationsfähigkeiten hervorgehoben wird.  Auch die Auswirkungen der KAI auf die Werbebranche und wie sie die Personalisierung und Effizienz von Marketingkampagnen revolutionieren könnte, sind Thema. 
KAI 2027: OpenAIs O1, die Rolle der Robotik und das neue Unternehmertum (Teil 2)

19.09.2024 23 min

Der Weg nach KAI – Episode 38: KAI 2027: OpenAIs O1, die Rolle der Robotik und das neue Unternehmertum (Teil 2)  In zweiten Teil der vierteiligen Episode von "Der Weg nach KAI" tauchen wir tiefer in die Frage ein, ob Künstliche Allgemeine Intelligenz (KAI) bis zum Jahr 2027 Realität werden könnte. Obwohl aktuelle KI-Modelle wie OpenAIs O1 in spezialisierten Bereichen beeindruckende Leistungen zeigen, fehlt ihnen noch die Fähigkeit zur Generalisierung und kontextübergreifenden Wissensanwendung, die für eine echte KAI essenziell ist.  Wir untersuchen auch, warum die Entwicklung autonomer KI-Agenten ein wichtiger Indikator für das Erreichen einer KAI ist und welche Auswirkungen dies auf verschiedene Bereiche wie Logistik und Wirtschaft haben könnte. Ein zentrales Thema ist die Notwendigkeit für KI-Systeme, ein internes Modell der realen Welt zu konstruieren. Verkörperte KI in Form von Robotern spielt dabei eine entscheidende Rolle, da sie es KI-Systemen ermöglicht, direkte sensorische Erfahrungen zu sammeln und ein intuitives Verständnis von Kausalität zu entwickeln. Wir betrachten, wie hybride Datensätze, die aus Simulationen und realen Erfahrungen generiert werden, das Training zukünftiger KI-Modelle beschleunigen können. Anhand des Beispiels des Haushaltsroboters NEO von 1X wird verdeutlicht, wie die Kombination aus fortschrittlichen KI-Modellen und Robotik die Entwicklung einer KAI auf Level 3 oder 4 der Google DeepMind Klassifikation vorantreiben kann.
KAI 2027: OpenAIs O1, die Rolle der Robotik und das neue Unternehmertum (Teil 1)

17.09.2024 22 min

Der Weg nach KAI – Episode 37: KAI 2027: OpenAIs O1, die Rolle der Robotik und das neue Unternehmertum (Teil 1)  In diesem ersten Teil der neuen vierteiligen Episode von "Der Weg nach KAI" beginnen wir mit der Definition für eine KAI, die Künstliche Allgemeine Intelligenz, und wagen eine Entstehungsprognose für das Jahr 2027. Zu Beginn wird die hoffnungstragende Nachricht über einen Durchbruch im Kampf gegen COVID-19 thematisiert, bei dem Forscher der Universität von Texas in Austin einen vielversprechenden Antikörper namens SC27 isolieren konnten.  Wir betrachten die Bedeutung von spezialisierten KI-Systemen wie AlphaProteo von Google DeepMind, das einen weiteren Meilenstein in der Biomedizin darstellt. Es ist jedoch schwierig, eine einheitliche Definition für eine Künstliche Allgemeine Intelligenz zu finden, da Experten unterschiedliche Ansichten darüber haben, welche Fähigkeiten eine KI als "allgemein intelligent" qualifizieren. Zur Klassifizierung dieser Entwicklung wird ein Schema von Google DeepMind vorgestellt, das von der "Narrow AI" bis zur "General AI" reicht und fünf aufeinander aufbauende Leistungsstufen unterscheidet. Abschließend wird das kürzlich erschienene KI-Modell O1 von OpenAI thematisiert, das trotz Nutzungslimitierungen einen wichtigen Schritt in Richtung einer Künstlichen Allgemeinen Intelligenz darstellt.  O1 baut auf GPT-4o auf und nutzt Q-STaR-Techniken, um beeindruckende Lösungswege für physikalische und mathematische Probleme zu finden. Dennoch ist auch O1 noch weit von einer menschenähnlichen allgemeinen Intelligenz entfernt. 
Das Ende von RAG? 100 Millionen Token und der autonome Krypto-Handel für GPT-6

08.09.2024 21 min

Der Weg nach KAI – Episode 36: Das Ende von RAG? 100 Millionen Token und der autonome Krypto-Handel für GPT-6 Wir beginnen mit einer Rückschau auf die Ankündigung von OpenAI Japan, noch in diesem Jahr das leistungsstarke KI-Modell "GPT-Next" zu veröffentlichen. Doch der Fokus der Episode liegt auf zwei anderen wichtigen Entwicklungen: der Hinfälligkeit des limitierten Kontextfensters bei KI-Modellen und der Fähigkeit von KI-Agenten, eigenständig Kryptowährungstransaktionen durchzuführen. Das Unternehmen Magic AI hat mit seinem "LTM-2-Mini" Modell einen neuen Maßstab gesetzt, indem es beeindruckende 100 Millionen Token im Kurzzeitgedächtnis verarbeiten kann. Diese Entwicklung eröffnet neue Möglichkeiten für die Analyse umfangreicher Datenmengen ohne zusätzliche Hilfsmittel. Der Podcast vergleicht diesen Ansatz mit der Retrieval-Augmented Generation (RAG) Methode und erläutert die Vor- und Nachteile beider Verfahren. Ein weiteres spannendes Thema ist die erfolgreiche Durchführung einer vollständig von KI-Agenten abgewickelten Kryptowährungstransaktion. Diese Entwicklung zeigt die wachsende Autonomie von KI-Systemen und eröffnet neue Möglichkeiten für ihre Teilnahme an wirtschaftlichen Aktivitäten. Abschließend wirft die Episode einen Blick auf die Zukunft der KI-Entwicklung. OpenAI plant mit GPT-6 die Integration autonomer KI-Agenten, während Elon Musks Unternehmen xAI mit der Fertigstellung der weltgrößten KI-Rechenfarm "Colossus" für Aufsehen sorgt. Die Ankündigung Musks, eine Künstliche Allgemeine Intelligenz bis 2026 zu erreichen, wird in der Branche zunehmend erns...
OpenAIs GPT-5 vs "Orion"? Die Verbindung von AlphaCode 2, Strawberry und Quiet-STaR

01.09.2024 18 min

Der Weg nach KAI – Episode 35: OpenAIs GPT-5 vs "Orion"? Die Verbindung von AlphaCode 2, Strawberry und Quiet-STaR  Die neueste Episode des Podcasts "Der Weg nach KAI" widmet sich den aktuellen Entwicklungen bei OpenAI und deren Auswirkungen auf die Fortschritte in Richtung Künstlicher Allgemeiner Intelligenz. Ein besonderer Fokus liegt wiederholt auf der sogenannten Q-Star-Methodik, die OpenAI für die Entwicklung seiner neuen KI-Modelle zu nutzen scheint. Die Entstehung von Q-Star gleicht einem Forschungs-Krimi, denn nach einem Informationsleck im November 2023 wurde klar, dass OpenAI die Idee des "Self-Taught Reasoner" (STaR) von Google-Forschern adaptiert und weiterentwickelt hat. Auch Google arbeitet an ähnlichen Ansätzen wie dem KI-Modell AlphaCode 2, das jedoch aufgrund hoher Betriebskosten noch nicht veröffentlicht wurde Wir erfahren von einem mysteriösen zusätzlichen KI-Modell namens "ORION", das als Nachfolger von GPT-4 gehandelt wird. Die Episode spekuliert über die Beziehung zwischen dem "Strawberry" / Q-STaR Modell und ORION und stellt die Hypothese auf, dass Strawberry als eine Art "Muttermodell" für spezialisierte Tochtermodelle wie ORION dienen könnte. Der Herbst 2024 verspricht also ein spannendes Kapitel in der Geschichte der KI zu werden. Neben OpenAI dürften auch Konkurrenten wie Google, Anthropic und Elon Musks Grok-Modell für Überraschungen sorgen. Um sich für die Zukunft zu wappnen, plant OpenAI eine neue Finanzierungsrunde, die das Unternehmen mit über 100 Milliarden Dollar bewerten könnte. Mit der Unterstützung von Investoren will OpenAI seine Fü...
Unsere Zukunft mit KI: Das "Alpha"-Potenzial, Multi-Omics und ein Business-transformierendes 2026

22.08.2024 22 min

Der Weg nach KAI – Episode 34: Unsere Zukunft mit KI: Das "Alpha"-Potenzial, Multi-Omics und ein Business-transformierendes 2026 In dieser Episode werfen wir einen Blick auf das Jahr 2026. Dafür untersuchen wir zunächst die besonderen Möglichkeiten, die sich durch die Kombination spezialisierter KI-Modelle von Google DeepMind ergeben. Ein faszinierendes Beispiel für Googles Innovationskraft ist das HeAR-Modell, das Lungenkrankheiten anhand von Audioaufnahmen erkennen kann. Doch das ist nur die Einleitung zu einem viel größeren Thema für das Jahr 2026: die Multi-Omics.  Der Begriff "Multi-Omics" bezieht sich auf die Integration und Analyse verschiedener "Omics"-Disziplinen wie Genomik, Proteomik und Metabolomik, um ein umfassendes Verständnis der biologischen Systeme zu erlangen.  Multi-Omics ist der Schlüssel zu einer neuen Stufe der personalisierten Medizin, bei der Behandlungspläne auf die genetische Ausstattung und die spezifischen biologischen Bedingungen eines Individuums zugeschnitten sind. Wir untersuchen auch die Bedeutung der Omnimodalität, die im Jahr 2026 eine zentrale Rolle spielen wird. Die daraus resultierende Effizienz und Leistungsfähigkeit von KI-Systemen sowie das nahtlose Wechseln zwischen verschiedenen Datenverarbeitungsmöglichkeiten werden enorme Auswirkungen auf den Businessbereich haben. Die fortschrittlichen Sprachverarbeitungsfähigkeiten werden intelligente Chatbots und virtuelle Assistenten im Unternehmensalltag etablieren, die auch komplexe Anfragen verstehen und bearbeiten können. 
Unsere Zukunft mit KI: Die nächste Modell-Generation und ein wegweisendes 2025 (Teil 2)

19.08.2024 22 min

Der Weg nach KAI – Episode 33:  Unsere Zukunft mit KI:  Die nächste Modell-Generation und ein wegweisendes 2025 (Teil 2) Im zweiten Teil beginnen wir mit den zu erwartenden Entwicklungen im Bereich der personalisierten KI-Agenten, die als digitale Begleiter unseren Alltag erleichtern werden. Die zunehmende Benutzerfreundlichkeit dieser Systeme wird es auch Laien ermöglichen, KI-Assistenten für verschiedenste Aufgaben einzusetzen, von der Datensortierung bis hin zur Produktentwicklung. Wir untersuchen die Verbreitung der sog. Large Action Models (LAMs), die über das bloße Textverstehen hinausgehen und konkrete digitale Handlungen ausführen können. Auch den Einsatz von KI im öffentlichen Raum betrachten wir kritisch. Beispiele wie das chinesische Sozial-Kreditsystem oder die Standardisierung von Mitarbeiterlächeln in japanischen Supermärkten sind aber real existierende Einsatzszenarien. Im Bereich der Medien und Unterhaltung verfolgen wir die Fortschritte bei KI-generierten Videos und deren potenzielle Auswirkungen auf die Spieleindustrie und den Bildungssektor. Hier stehen die unkomplizierten, KI-generierten 3D-Welten in den Startlöchern.  Und auch die sehr zutreffenden Vorhersagen von David Bowie in den 1990er Jahren über das Internet spielen eine Rolle, während so einige spannende medizinische Innovationen ihr Licht für das Jahr 2026 bereits vorauswerfen.
Unsere Zukunft mit KI: Die nächste Modell-Generation und ein wegweisendes 2025 (Teil 1)

17.08.2024 21 min

Der Weg nach KAI – Episode 32:  Unsere Zukunft mit KI: Die nächste Modell-Generation und ein wegweisendes 2025 (Teil 1) Im ersten Teil dieser Episode betrachten wir den aktuellen Stand der KI-Entwicklung und wagen einen Ausblick auf das Jahr 2025. Denn es herrscht eine gewisse Unsicherheit, ob der Fortschritt der letzten Jahre anhalten wird. Während große Unternehmen Milliarden in KI investieren, werden auch Stimmen lauter, die von einem KI-Hype sprechen und eine Phase der Ernüchterung prophezeien.  Gleichzeitig stehen spannende Entwicklungen an, wie das neue KI-Modell Grok 2 von Elon Musk und der Open-Source Bildgenerator FLUX, die mit unzensierter Inhaltsgenerierung aufwarten. Auch die nächsten Generationen der Modelle von OpenAI und Anthropic, GPT-5 und Claude 4, werden mit Spannung erwartet.  Ein weiteres Thema ist der Einfluss von KI auf die Arbeitswelt. Wir gehen davon aus, dass die Nachfrage nach KI-Kompetenzen steigen wird und Unternehmen sich verstärkt auf die Weiterbildung ihrer Mitarbeiter konzentrieren müssen. Auch die ersten Anzeichen von Arbeitsplatzverlagerungen durch Automatisierung werden 2025 sichtbar werden. Gleichzeitig entstehen neue Berufe und Möglichkeiten im Bereich der KI, wie KI-Projektmanager oder KI-Botschafter. Abschließend widmen wir uns dem Thema Robotik und der Frage, wann humanoide Roboter in unseren Alltag Einzug halten werden. Denn während der Einsatz in der Industrie bereits Realität ist, werden Haushaltsroboter wohl erst in den kommenden Jahren alltagstauglich und erschwinglich werden. 
Innovative KI-Strategien für Unternehmen: Prompt Management, Mixture of Agents und die "reflektierte" KI (Teil 2)

10.08.2024 18 min

Der Weg nach KAI – Episode 31: Innovative KI-Strategien für Unternehmen: Prompt Management, Mixture of Agents und die "reflektierte" KI (Teil 2) Im zweiten Teil dieser Episode betrachten wir, wie kleinere KI-Modelle durch präzise Instruktionen und Antwortbeispiele bestmögliche Leistungen erzielen können. Ein besonders interessantes Beispiel dafür ist der GPT-Prompt-Engineer, ein Tool, das die Zusammenarbeit zwischen einem größeren und einem kleineren KI-Modell nutzt, um die Leistung des kleineren Modells zu optimieren. Es automatisiert den Prozess des Prompt-Engineerings, indem es eine Vielzahl von Eingabe-Varianten erstellt und systematisch testet. Das größere Modell arbeitet dabei als Lehrer, der kontextrelevante Beispiele und Vorgaben erstellt, die das kleinere Modell dann verwendet, um bessere Ergebnisse zu erzielen. Wir diskutieren auch die Vorteile von Open-Source-Modellen wie Metas neuester Llama 3.1 KI-Modellfamilie, die eine bemerkenswerte Alternative zu geschlossenen Systemen darstellt. Diese Modelle ermöglichen es Unternehmen, maßgeschneiderte KI-Lösungen zu entwickeln, die unabhängig von externen Anbietern sind. Dies ist besonders wichtig, um die Kontrolle über sensible Unternehmensdaten zu behalten und die Abhängigkeit von externen Diensten zu minimieren. Zum Abschluss werfen wir einen Blick auf fortschrittliche Konzepte wie "Mixture of Agents" und "Route LLM", die es erlauben, die Leistungsfähigkeit verschiedener KI-Modelle optimal zu nutzen. Diese Ansätze zeigen, wie spezialisierte KI-Agenten zusammenarbeiten können, um komplexe Aufgaben zu lösen. Die zun...
Innovative KI-Strategien für Unternehmen: Prompt Management, Mixture of Agents und die "reflektierte" KI (Teil 1)

07.08.2024 17 min

Der Weg nach KAI – Episode 30: Innovative KI-Strategien für Unternehmen: Prompt Management, Mixture of Agents und die "reflektierte" KI (Teil 1) Im ersten Teil dieser Folge von "Der Weg nach KAI" erkunden wir die zunehmende Bedeutung von Künstlicher Intelligenz für Unternehmen. Wir setzen uns kritisch mit der Tatsache auseinander, dass viele Führungskräfte das transformative Potenzial von KI unterschätzen und sie lediglich als Werkzeug zur Prozessoptimierung betrachten, anstatt ihre disruptive und schöpferische Kraft anzuerkennen. Wir erläutern den historischen Kontext der beeindruckenden Kostenentwicklung im Bereich der generativen KI, denn die Nutzungskosten für große Sprachmodelle sind in den letzten Jahren um 99% gesunken, was neue Möglichkeiten für Unternehmen eröffnet.  Wir vertiefen das Konzept der Tokenisierung und untersuchen die Auswirkungen der Erweiterung der sogenannten Kontextfenster in KI-Systemen sowie deren Auswirkungen auf die Mensch-Maschine-Interaktion. Hier deutet sich an, wie diese Entwicklung zu einer kontinuierlichen, sich selbst verbessernden Zusammenarbeit zwischen Mensch und KI führen wird. Auch die Fortschritte bei der Optimierung kompakter KI-Modelle werden vorgestellt. Wir erklären Techniken wie "Knowledge Distillation" und die automatische Modellauswahl, die es ermöglichen, ressourcenschonende und effiziente KI-Lösungen für spezifische Aufgaben zu entwickeln.
Minecraft, Goat Simulator und digitale "Personas": Synthetische Daten auf dem Weg zur KAI

01.08.2024 22 min

Der Weg nach KAI – Episode 29: Minecraft, Goat Simulator und digitale "Personas": Synthetische Daten auf dem Weg zur KAI In der aktuellen Folge beschäftigen wir uns mit einer zentralen Herausforderung der KI-Branche: dem Mangel an qualitativ hochwertigen Trainingsdaten. Trotz der Fülle an verfügbaren Daten im Internetzeitalter wird der Zugang zu diesen Daten zunehmend eingeschränkt, da viele Webseiten ihre Inhalte schützen und monetarisieren.  Ein Lösungsansatz ist die Nutzung synthetischer Daten. Diese werden mithilfe von Algorithmen erstellt, um die statistischen Eigenschaften echter Daten zu reproduzieren, ohne deren spezifische Inhalte zu kopieren.  Ein aktueller Ansatz für die Generierung synthetischer Daten bietet das Tencent AI Lab in Seattle, das innovative Methoden zur Erstellung von "Personas" entwickelt hat. Diese virtuellen Charaktere dienen als Stellvertreter für reale Menschen und erzeugen wertvolle Trainingsdaten durch ihre Interaktionen. Auch die Verwendung von Spielen wie Minecraft und dem Goat Simulator als Trainingsgrundlage für KI-Modelle ist Thema. Diese Spiele bieten eine komplexe und realistische Umgebung, in der KI-Systeme lernen und sich weiterentwickeln können. Durch das Spielen erzeugt die KI selbstreferentielle synthetische Daten, die besonders wertvoll sind, da sie direkt aus den eigenen Erfahrungen und Entscheidungen der KI stammen. Diese Folge zeigt, wie synthetische Daten die Zukunft der KI-Forschung gestalten und den Weg zur Künstlichen Allgemeinen Intelligenz ebnen könnten.
Dark Factories, menschliches Talent und neue Führungsaufgaben: Die Zeichen einer veränderten Arbeitswelt

29.07.2024 20 min

Der Weg nach KAI – Episode 28: Dark Factories, menschliches Talent und neue Führungsaufgaben: Die Zeichen einer veränderten Arbeitswelt In dieser Folge wagen wir einen Blick in die Zukunft der Arbeit im Zeitalter der Künstlichen Intelligenz. Wir untersuchen die Prognosen von Experten wie Larry Summers und Kai-Fu Lee, die davon ausgehen, dass KI das Potenzial hat, in den kommenden Jahren einen Großteil der menschlichen Arbeit zu ersetzen.  Wir gehen auf konkrete Beispiele ein, wie das Fintech-Unternehmen Klarna, das KI erfolgreich in seinen Kundenservice integriert hat, oder Xiaomis Ankündigung einer vollautomatisierten "Dark Factory" zur Smartphone-Produktion. Ein besonderer Fokus liegt auf der Bedeutung von emotionaler Intelligenz und Soft Skills in der zukünftigen Arbeitswelt. Wir erörtern, wie Führungskräfte sich anpassen müssen, um den Herausforderungen der KI-Integration gerecht zu werden und ihre Teams durch diesen Wandel zu führen. 
Die Evolution der Technikangst: Vom Buchdruck zur Künstlichen Intelligenz (Teil 2)

25.07.2024 17 min

Der Weg nach KAI – Episode 27:  Die Evolution der Technikangst: Vom Buchdruck zur Künstlichen Intelligenz (Teil 2) Im zweiten Teil betrachten wir, wie große Medienhäuser weltweit zunächst mit Ablehnung auf die Nutzung ihrer Inhalte zum Training von KI-Modellen reagierten, wobei sich hier aber inzwischen ein Paradigmenwechsel abzeichnet. Anhand der Zusammenarbeit zwischen OpenAI und dem Time Magazine sowie The Atlantic wird gezeigt, wie Kooperationen zwischen Medienunternehmen und KI-Entwicklern aussehen können.  Wir untersuchen die Entwicklungen in der Musikindustrie, wo YouTube mit großen Musiklabels über KI-Musiklizenzen verhandelt. Dies verdeutlicht, wie verschiedene Branchen versuchen, die Entwicklung von KI-Technologien mitzugestalten, anstatt sich ihnen zu widersetzen. Als weiteres Positives Beispiel vertiefen wir die Fortschritte in der Materialforschung und Medikamentenentwicklung durch KI. Beispielsweise hat Google DeepMind eine Software entwickelt, die Millionen neuer Werkstoffe generiert hat, von denen einige als Supraleiter dienen oder die Leistung von Batterien verbessern könnten. In der Medikamentenforschung ermöglicht KI präzisere Vorhersagen und könnte in Zukunft sogar Tierversuche überflüssig machen.
Die Evolution der Technikangst: Vom Buchdruck zur Künstlichen Intelligenz (Teil 1)

23.07.2024 18 min

Der Weg nach KI – Episode 26: Die Evolution der Technikangst: Vom Buchdruck zur Künstlichen Intelligenz (Teil 1) In diesem ersten Teil der neuen Podcastfolge beschäftigen wir uns mit der Skepsis und Angst gegenüber Künstlicher Intelligenz. Anlass ist ein kontroverses Werbevideo von Toys "R" Us, das vollständig mithilfe von KI erstellt wurde und aufgrund visueller Inkonsistenzen für Aufsehen sorgte. Die heftigen Reaktionen zeigen, wie sensibel die Öffentlichkeit auf KI-generierte Inhalte reagiert und dass noch viel Aufklärungsbedarf besteht. Zum besseren Verständnis der weit verbreiteten Technikangst unternehmen wir eine Reise in die Vergangenheit und ziehen Parallelen zu historischen Beispielen technologischer Umbrüche, die ebenfalls auf Widerstand stießen. So führte die Industrialisierung der Textilproduktion Ende des 18. Jahrhunderts in England zur "Maschinenstürmerei" durch die Ludditen, die um ihre Arbeitsplätze fürchteten. Auch die Erfindung des Buchdrucks im 15. Jahrhundert stieß bei den Mönchen, deren Aufgabe das handschriftliche Kopieren war, auf Kritik. Und die Fotografie im 19. Jahrhundert löste unter Malern Existenzängste aus. Doch letztlich eröffneten diese Innovationen viele neue Möglichkeiten und trieben den Fortschritt auf unerwarteten Ebenen voran. Der Buchdruck demokratisierte den Zugang zu Wissen, die Fotografie befreite die Kunst von der exakten Abbildung der Realität - ähnlich wird es mit der KI sein. Allerdings vollzieht sich der digitale Wandel in einem viel schnelleren Tempo als frühere Umbrüche.
OpenAIs "Strawberry", Q-STaR und die Monte-Carlo-Glücksspiel-Strategie (Teil 2)

18.07.2024 19 min

Der Weg nach KAI – Episode 25: OpenAIs "Strawberry", Q-STaR und die Monte-Carlo-Glücksspiel-Strategie (Teil 2)  Im zweiten Teil dieser Folge vertiefen wir die Erkenntnisse, wie hilfreich die "Monte Carlo Tree Search" (MCTS) auf dem Weg zur Künstlichen Allgemeinen Intelligenz ist. Die Philosophie der MCTS entspringt der "Glücksspiel-Strategie" und ermöglicht es KI-Systemen, komplexe (Spiel-)Situationen zu analysieren und erfolgversprechende Antworten zu definieren. Am Beispiel von AlphaGo zeigt sich eindrucksvoll, wie die Kombination aus neuronalen Netzen und MCTS zu enormen Leistungssprüngen führt. Die Zukunft der KI liegt in der cleveren Kombination von kompakten Modellen für effiziente Alltagsaufgaben auf Endgeräten und leistungsstarken Cloud-Giganten für komplexe Analysen. Dieses Zusammenspiel verspricht Benutzerfreundlichkeit, Ressourceneffizienz und Hochleistung. Wir untersuchen die Rolle von Faktoren wie Zeit, Datenqualität und Rechenleistung und wie wichtig die geschickte Kombination aus schnellem, intuitivem "System 1 Denken" und langsamem, analytischem "System 2 Denken" ist.  Mit jedem Fortschritt kommen wir dem Zeitpunkt näher, an dem KI-Systeme auf dem Niveau promovierter Experten agieren können - mit enormen Auswirkungen auf Forschung, Medizin und Wissenschaft. 
OpenAIs "Strawberry", Q-STaR und die Monte-Carlo-Glücksspiel-Strategie (Teil 1)

16.07.2024 19 min

Der Weg nach KAI – Episode 24: OpenAIs "Strawberry", Q-STaR und die Monte-Carlo-Glücksspiel-Strategie (Teil 1)   Im ersten Teil dieser Folge geht es vorrangig um die 5-stufige Kategorisierung der KI-Entwicklung, die OpenAI kürzlich vorgestellt hat. Diese Skala reicht von einfachen Chatbots bis hin zu KI-Systemen, die ganze Organisationen führen können. OpenAI befindet sich laut interner Einschätzung derzeit auf der ersten "Chatbot"-Stufe, steht aber kurz davor, die zweite Stufe der "Reasoners" zu erreichen, die menschenähnliches logisches Denken ermöglichen.  Das damit verbundene interne Projekt wird als "Strawberry" bezeichnet. Um die evtl. Auswirkungen dieser Ankündigung zu verstehen, blicken wir auf die Ereignisse im November 2023 zurück, als Gerüchte über ein geheimes Projekt namens "Q-Star" aufkamen. Dabei handelt es sich um einen Algorithmus, der Q-Learning mit der A-STaR Methode kombiniert, um die Schlussfolgerungsfähigkeiten von KI-Modellen zu verbessern. Anhand eines Beispiels wird erklärt, wie ein "Self-Taught Reasoner" durch wiederholtes Lernen und Verbessern seine Fähigkeiten optimiert. Die Kombination aus Q-Learning und A-STaR soll dem neuen KI-System schließlich verbesserte Fähigkeiten im logischen Denken und Problemlösen verleihen. Abschließend klären wir das Leistungspotenzial der "Monte Carlo Tree Search"-Methode, die auch bei Google DeepMinds AlphaGo schon zum Einsatz kam. Diese ermöglicht es KI-Systemen, durch Versuch und Irrtum zu lernen, ohne auf spezifisches Domänenwissen angewiesen zu sein.  Eine Weiterentwicklung dieser Methode durch das Shanghai ...
Freier Zugang, "Lawfare" und Zensur: Die Rolle von Open Source in der KI-Entwicklung

11.07.2024 14 min

Der Weg nach KAI - Episode 23: Freier Zugang, "Lawfare" und Zensur: Die Rolle von Open Source in der KI-Entwicklung In dieser Episode tauchen wir tief in die Diskussion um die Relevanz und Zukunftsaussichten von Open-Source-KI-Modellen ein. Wir untersuchen, wie frei verfügbare KI-Modelle wie Stable Diffusion die Welt der KI-gestützten Bildgenerierung revolutioniert haben, indem sie jedermann ermöglichten, beeindruckend realistische Bilder allein durch Texteingaben zu erzeugen - und das nahezu kostenfrei. Doch während Open-Source-Pioniere wie Stability AI in finanziellen Schwierigkeiten stecken, mausert sich Meta zu einem der größten Förderer von Open-Source-KI. Mit Modellen wie Llama 3, AudioCraft und SAM demonstriert das Unternehmen glaubhaft sein Engagement und ermöglicht Forschern und Entwicklern weltweit, auf einer fortschrittlichen Grundlage aufzubauen. Wir erkunden, wie Open-Source-KI-Modelle eine wichtige Rolle spielen, um dem Phänomen des "Lawfare" - dem strategischen Einsatz von rechtlichen Verfahren, um Konkurrenten zu behindern - entgegenzuwirken und eine Zensur durch einseitige Interessen zu verhindern.
Einfach bessere KI-Ergebnisse: Das "Prompt Engineering"

08.07.2024 17 min

Der Weg nach KAI – Episode 22: Einfach bessere KI-Ergebnisse: Das "Prompt Engineering"   In dieser Episode tauchen wir tief in das Thema "Prompting" ein. Mit der zunehmenden Komplexität und Leistungsfähigkeit von KI-Systemen hat sich das Fachgebiet des "Prompt Engineering" entwickelt. Dabei geht es darum, Eingabeaufforderungen so zu gestalten, dass sie die bestmöglichen Ergebnisse von einem KI-Modell liefern. Prompt Engineers sind Experten, die sich darauf spezialisiert haben, die Kommunikation zwischen Mensch und KI zu optimieren.  In der Welt des Prompt Engineering haben sich zwei besonders effektive Techniken herauskristallisiert: das "Chain of Thought" und "Tree of Thought" Prompting. Bei der "Chain of Thought" Methode wird die KI angeleitet, die einzelnen Gedankenschritte zu artikulieren, die zu einer Antwort führen. Das "Tree of Thought" Prompting ermutigt die KI hingegen, mehrere mögliche Lösungswege gleichzeitig zu erkunden, ähnlich wie die Äste eines Baumes. Beide Methoden haben bewiesen, dass sie die Leistung von KI-Modellen bei komplexen Aufgaben deutlich verbessern können. Es gibt konkrete Prompting-Tipps, damit Ihr das Beste aus euren Interaktionen mit KI-Modellen herausholt. Dazu gehören Empfehlungen wie präzise und spezifische Anfragen zu stellen, ausreichend Kontext zu liefern, das gewünschte Ausgabeformat zu spezifizieren, Rollenzuweisungen zu nutzen und die Prompts iterativ zu verfeinern. Außerdem erklären wir, wie man durch Beispiele (Few-Shot Prompting), Zerlegung komplexer Aufgaben (Task Decomposition) und Aufforderung zur Eigenanalyse der KI die Erg...
Datenschutz vs. Innovation: Apples KI-Dilemma in Europa

04.07.2024 18 min

Der Weg nach KAI – Episode 21: Datenschutz vs. Innovation: Apples KI-Dilemma in Europa  In dieser Folge geht es um den sich abzeichnenden Konflikt zwischen Apple und der Europäischen Union und die Herausforderungen beim Datenschutz im Kontext der Künstlichen Intelligenz. Apple hat angekündigt, seine neuen KI-Funktionen wie iPhone Mirroring, SharePlay Screen Sharing und Apple Intelligence in Europa erst später einzuführen als im Rest der Welt. Das Unternehmen begründet dies mit regulatorischen Unsicherheiten durch den neuen Digital Markets Act (DMA) der EU. Apple befürchtet, dass die Interoperabilitätsanforderungen des DMA die Integrität seiner Produkte gefährden und Datenschutz und Sicherheit der Nutzer beeinträchtigen könnten. In diesem Kontext betrachten wir die Herausforderungen, die sich aus der rasanten Entwicklung der KI für den Datenschutz ergeben. Etablierte Vorstellungen von Einwilligung, Transparenz, Zugriff und Kontrolle über persönliche Daten werden durch die Rechenkraft und Komplexität von KI-Systemen infrage gestellt. Es braucht einen gesellschaftlichen Dialog darüber, welche Daten zu welchen Zwecken preisgegeben werden sollen und Wege, die Entwicklung sicherer und fairer KI mit technologischem Fortschritt in Einklang zu bringen. Technische Ansätze wie Anonymisierung, Federated Learning und Differential Privacy können helfen, KI datenschutzfreundlicher zu gestalten. Der Trend geht zu mehr "Privacy by Design", um Datenschutz von Anfang an in die Technik einzubauen. Unternehmen, Regulierer, Datenschützer und andere Stakeholder müssen eng zusammenarbeiten, um ...
"What did Ilya see?", Ray Kurzweil und die Künstliche Superintelligenz (Teil 2)

01.07.2024 15 min

Der Weg nach KAI – Episode 20: "What did Ilya see?", Ray Kurzweil und die Künstliche Superintelligenz (Teil 2)   Im zweiten Teil dieser Podcastfiolge untersuchen wir Ray Kurzweils Vorhersagen zur Entwicklung einer Künstlichen Allgemeinen Intelligenz (KAI) und deren Einfluss auf die von Ilya Sutskever angestrebte Superintelligenz. Ray Kurzweil ist ein bemerkenswerter Erfinder und Zukunftsforscher. Er leistete Pionierarbeit in den Bereichen optische Zeichenerkennung, Flachbettscanner, Text-to-Speech-Synthese und Spracherkennung. Seine Erfindungen revolutionierten die Musikindustrie und halfen blinden Menschen durch Maschinen, die gedruckte Texte in Sprache umwandeln konnten. Kurzweil bewies sich auch als präziser Prognostiker. Er sagte den Sieg eines Schachcomputers über einen Weltmeister bis 1998 voraus und prognostizierte die Steuerung von Computern über natürliche Sprache. Seine zentrale Vorhersage jedoch ist die Entstehung einer KAI bis 2029, die den Turing-Test bestehen und menschenähnliche kognitive Fähigkeiten zeigen wird. Noch weitreichender ist seine Prognose einer technologischen Singularität bis 2045, wenn KI die menschliche Intelligenz so weit übertrifft, dass die weitere Entwicklung für uns unvorhersehbar wird. Dies würde den Übergang zu einer Künstlichen Superintelligenz (KSI) markieren. Kurzweils Visionen beeinflussen die aktuelle KI-Forschung, wie Ilya Sutskevers Projekt einer "sicheren Superintelligenz" zeigt. Eine funktionierende KAI könnte durch Selbstoptimierung den Schritt zur ASI (Artificial Superintelligence) enorm beschleunigen. Dies unterstreicht d...
"What did Ilya see?", Ray Kurzweil und die Künstliche Superintelligenz (Teil 1)

28.06.2024 15 min

Der Weg nach KAI – Episode 19: "What did Ilya see?", Ray Kurzweil und die Künstliche Superintelligenz (Teil 1) In dieser Folge geht es um die Gründung des neuen Unternehmens "Safe Superintelligence Inc." (SSI) durch den renommierten KI-Forscher Ilya Sutskever.  Sutskever war bis vor kurzem Chief Scientist bei OpenAI und maßgeblich an der Entwicklung von Technologien beteiligt, die hinter Systemen wie ChatGPT stehen. Im November 2023 war Sutskever an der kurzfristigen Entlassung von OpenAI-CEO Sam Altman beteiligt. Das daraufhin entstandene Meme "What did Ilya see?" ist bis heute Ausdruck der Spekulationen, dass er möglicherweise etwas Beunruhigendes bei OpenAI gesehen haben könnte. Nur einen Monat nach seinem Ausscheiden im Mai 2024 konzentriert er sich nun auf die Entwicklung einer sicheren Superintelligenz. Im weiteren Verlauf vergleichen wir die Konzepte der Künstlichen Allgemeinen Intelligenz (KAI) und der Künstlichen Superintelligenz (ASI). Eine ASI würde menschliche Fähigkeiten weit übertreffen, was ethische und sicherheitsrelevante Bedenken aufwirft und besonders das Kontrollproblem ("Alignment") adressiert. Die Begriffe KAI/AGI und ASI haben eine lange Geschichte, geprägt durch Persönlichkeiten wie Alan Turing, John McCarthy, Irving John Good und Nick Bostrom. Wir vertiefen die Entstehungsgeschichte und bereiten den Weg für die erstaunlichen Erfindungen eines Ray Kurzweil, dessen technologischen Vorhersagen bis heute eine omnipräsente Position in der Welt der KI spielen.
"Droiden" im Entwicklungsteam: KI-gestütztes Projektmanagement mit Factory AI

24.06.2024 15 min

Der Weg nach KAI – Episode 18:  "Droiden" im Entwicklungsteam: KI-gestütztes Projektmanagement mit Factory AI  In dieser Folge geht es vordergründig um den Einsatz von KI zur Automatisierung und Optimierung von Softwareentwicklungsprozessen am Beispiel der Plattform "Factory AI". Doch dahinter steckt im übertragenen Potenzial viel mehr.  Die KI-gestützten "Droids" von Factory AI unterstützen den gesamten Entwicklungszyklus - von der Ideenfindung über Planung, Programmierung und Testing bis hin zu Review, Dokumentation und Bereitstellung. Durch Analyse von Markttrends, Kundenbedürfnissen und technischer Machbarkeit helfen sie, vielversprechende Softwareideen zu identifizieren. Beim Wissensaufbau tragen sie relevante Informationen zusammen. In der Planung optimieren sie Ziele, Zeitpläne und Ressourcenzuweisung. Während der Umsetzung generieren sie Code-Vorlagen, geben Empfehlungen und identifizieren Fehler. Beim Testen automatisieren sie die Erstellung und Durchführung von Tests. Im Review analysieren sie den Code auf Qualität und Standards. Sie erstellen automatisch eine umfassende Dokumentation und unterstützen schließlich bei Bereitstellung und Wartung des fertigen Produkts. Basierend auf dieser Vorgehensweise überlegen wir, wie sich diese KI-Unterstützung auch auf allgemeine Geschäftsprojekte und Start-ups übertragen lässt. Die Schritte von Factory AI bieten eine strukturierte Methode, um innovative Ideen effizient umzusetzen. Eine KI-Plattform kann bei Ideenfindung, Wissensaufbau, Projektplanung, Umsetzung, Überprüfung und Dokumentation wertvolle Unterstützung leisten...
Belohnungen für KI-Modelle und die Parallelen zum biologischen Gehirn

21.06.2024 15 min

Der Weg nach KAI – Episode 17: Belohnungen für KI-Modelle und die Parallelen zum biologischen Gehirn In dieser Episode des Podcasts "Der Weg nach KAI" geht es um aktuelle Fortschritte beim Deep Reinforcement Learning, die die Entwicklung in Richtung einer Künstlichen Allgemeinen Intelligenz (KAI) voranbringen.  Eine neue Studie hat ein solches stark lernfähiges Modell entwickelt, das durch Vorhersage von Handlungskonsequenzen seine Leistung und Anpassungsfähigkeit verbessert. Die Informatikerin Fei-Fei Li betont die Bedeutung räumlicher Intelligenz und Multimodalität für zukünftige KI-Systeme, um mit Menschen in der realen Welt interagieren zu können. Gleichzeitig sind Fortschritte beim logischen Schlussfolgern (Reasoning) nötig, um über reine Mustererkennung hinauszugehen. Das vorgestellte Deep Reinforcement Learning Modell lernt durch Belohnungen, optimale Aktionen zu wählen. Durch Vorhersage zukünftiger Zustände kann es sich flexibel an neue Ziele anpassen, ohne aufwendiges Neutraining. Dabei ähnelt es in seiner Funktionsweise dem Hippocampus im Gehirn. Die Kombination von Multimodalität und Reasoning, unterstützt durch vorausschauendes Lernen, könnte ein wichtiger Schritt auf dem Weg zu einer Künstlichen Allgemeinen Intelligenz sein. Und weitere Forschung soll die Modelle noch biologisch realistischer gestalten und von der Interaktion verschiedener Hirnregionen lernen. 
MIA hilft bei der Brustkrebs-Früherkennung, Selbstfürsorge mit KI und Remote-Jobs in Gefahr

18.06.2024 16 min

Der Weg nach KAI – Episode 16: MIA hilft bei der Brustkrebs-Früherkennung, Selbstfürsorge mit KI und Remote-Jobs in Gefahr In dieser Episode von "Der Weg nach KAI" ist die rasante Entwicklung der KI und ihre Auswirkungen auf den Arbeitsmarkt das einleitende Thema. Avital Balwit, Stabschefin des KI-Unternehmens Anthropic, warnt davor, dass viele Jobs, insbesondere im Bereich der Online-Arbeit, bald von KI-Systemen übernommen werden könnten. Anschließend werfen wir einen Blick auf Mia, ein KI-System, das in Großbritannien erfolgreich zur frühzeitigen Erkennung von Brustkrebs eingesetzt wird. Mia analysiert parallel zu den Radiologen die Mammographie-Aufnahmen und konnte in einer Studie mit über 10.000 Patientinnen nicht nur alle Brustkrebsfälle erkennen, die auch den Ärzten auffielen, sondern zusätzlich 11 weitere Fälle identifizieren, die den menschlichen Experten entgangen waren. Durch den Einsatz von Mia als ergänzende "zweite Meinung" könnte sich die Zeit bis zum Befund von bisher etwa 14 Tagen auf nur noch circa 3 Tage verkürzen, was für die Patientinnen eine enorme psychische Entlastung darstellen würde. Abschließend erkunden wir, wie KI bereits heute in verschiedenen Bereichen der Selbstfürsorge eingesetzt wird. Eine neue Studie der University of California zeigt, dass Menschen KI-Systeme wie ChatGPT nutzen, um Ratschläge zu erhalten, Mentoring zu erleben, Ressourcen zu erstellen, soziale Simulationen durchzuführen und sich selbst auszudrücken. Besonders beliebt ist es, die KI um Rat zu fragen, sei es zur Stressbewältigung, Ernährung oder Schlafhygiene. 
KI-Fabriken, NIMs und das "Ein-Personen-Milliarden-Dollar-Unternehmen"

13.06.2024 17 min

Der Weg nach KAI – Episode 15: KI-Fabriken, NIMs und das "Ein-Personen-Milliarden-Dollar-Unternehmen" Diesmal geht es um die rasante Entwicklung von KI-Agenten und deren Potenzial, ganze Industrien zu revolutionieren. Während die meisten Menschen bei verbesserten KI-Modellen wie GPT-5 hauptsächlich an bessere Textgenerierung denken, liegt die wahre Revolution in der Fähigkeit von Künstlicher Intelligenz, eigenständig komplexe Aufgaben zu erledigen. Unternehmen wie Google, Microsoft und Nvidia entwickeln bereits Cloud-Plattformen, auf denen Kunden ihre eigenen KI-Agenten trainieren und einsetzen können. Ein Schlüsselkonzept sind dabei sogenannte "KI-Fabriken" - virtuelle Produktionsstätten, in denen spezialisierte KI-Teams zusammenarbeiten, um anspruchsvolle Probleme zu lösen. Diese Agenten könnten in Zukunft ganze Geschäftsmodelle eigenständig konzipieren und betreiben, von Online-Shops bis hin zu Mobilitätsplattformen für autonome Fahrzeuge. Das Geschäftsmodell "Agents as a Service" (AaaS) ermöglicht es Anbietern, maßgeschneiderte KI-Lösungen zu verkaufen. Dies könnte laut Experten wie Sam Altman von OpenAI sogar zur Entstehung von "Ein-Personen-Milliarden-Dollar-Unternehmen" führen, bei denen eine einzelne Person mithilfe von KI-Tools die Leistung ganzer Teams repliziert. 
Midjourney, Sora und das Holodeck: Die Zukunft der KI-generierten Realitäten

10.06.2024 19 min

Der Weg nach KAI – Episode 14: Midjourney, Sora und das Holodeck: Die Zukunft der KI-generierten Realitäten In dieser Episode des Podcasts "Der Weg nach KAI" dreht sich alles um die beeindruckenden Fortschritte bei der Generierung fotorealistischer Bilder und Videos durch KI-Modelle. Die führenden "Text-to-Image" Generatoren wie DALL-E, Midjourney und Stable Diffusion stehen im Fokus, die aus Textbeschreibungen täuschend echte Bilder erzeugen können. Ein Paradebeispiel für die Macht und die Gefahren der digitalen Bildbearbeitung ist der Vorfall mit dem gefälschten Foto des Papstes im weißen Parka, das mit Midjourney erstellt wurde und viral ging. Dieses Ereignis wirft Fragen zu Urheberrechten und Missbrauchspotenzial auf, zeigt aber auch die beeindruckenden Möglichkeiten der KI-Bildbearbeitung. Wir untersuchen, wie die aktuell am weitesten verbreiteten Bilderzeuger funktionieren und betrachten OpenAIs noch unveröffentlichtes KI-Modell SORA, das beeindruckend realistische Videos generieren kann.  Sora versteht räumliche und zeitliche Zusammenhänge und ebnet so den Weg für interaktive virtuelle Welten.Diese Technologie ist auch ein wichtiger Schritt in Richtung eines "Holodecks", wie man es aus Star Trek kennt. Midjourneys Pläne für "Orb", ein Gerät zur Erzeugung von KI-generierten 3D-Welten und Echtzeit-Videospielen, gehen genau in die Richtung dieser futuristischen Idee eines Holodecks. Und das sogar noch im Jahr 2024. Ob das realistisch ist, darf man durchaus skeptisch sehen. 
ChatGPT "richtig" nutzen, Gehirn-Schnittstelllen von Neuralink und die XRAI Glass

07.06.2024 11 min

Der Weg nach KAI – Episode 13: ChatGPT "richtig" nutzen, Gehirn-Schnittstelllen von Neuralink und die XRAI Glass   In dieser Folge "Der Weg nach KAI" geht es um die beeindruckenden Fähigkeiten und Anwendungsmöglichkeiten des neuen KI-Modells GPT-4o innerhalb von ChatGPT von OpenAI. GPT-4o kann nicht nur Text verarbeiten, sondern auch Bilder analysieren. Dies eröffnet völlig neue Möglichkeiten im Umgang mit der KI. Konkrete Anwendungsbeispiele: die Erklärung medizinischer Befunde, Hilfe bei der Navigation und Übersetzung im Urlaub, Rezeptvorschläge anhand vorhandener Zutaten, Lösungen für technische Probleme, Anleitungen für Heimwerkerprojekte, Tipps zur Pflanzenpflege im Garten und sogar Modeberatung.  Anschließend blicken wir in die Zukunft der Mensch-Maschine-Interaktion. Das Unternehmen Neuralink von Elon Musk arbeitet an Gehirn-Computer-Schnittstellen, mit denen Gedanken direkt in digitale Informationen umgewandelt werden sollen. Es gibt bereits erste Erfolge bei Patienten mit körperlichen Behinderungen. Ein Beispiel ist die Umwandlung von Gedanken in gesprochene Sprache bei einem Schlaganfall-Patienten. Zuletzt geht es um die XRAI Glass, eine smarte Brille für Hörgeschädigte, die Sprache in Echtzeit in Untertitel umwandelt und so die Kommunikation erleichtert. Auch sie nutzt die GPT-Technologie von OpenAI.
Die Magie der Transformer, KI-basierte Emotionserkennung und "Showrunner"

05.06.2024 17 min

Der Weg nach KAI – Episode 12: Die Magie der Transformer, KI-basierte Emotionserkennung und "Showrunner" In dieser Folge beginnen wir mit einem Rückblick auf die Ursprünge der GPT-Architektur, die ursprünglich von Google-Forschern im wegweisenden Paper "Attention Is All You Need" vorgestellt wurde. Obwohl Google zunächst das Potenzial dieser Technologie nicht voll ausschöpfte, erkannte OpenAI schnell die Möglichkeiten und entwickelte daraus die bahnbrechende GPT-Modellfamilie. Doch die Fortschritte beschränken sich nicht nur auf das Sprachverständnis. Systeme wie Hume.ai demonstrieren die Fähigkeit, Emotionen in der menschlichen Stimme zu erkennen und darauf zu reagieren. Dies eröffnet vielversprechende Anwendungsmöglichkeiten im Kundenservice, Marketing und sogar in der persönlichen Interaktion mit virtuellen Assistenten. Abschließend schauen wir uns "Showrunner" genauer an, eine KI-gesteuerte Streaming-Plattform, die personalisierte Inhalte generiert. Nutzer können eigene Episoden beliebter Serien wie South Park oder ganz eigene Serienformate erstellen, die auf ihre individuellen Vorlieben zugeschnitten sind. Die Kombination aus emotionaler Intelligenz und personalisierter Inhaltsgenerierung lässt eine Zukunft erahnen, in der Unterhaltung interaktiver und emotionaler wird.
GPT-5, Elon Musk, Gigafactory und Stargate: KAI bereits 2025?

03.06.2024 18 min

Der Weg nach KAI – Episode 11: GPT-5, Elon Musk, Gigafactory und Stargate: KAI bereits 2025? In dieser Folge geht es um die spannenden Neuigkeiten von OpenAI und die Frage, ob wir schon 2025 eine künstliche allgemeine Intelligenz (KAI bzw. AGI) erreichen könnten. OpenAI hat bekannt gegeben, dass sie mit dem Training eines neuen, fortschrittlichen KI-Modells begonnen haben, das intern als "next frontier model" bezeichnet wird und die Fähigkeiten des aktuellen GPT-4 übertreffen soll. Es wird erwartet, dass das neue Modell, ob es nun GPT-5 oder GPT-Next heißen wird, über deutlich erweiterte Fähigkeiten zur Aufgabendelegation verfügt und wesentlich komplexere Kontexte verarbeiten kann. OpenAI hat bereits 2023 seine Unternehmensmission in Richtung der Erreichung einer künstlichen allgemeinen Intelligenz geändert.  Das Training von GPT-5 wird voraussichtlich 4-6 Monate dauern, gefolgt von einer Prüf- und Optimierungsphase. Daher wird das nächste OpenAI-Modell vermutlich erst Ende 2024 oder Anfang 2025 erscheinen. Auch Elon Musk arbeitet mit seiner Firma xAI und in Partnerschaft mit Oracle am Bau eines massiven KI-Supercomputers, der "Gigafactory of Compute". Dieser soll bis Herbst 2025 fertig sein und die nächste Generation des KI-Systems namens Grok ermöglichen. Musk hat seine Prognose für die Entwicklung einer KAI von 2029 auf 2025 vorgezogen. Wir betrachten auch die enormen Rechenleistungen und Parametergrößen der verschiedenen GPT-Modelle. GPT-3 hatte 175 Milliarden Parameter, GPT-4 schätzungsweise 1,5-1,8 Billionen. Für GPT-5 werden sogar über 5 Billionen Parameter erwar...
Die Fünf Bausteine auf dem Weg zur KAI - Teil 3: KI-Agenten in all ihren Formen

31.05.2024 15 min

Der Weg nach KAI – Episode 10:  Die Fünf Bausteine auf dem Weg zur KAI - Teil 3: KI-Agenten in all ihren Formen  In dieser Folge widmen wir uns dem letzten der fünf Schlüsselbausteine auf dem Weg zur Künstlichen Allgemeinen Intelligenz (KAI): den KI-Agenten in all ihren Formen.  KI-Agenten sind autonome Systeme, die eigenständig Ziele verfolgen und Entscheidungen treffen können. Von einfachen Chatbots bis hin zu komplexen Robotern werden sie unseren Alltag und die Arbeitswelt revolutionieren. Wir untersuchen die verschiedenen Arten von KI-Agenten, angefangen bei einfachen Reflex-Agenten, die auf Basis vordefinierter Regeln agieren, bis hin zu lernenden Agenten, die sich durch Erfahrung verbessern.  Besonders spannend sind hierarchische Agenten, die komplexe Aufgaben in kleinere Teilaufgaben zerlegen und an spezialisierte Unteragenten delegieren, wie es beispielsweise bei autonomen Fahrzeugen der Fall ist. Ein wegweisendes Projekt ist "Devin", ein KI-Agent, der eigenständig komplexe Softwareprojekte plant und umsetzt. Mit Fähigkeiten wie langfristigem Denken und Fehlerbehebung könnte er die Art und Weise, wie wir Software entwickeln, grundlegend verändern.  Doch der Einsatz von KI-Agenten wirft auch ethische Fragen auf, etwa nach Transparenz, Kontrolle und Verantwortung. Die Wachstumsfähigkeit von KI-Systemen ist entscheidend für die Entwicklung einer KAI. Unternehmen wie OpenAI und Microsoft investieren massiv in spezialisierte Rechenzentren, um die enormen Anforderungen an Rechenleistung und Speicher zu bewältigen. So können immer leistungsfähigere und vielseitigere KI-...
Die Fünf Bausteine auf dem Weg zur KAI - Teil 2: Personalisierung und Zuverlässigkeit

29.05.2024 14 min

Der Weg nach KAI – Episode 9:  Die Fünf Bausteine auf dem Weg zur KAI - Teil 2: Personalisierung und Zuverlässigkeit    In dieser Folge setzen wir unsere Erkundung der fünf Schlüsselbausteine auf dem Weg zur Künstlichen Allgemeinen Intelligenz (KAI) fort. Nachdem wir in der letzten Episode die Multimodalität und das Reasoning analysiert haben, widmen wir uns heute den Themen Personalisierung und Zuverlässigkeit. Personalisierung bedeutet, dass KI-Systeme maßgeschneiderte Erfahrungen für jeden einzelnen Nutzer bieten. Statt "One-size-fits-all"-Lösungen geht der Trend zu individualisierten Assistenten, Empfehlungssystemen und Diagnosetools, die unseren Alltag prägen werden.  Wir klären, wie KI-Modelle riesige Datenmengen analysieren, um subtile Muster und Präferenzen zu erkennen und hochgradig zielgerichtete Empfehlungen zu geben. Dabei müssen Entwickler jedoch auch ethische und rechtliche Aspekte wie Datenschutz und Transparenz berücksichtigen. Zuverlässigkeit ist eine weitere zentrale Herausforderung für den praktischen Einsatz von KI. Modelle müssen robust, erklärbar und vertrauenswürdig sein. Wir beleuchten aktuelle Probleme wie Datenverzerrungen, Angriffe auf KI-Systeme und mangelnde Transparenz. Um wirklich zuverlässige Systeme zu schaffen, müssen diese Hürden überwunden werden.  In der nächsten Folge werfen wir einen Blick auf den letzten Baustein: Autonome KI-Agenten, die eigenständig Ziele verfolgen und Entscheidungen treffen. 
Die Fünf Bausteine auf dem Weg zur KAI - Teil 1: Multimodalität und Reasoning

28.05.2024 16 min

 Der Weg nach KAI – Episode 8:  Die Fünf Bausteine auf dem Weg zur KAI - Teil 1: Multimodalität und Reasoning   In dieser Folge untersuchen wir, in welchen Bereichen wir in den kommenden Jahren die größten Fortschritte bei der Entwicklung von KI-Modellen erwarten können.  In der ersten Folge rund um dieses Thema konzentrieren uns dabei auf zwei Schlüsselaspekte: Multimodalität und Reasoning. Multimodale KI-Systeme können heute schon sehen, hören und sprechen. Sie verarbeiten Informationen aus Text, Bild, Audio und Video, um ein ganzheitliches Verständnis zu erreichen. Wir erklären anschaulich, wie durch Techniken wie "frühe Fusion" und "späte Fusion" die Verknüpfung verschiedener Datentypen optimiert wird. Doch es gibt auch Herausforderungen wie den hohen Energieverbrauch und den Umgang mit unscharfen Daten. Das logische Schlussfolgern, auch Reasoning genannt, ist ein Kernmerkmal intelligenter Systeme. Wir betrachten die verschiedenen Arten der Schlussfolgerung - Deduktion, Induktion, Abduktion und Analogie - und wie sie KI-Modellen ermöglichen, flexibel mit Wissen umzugehen. Besonders das abduktive Schlussfolgern, bei dem überraschende Beobachtungen erklärt werden, ist der Schlüssel zu kreativer Problemlösung.  Doch kann man dabei schon von "Denken" sprechen? Reasoning und Wissensrepräsentation sind zentrale Bausteine auf dem Weg zur Künstlichen Allgemeinen Intelligenz.  In den nächsten beiden Folgen geht es um die weiteren drei Bausteine auf dem Weg zur KAI: Personalisierung, Zuverlässigkeit und autonome KI-Agenten.
Zukunftsvisionen? Ray-Ban Meta, KI-Assistenten und "Be My Eyes"

23.05.2024 12 min

Der Weg nach KAI – Episode 7:  Zukunftsvisionen? Ray-Ban Meta, KI-Assistenten und "Be My Eyes"   In dieser Episode betrachten wir KI-Gadgets und ihre Nützlichkeit, insbesondere die Kooperation zwischen Meta und Ray-Ban, die zur Entwicklung der Ray-Ban Meta Brille geführt hat. Sie verbindet das ikonische Wayfarer-Design mit modernster Technologie wie Kameras, Lautsprechern und Touchpad-Steuerung. Ein spannender Aspekt ist der integrierte KI-Assistent, der über den Ausruf "Hey Meta" aktiviert werden kann und Fragen direkt über die eingebauten Lautsprecher beantwortet. Dies zeigt, in welche Richtung sich intelligente Alltagsbegleiter entwickeln. Google und Apple haben hier mit ihren Assistenten Siri und Google Assistant noch Vorteile. Wir stellen uns vor, wie KI-Agenten in Kombination mit smarten Brillen unser Leben bereichern könnten, indem sie kontextsensitiv funktionieren, proaktiv handeln und uns unterstützen, sei es bei Meetings, beim Shopping oder im Beruf. Ein konkretes Beispiel, wie KI schon heute sehbehinderten Menschen hilft, ist die App "Be My Eyes". Ursprünglich vernetzte sie Sehbehinderte per Videoanruf mit sehenden Freiwilligen. Durch die Integration von OpenAIs GPT-4 kann die App nun in vielen Fällen auch ohne menschliche Hilfe Unterstützung bieten, indem die KI Audio, Video und Text analysiert und hilfreiche Rückmeldungen gibt.
Moonshots, Audio-Computer, lebensrettende Bilderkennung und PaliGemma

20.05.2024 15 min

Der Weg nach KAI - Episode 6: Moonshots, Audio-Computer, lebensrettende Bilderkennung und PaliGemma Wir beginnen mit einem Blick auf das vielversprechende Startup Iyo und dessen revolutionäres Produkt, den Iyo One. Gegründet von Jason Rugolo, einem ehemaligen Mitarbeiter von Googles Moonshot Factory "X", hat Iyo das Ziel, den Markt der Audio-Wearables zu revolutionieren. Iyo One sind kabellose Ohrhörer, die als "Audio-Computer" fungieren und die Interaktion mit virtuellen Assistenten und Apps allein durch Sprache ermöglichen. Diese innovative Technologie basiert auf Erkenntnissen aus der Psychoakustik und verspricht ein immersives Klangerlebnis, das sehr effektiv Störgeräusche im Alltag herausfiltert.  Ein weiteres Thema ist der Einsatz von KI in der medizinischen Bildanalyse. Hierbei unterstützen KI-Algorithmen Ärzte bei der Diagnose und Behandlung von Krankheiten durch die Segmentierung und Klassifizierung von medizinischen Bildern. Diese Technologien ermöglichen eine präzise Erkennung und Abgrenzung von Tumoren und anderen pathologischen Veränderungen, was die Planung von Operationen und Therapien erheblich verbessert. Studien zeigen, dass KI-Algorithmen bei der Erkennung bestimmter Krebsarten eine ähnliche oder sogar bessere Genauigkeit erzielen können als erfahrene Ärzte, was die Überlebenschancen der Patienten erhöht. Auch die Anwendung von KI in der öffentlichen Sicherheit, insbesondere in der Waffenerkennung, ist Thema. Diese Systeme nutzen Überwachungskameras und KI-Algorithmen, um Waffen zu identifizieren und automatisch Sicherheitspersonal zu alarmieren. Solc...
2013 bis heute: Multimodale KI revolutioniert die Mensch-Maschine-Interaktion

17.05.2024 15 min

Der Weg nach KAI – Episode 5:  Multimodale KI revolutioniert die Mensch-Maschine-Interaktion In dieser spannenden Episode tauchen wir ein in die faszinierende Welt der multimodalen KI und beleuchten die jüngsten Entwicklungen von Google und OpenAI. Wir beginnen unsere Reise im Jahr 2013 mit einem Rückblick auf die visionäre, aber letztlich gescheiterte AR-Brille "Google Glass". Trotz anfänglicher Startschwierigkeiten ließ sich Google nicht entmutigen und präsentierte nun mit "Astra" ein beeindruckendes multimodales KI-Modell, das wie der legitime Nachfolger von Google Glass wirkt. Wir klären, was "multimodal" in der KI bedeutet und warum die Fähigkeit, verschiedene Datentypen zu kombinieren, so wichtig für leistungsstarke KI-Systeme ist. Anhand eindrucksvoller Demos zeigen wir, wie Astra Objekte erkennt, Szenen analysiert und sogar kreative Aufgaben meistert. Doch OpenAI steht dem in nichts nach: Nur einen Tag vor Googles Präsentation stellte das Unternehmen sein neues Sprachmodell GPT-4o vor, das mit emotionaler Intelligenz und natürlicher Konversation glänzt. Wir vergleichen die beiden Giganten und wagen einen Blick in die Zukunft der Mensch-Maschine-Interaktion. Zum Abschluss werfen wir einen kritischen Blick auf den Stand der Technik für die deutsche Sprache und erörtern, welche Möglichkeiten sich durch die Verschmelzung von Sprach-KI und AR ergeben könnten. 
Die Big Player der KI-Welt & die Chancen von Open-Source (Teil 2)

16.05.2024 12 min

Der Weg nach KAI – Episode 4: Die Big Player der KI-Welt & die Chancen von Open-Source (Teil 2)  In dieser Episode tauchen wir in die Welt der Open-Source-KI-Modelle ein und beleuchten ihre Bedeutung für die Weiterentwicklung der Technologie. Wir erklären den Unterschied zwischen "Closed-Source" und "Open-Source" und betrachten die Vor- und Nachteile beider Ansätze. Wir sprechen über die Bedeutung der Modellgröße und erklären, wie auch kleinere Modelle mit weniger Parametern beeindruckende Ergebnisse liefern können. Dabei gehen wir auf beliebte Open-Source-Modelle wie LLaMA-3 von Meta und Phi von Microsoft ein.
Die Big Player der KI-Welt & die Chancen von Open-Source (Teil 1)

16.05.2024 11 min

Der Weg nach KAI – Episode 3: Die Big Player der KI-Welt & die Chancen von Open-Source (Teil 1)  In dieser Folge werfen wir einen genaueren Blick auf die führenden Unternehmen im Bereich der Künstlichen Intelligenz und vergleicht deren Ansätze bei der Entwicklung von KI-Modellen.Google mit seinem Modell GeminiOpenAI, bekannt für GPT-3, ChatGPT und aktuell GPT-4Anthropic mit dem auf ethische KI ausgerichteten Modell ClaudeMeta (Facebook) mit LLaMA 3Das europäische Startup Mistral AI als aufstrebender HerausfordererDabei wird insbesondere die marktführende Rolle von OpenAI beleuchtet, das 2015 von Elon Musk und anderen mit dem Ziel gegründet wurde, eine sichere und der Menschheit dienende KI zu entwickeln. OpenAI hat mit GPT-4 seine Position im Markt gefestigt und führt mit Microsoft eine enge Kooperation, die gemeinsames Wachstum garantieren soll.
Moravecs Paradoxon, die Sprache der Wale und AlphaFold 3

14.05.2024 13 min

Der Weg nach KAI – Episode 2: Moravecs Paradoxon, die Sprache der Wale und AlphaFold 3 In dieser Folge tauchen wir tief ein in die faszinierende Welt der Künstlichen Intelligenz und Robotik. Wir beginnen mit Moravecs Paradoxon, das aufzeigt, warum scheinbar einfache Aufgaben für Roboter oft schwieriger sind als komplexe Denkleistungen. Anschließend werfen wir einen Blick auf die Kommunikation von Walen und wie KI-Systeme wie CETI und das Earth Species Project dabei helfen, ihre Sprache zu entschlüsseln. Wir erfahren, dass die Klicklaute der Pottwale weitaus komplexer sind als bisher angenommen und womöglich sogar ein eigenes "Alphabet" bilden. Zum Abschluss widmen wir uns AlphaFold 3, dem neuesten KI-Modell von Google DeepMind. Dieses System ist in der Lage, die Strukturen und Wechselwirkungen aller Moleküle des Lebens mit beispielloser Genauigkeit vorherzusagen – ein gewaltiger Sprung für die Molekularbiologie und die Entwicklung neuer Medikamente. Begleitet uns auf eine Reise durch die neuesten Entwicklungen und Erkenntnisse aus der Welt der KI und erfahrt, wie diese Technologie unser Verständnis von Intelligenz, Kommunikation und den Bausteinen des Lebens revolutioniert. 
Künstliche Intelligenz verändert unsere Welt

14.05.2024 18 min

Der Weg nach KAI – Episode 1: Künstliche Intelligenz verändert unsere Welt In der ersten Episode des Podcasts "Der Weg nach KAI" tauchen wir ein in die faszinierende Welt der Künstlichen Intelligenz (KI) und der Künstlichen Allgemeinen Intelligenz (KAI). Michael Berndt, KI-Enthusiast und -Optimist, erklärt, warum er diesen Podcast ins Leben gerufen hat: Um die enormen Veränderungen, die KI und KAI für unsere Gesellschaft, Arbeitswelt und unser Leben mit sich bringen werden, greifbarer und verständlicher zu machen. Wir erfahren, was genau KAI eigentlich ist – ein System mit ähnlichen kognitiven Fähigkeiten wie der Mensch, das domänenübergreifend arbeitet und eigenständig Probleme erkennt und löst. Michael beleuchtet die enormen Chancen, aber auch potenzielle Risiken dieser Technologie und wirft einen Blick auf den aktuellen Stand der KI-Forschung. Von generativer KI, die Bilder und Texte erschaffen kann, über KI-Agenten bis hin zu Sprachmodellen wie GPT – die Entwicklung schreitet rasant voran. Und mit jedem Fortschritt kommen wir dem Zeitpunkt näher, an dem KAI Realität wird. Der Link zum Film "AlphaGo" auf Youtube