Die Welt von Data Science und Artificial Intelligence

Trendige Begriffe und was sie bedeuten

Die Begriffe Data Science, künstliche Intelligenz oder in Englisch Artificial Intelligence (AI), Machine Learning und Deep Learning sind zu Trendwörtern geworden. Aber was bedeuten sie und wie stehen sie zueinander?

Artificial Intelligence – ein jung gebliebener Begriff

Schon in den fünfziger Jahren beschäftigte sich Alan Turing mit der künstlichen Intelligenz. Mithilfe eines Testes soll herausgefunden werden, ob eine Maschine Intelligenz besitzt. Beim Turing-Test geht es darum, dass ein Fragesteller mit einem Menschen und einem Chatbot chattet. Dabei weiss er aber nicht, wer der beiden der Chatbot und wer der Mensch ist. Falls nach einer intensiven Befragung der beiden, der Fragesteller nicht mit Sicherheit entscheiden kann, welcher der beiden der Mensch und wer die Maschine ist, dann besitzt nach Turing die Maschine eine Intelligenz. Der Turing-Test wurde bis heute noch von keiner Maschine bestanden.

Heutzutage ist AI ein Teilgebiet der Informatik mit vielen Überschneidungen in andere Bereiche wie Linguistik, Psychologie, Neurologie und Philosophie. Ziel ist die Herstellung eines intelligenten Agenten oder Informationssystems. Ein Agent hat als Eingaben und Zwischenzustände zum einen Vorwissen über die Umgebung (z.B. eine Karte) aber auch erlerntes Wissen, Testfälle etc. Die vom Agent zu erreichenden Ziele sind üblicherweise mit Prioritäten und Wichtigkeiten versehen. Allgemein kann ein Agent Beobachtungen über die Umgebung und auch über sich selbst machen (und daraus Schlüsse ziehen, beispielsweise Lernen). Aufgrund dieser „Eingaben“ berechnet der Agent als Ausgabe seine nächste Aktion.
(Quelle: Einführung in die Methoden der Künstlichen Intelligenz, Prof. Dr. M. Schmidt-Schauss, 2013)

Die künstliche Intelligenz besteht also aus einem gewissen Regelwerk, das zum Teil auch selber aus Daten gewonnen wurde, d.h. gelernt wurde. Sie optimiert die Zielerreichung und hat durch Beobachtung und Bewertung ihrer selbst, die Möglichkeit aus ihren Fehlern zu lernen.

Durch die neuen technologischen Möglichkeiten hat die künstliche Intelligenz vor allem im Bereich der Extrahierung von Wissen aus Daten grosse Fortschritte erzielt. Dadurch hat der Begriff in der heutigen Zeit eine grosse Relevanz.

Data Science – eine moderne Disziplin

Im Gegenzug zum Begriff der künstlichen Intelligenz, welcher mit dem Aufkommen der ersten Computer entstand, ist der Begriff Data Science erst seit Beginn des 21. Jahrhunderts in der heutigen Form bekannt. Ziel der Data Science ist die Extraktion von Wissen aus Daten. Dazu bedient sie sich statistischer und mathematischer Methoden. Erst die technischen Möglichkeiten des systematischen Sammelns von digitalen Daten und die Zunahme der Rechengeschwindigkeit erlaubten die Entstehung einer solchen Disziplin.

Machine Learning – der gemeinsame Nenner

Als maschinelles Lernen (Machine Learning) bezeichnet man Algorithmen, die aus Daten Muster erkennen. Dabei trainiert man auf Grund von Daten mathematische Modelle. Dadurch können Gesetzmässigkeiten erkannt werden, die zum Verständnis der Daten beitragen oder für Prognosen verwendet werden können. Eine Untergruppe von Modellen, darunter die neuronalen Netze, gehören zur Kategorie der Deep Learning Algorithmen. Anders als im restlichen Teil des maschinellen Lernens wird in dieser Kategorie keines oder nur geringes explizites Wissen über das zu lösende Problem vorausgesetzt. Die Extraktion des Wissens wird über mehrere Schichten hinweg berechnet, die sehr komplex miteinander interagieren und dadurch lässt sich nur implizites Wissen generieren. Mit Deep Learning werden typischerweise Aufgaben wie Bild- und Spracherkennung gelöst.

Um aus Daten schnell Einsichten zu gewinnen, bedient sich die Data Science des maschinellen Lernens. Dabei ist das Anwenden der richtigen Algorithmen, um die Antworten auf die wichtigen Geschäftsfragen, ein wesentlicher Bestandteil der Data Science.

In der künstlichen Intelligenz ist die Fähigkeit aus Erfahrungsdaten zu lernen genau der Bereich, der sich ebenfalls die Algorithmen des maschinellen Lernens zu Nutze macht.

Im untenstehenden Venn-Diagramm ist der Zusammenhang zwischen den Begriffen Data Science (DS), Artificial Intelligence (AI), Machine Learning (ML) und Deep Learning (DL) dargestellt.

Einordnen der Begriffe Data Science (DS), Machine Learning (ML), Deep Learning (DL), Artificial Intelligence (AI) sowie Cognitive Services von Micorosoft
Venn-Diagramm zum Einordnen der Begriffe Data Science (DS), Machine Learning (ML), Deep Learning (DL), Artificial Intelligence (AI) sowie Cognitive Services von Micorosoft

 

Data Science umfasst mehr als die ML Algorithmen, da es in der DS auch um die Big Data Architektur geht. Konkret sind Fragen der Parallelisierung und Operationalisierung von ML Algorithmen Bestandteil der DS. Ebenfalls ist in der DS die wirtschaftliche Sicht von grosser Bedeutung, da sie einen starken Einfluss auf Ausrichtung der Datenanalyse hat.

Auf der anderen Seite ist die AI nicht nur auf die ML Algorithmen gestützt. Zwar werden neue Regeln mit ML aus Daten gelernt. Es werden aber weitere Algorithmen der Logik verwendet, um Regeln aus einem Regelwerk abzuleiten oder auch bewertete Handlungsmöglichkeiten mit nummerischen Verfahren zu optimieren. Auch Bereiche der Robotik sind in der AI angesiedelt, die sich nur in kleinen Teilen mit ML überlappen.

Cloud und AIaaS

Eine grosse Herausforderung ist das Entwerfen eines universellen Systems mit künstlicher Intelligenz. Damit ist ein System gemeint, das nicht nur eine spezifische Aufgabe lösen kann. Es zeigt sich, dass Expertensysteme, die spezifische Aufgaben in einem gewissen Kontext lösen, ziemlich gut mit Hilfe der ML Algorithmen gebaut werden können. So gibt es zum Beispiel IBMs Watson in verschiedenen Ausführungen: Einmal als Expertensystem für die Unterstützung von Onkologen, ein anderes Mal als Expertensystem, das neue innovative Rezepte kreiert.

Es ist naheliegend, dass kognitive Aufgaben (wie Bild-, Text-, Spracherkennung) in vielen Problemstellungen auftauchen. Ihre Lösung gewissermassen als Bausteine eines Expertensystems benutzt werden. Das Potenzial der Cloud ist es daher, die Lösung dieser Aufgaben als Dienste anzubieten. Genau dies tut Microsoft mit seinen Cognitive Services, eine Art Artificial Intelligence as a Service (AIaaS). Ein weiterer Vorteil der AIaaS kann sein, dass sich zum Beispiel Bildklassifizierungen durch einen Feedback-Loop verbessern. Hingegen ist ein unkontrolliertes Trainieren der Modelle auch sehr gefährlich. Das zeigte sich am Beispiel von Tay, einem Chatbot von Microsoft, dessen Tweets immer rassistischer und sexistischer wurden. Dies verdeutlicht gut, dass zumindest bis jetzt Moral oder Ethik nicht ohne Einwirkung bzw. Steuerung des Menschen in einer künstlichen Intelligenz Einzug findet.

Mehr zu den Cognitive Services von Microsoft findet man hier: https://azure.microsoft.com/de-de/services/cognitive-services/

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.