Merkmalskonstruktion für Machine Learning

Kurze Einleitung ins Machine Learning

Bevor wir uns mit dem Fachbuch näher beschäftigen, wollen wir eine kurze Einleitung ins Machine Learning ansehen. Beim ML werden Prozesse aufgrund von erkannten Mustern optimiert. Rohdatensätze bilden die Grundlage für die Berechnung von Vorhersagen beziehungsweise deren Modellen.

Ein Beispiel

Das unten aufgeführte Beispiel ist stark vereinfacht und ist in dieser Form nicht in dem Buch zu finden, dafür aber ein detailreicheres, dass keine Frage offen lässt.

Rohdaten kommen als Input rein, werden im Modell berechnet und führen zu einer Vorhersage bzw. einem neuen Datensatz, der weiter verwendet werden kann. Vom Aufbau kann man sich dies wie bei einer Nervenzelle vorstellen, wie die untere Grafik zeigt.

Mathematische Darstellung

Eine mathematische Darstellung, wie etwa in der linearen Regression zeigt einen stark vereinfachten Prozess zur Verarbeitung von Rohdaten.  Schauen wir nun ins Fachbuch „Merkmalskonstruktion für Machine Learning –  Prinzipien und Techniken der Datenaufbearbeitung.“

 

 

Merkmalskonstruktion für Machine LearningÜber die AutorenBestellen

Das Fachbuch:Merkmalskonstruktion für Machine Learning-Prinzipien und Techniken der Datenaufbearbeitung führt durch die wirklich wichtigen Fragestellungen wie der Gewinnung von Merkmalen aus Rohdaten, deren mathematischen Grundkonzepten. Diese Merkmale werden mit allen bekannten Vor- und Nachteilen von
Alice Zheng und Amanda Casari die in der IT-Szene als Kapazitäten auf ihrem Fachgebiet gelten, beschrieben.

Die beiden Machine Learning Expertinen, haben sich zum Ziel gesetzt, dem Leser einen groben Überblick über den Kern des ML zu bieten, dabei konzentieren sie sich auf die Frage:„Wie etwas gemacht wird und weniger, um das Warum“. Was aber nicht heißt, dass der mathematische Anteil zu kurz kommen würde.

Kapitelweise werden die verschiedenen Möglichkeiten des Modellbaus und deren zugrunde liegenden mathematischen Prozesse erklärt und auf mögliche Stolperfallen hingewiesen, auf die man im Normalfall nach mühevoller Berechnung selber stoßen würde – gewiss kann man auf diesen Spaß verzichten und ist den beiden Autorinen dankbar für jeden Hinweis.
Die  einzelnen Problemstellungen werden sehr schnell klar, wie etwa bei der Bilderkennung. Der Leser erhält  mögliche Lösungsmethodiken an die Hand, sodass man bei eigenen Projekten bereits im Vorfeld direkt zum passenden Modell greifen kann oder dieses nach eigenen Anforderungen abändern kann.
Das Lehrbuch eignet sich gut, um erste Erfahrungen im Machine Learning [ML] zu sammeln, wenn man ein Grundverständnis für die Bearbeitung von Datensätzen mitbringt und sich der Tatsache bewusst ist, dass ML unbedingt einen großen Fundus an Rohdaten benötigt, um Prognosen treffen oder auch Vorhersagen machen zu können. Wer effektiv mit dem Buch arbeiten möchte, sollte sich im Vorfeld einen großen Fundus an Rohdaten zulegen oder darauf zugriff haben, um dies zu veranschaulichen nehmen wir an, dass Sie 2500 Bilder haben, auf denen verschiedene Autos auf einer Straße abgebildet sind und Sie wollen die Automarken darauf erkennen, so benötigen Sie einen minimalen Fundus von 2500 Bildern, um eine Bilderkennung durchzuführen. 
Ein weiterer Fokus des Fachbuchs widmet sich der statistischen Modellierung von Daten und der numerischen Darstellung. Die hierfür verwendeten Pythonbibliothelken sind alt bekannte wie etwa: NumPy, Pandas, scikit-learn, Seaborn und Matplotlib, sodass es einen leichten Einstieg gewährleistet.
Verkraftbares, kleines Manko des Fachbuchs
Leider wird nicht darauf hingewiesen, dass man eine Grafikkarte [GPU] , AWS oder Colaboratory für Rechner ohne Grafikkarte braucht, um eine Auswertung durchführen zu können. Dieses Vorwissen wird vorausgesetzt – da die Zielgruppe eher aus dem Bereich der Datenanalyse stammt. Abhilfe schaffen aber weitere Fachbücher zu dem Thema aus dem O´REILLY Verlag.
Wiedereinmal Top
Man ist ja fast nichts anderes gewöhnt aus dem O´REILLY Verlag und so ist es auch diesmal mit der
Übersetzung des Fachbuchs aus dem englischen – diesmal durch Thomas Lotze.

Autorinen von „Merkmalskonstruktion für Machine Learning – Prinzipien und Techniken der Datenaufbereitung“

 

Autorin : Alice Zheng

Alice Zheng

Ist auf die Anwendung von Machine Learning spezialisiert, ihre technisches Now How gibt sie seit dem Studium, über die Internetplattform MeetUp, bei Community treffen für Data / Analytics / Machine Learning weiter. Alice Zheng´s Interessenschwerpunkt liegt in der Vereinfachung und Automatisierung des Machine Learnings.

 

 

Einige Eckdaten zu Alice Zheng:

  • Senior Manager, Applied Science bei Amazon : für das Optimierungsteam auf der  Amazon-Anzeigenplattform.
  • Director of Data Science Dato [GraphLab] : Programmierung von Toolkits
  • Researcher bei Microsoft Research, Redmond
  • Scientist für Machine Learning : Auton Lab der Carnegie Mellon University und am Parallel Data Lab
  • promovierte an der Berkeley in Elektrotechnik
  • Bachelor-Abschluss in Mathematik und Informatik

 

Autorin: Amanda Casari

Amanda Casari

Amanda Casari ist KI Forscherin und Autorin des Fachbuches „Merkmalskonstruktion für Machine Learning Prinzipien und Techniken der Datenaufbereitung“ und beschäftigt sich mit Modellentwicklungen. Unteranderem schreibt sie im Medium Blog  und ist gern gesehener Sprecher auf IT Konferenzen.

 

 

 

Einige Eckdaten zu Amanda Casari:

  • Engineering Manager : Google Cloud Developer Relation
  • Principal Product Manager und Data Scientist : SAP Concur
  • Data Scientist: ProKarma
  • Systems Integration and QA Engineer: Mantis Technology Group
  • Control System Engineer : Greensea Systems Inc.
  • Militär Operations Analystin
  • US Navy : Leutnant
  • University of Vermont : Master of Science, in Elektrotechnik
  • US Naval Academy : Bachelor of Science, Control Systems Engineering

O´REILLY Verlag

Gute Fachliteratur aus der Informationstechnologie [IT] stammt meist aus dem O´REILLY Verlag. Die Fachliteratur zielt auf den Anwendungen der ab und leitet Schritt für Schritt in die jeweiligen Themengebiete ein. Zudem gehört die Überzahl der Autoren, die im O´REILLY Verlag veröffentlichen zu den wegweisenden und führenden Kapazitäten ihrer Fachgebiete.

„Merkmalskonstruktion für Machine Learning- Prinzipien und Techniken der Datenaufbearbeitung“

Das ins deutsche übersetzte Fachbuch „Merkmalskonstruktion für Machine Learning- Prinzipien und Techniken der Datenaufbearbeitung“ ist nur ein weiterer Meilenstein in der Kette von guten Fachbüchern. „Merkmalskonstruktion für Machine Learning“ beschäftigt sich primär mit der Merkmalskonstruktion zur Künstlichen Intelligenz [KI] weithin als Machine Learning [ML] bekannt.

Autoren         : Alice Zheng und Amanda Casari
Übersetzung : Thomas Lotze

Merkmalskonstruktion für Machine Learning

Prinzipien und Techniken der Datenaufbereitung

März 2019, 214 Seiten, komplett in Farbe, Broschur O’Reilly
ISBN Print: 978-3-96009-093-9

 

 

 

 

Alles in Allem bietet das Fachbuch Merkmalskonstruktion für Machine Learning- Prinzipien und Techniken der Datenaufbearbeitung.“ von Alice Zheng&Amanda Casari einen sehr guten Überblick zum ML und eignet sich für Einsteiger genauso wie für den fortgeschrittenen Anwender, der schnell mal Nachschlagen will. Da sich aber ML unaufhaltsam weiterentwickelt, kann es hier und da bereits Neuerungen im Netz geben, was dem ganzen aber keinen Abbruch tut, da man den Hintergrund zum ML in dem Fachbuch gut erklärt bekommt.