Agile Data Science - Data Science-Prozess

In diesem Kapitel werden der datenwissenschaftliche Prozess und die für das Verständnis des Prozesses erforderlichen Terminologien erläutert.

"Data Science ist die Mischung aus Datenschnittstelle, Algorithmusentwicklung und Technologie zur Lösung komplexer analytischer Probleme."

Data Science-Prozess

Data Science ist ein interdisziplinäres Feld, das wissenschaftliche Methoden, Prozesse und Systeme mit Kategorien wie Maschinelles Lernen, Mathematik und Statistik mit traditioneller Forschung umfasst. Dazu gehört auch eine Kombination von Hacking-Fähigkeiten mit fundiertem Fachwissen. Die Datenwissenschaft basiert auf Prinzipien aus Mathematik, Statistik, Informationswissenschaft und Informatik, Data Mining und Vorhersageanalyse.

Die verschiedenen Rollen, die Teil des Data Science-Teams sind, werden nachfolgend aufgeführt:

Kunden

Kunden sind die Menschen, die das Produkt verwenden. Ihr Interesse bestimmt den Erfolg des Projekts und ihr Feedback ist in der Datenwissenschaft sehr wertvoll.

Geschäftsentwicklung

Dieses Team von Data Science meldet frühe Kunden entweder aus erster Hand oder durch die Erstellung von Zielseiten und Werbeaktionen an. Das Business Development Team liefert den Wert des Produkts.

Produktmanager

Produktmanager legen großen Wert darauf, das beste Produkt zu schaffen, das auf dem Markt wertvoll ist.

Interaktionsdesigner

Sie konzentrieren sich auf Entwurfsinteraktionen rund um Datenmodelle, damit Benutzer einen angemessenen Wert finden.

Datenwissenschaftler

Datenwissenschaftler untersuchen und transformieren die Daten auf neue Weise, um neue Features zu erstellen und zu veröffentlichen. Diese Wissenschaftler kombinieren auch Daten aus verschiedenen Quellen, um einen neuen Wert zu schaffen. Sie spielen eine wichtige Rolle bei der Erstellung von Visualisierungen mit Forschern, Ingenieuren und Webentwicklern.

Forscher

Wie der Name schon sagt, sind Forscher an Forschungsaktivitäten beteiligt. Sie lösen komplizierte Probleme, die Datenwissenschaftler nicht lösen können. Diese Probleme betreffen einen intensiven Fokus und die Zeit des maschinellen Lernens und des Statistikmoduls.

Anpassung an den Wandel

Alle Teammitglieder von Data Science müssen sich an neue Änderungen anpassen und auf der Grundlage von Anforderungen arbeiten. Für die Einführung einer agilen Methodik in der Datenwissenschaft sollten verschiedene Änderungen vorgenommen werden, die im Folgenden aufgeführt sind:

  • Generalisten vor Spezialisten wählen.

  • Vorzug kleiner Teams vor großen Teams.

  • Verwenden von Tools und Plattformen auf hoher Ebene.

  • Kontinuierliches und iteratives Teilen von Zwischenarbeiten.

Hinweis

Im Agile Data Science-Team verwendet ein kleines Team von Generalisten Tools auf hoher Ebene, die skalierbar sind und Daten durch Iterationen in immer höhere Wertzustände verfeinern.

Betrachten Sie die folgenden Beispiele im Zusammenhang mit der Arbeit von Mitgliedern des Data Science-Teams:

  • Designer liefern CSS.

  • Webentwickler erstellen ganze Anwendungen, verstehen die Benutzererfahrung und das Oberflächendesign.

  • Datenwissenschaftler sollten sowohl an der Forschung als auch am Aufbau von Webdiensten einschließlich Webanwendungen arbeiten.

  • Die Forscher arbeiten in einer Codebasis, die Ergebnisse zeigt, die Zwischenergebnisse erklären.

  • Produktmanager versuchen, die Fehler in allen verwandten Bereichen zu identifizieren und zu verstehen.