Entwicklung eines Standardvorgehensmodells für Data Science-Projekte - Aufruf zur Teilnahme

Image by geralt on Pixabay

In einer virtuellen Arbeitsgruppe möchten wir zusammen mit Ihnen in den kommenden Monaten neben einer Definition des Data-Science-Begriffes vor allem ein Standardvorgehensmodell für Projekte in diesem Bereich entwickeln. Zielgruppe des Aufrufes sind Praktiker und Wissenschaftler, die im Data-Science-Bereich tätig sind. Durch die Zusammenarbeit in einer organisationsübergreifenden Arbeitsgruppe werden nicht nur heterogene Sichtweisen berücksichtigt, sondern auch verschiedene Erfahrungen gebündelt. Das Ergebnis soll Ihnen dabei helfen, eigene Data-Science-Projekte strukturiert und unter Einbeziehung sämtlicher Interessensgruppen erfolgreich durchführen zu können. Die Erkenntnisse sollen zudem unter Nennung aller beteiligten Personen veröffentlicht werden.

Interessenten können sich bis zum 31. März 2019 bei uns melden. Innerhalb eines halben Jahres möchten wir in zeitunabhängiger Zusammenarbeit und organisiert über verschiedene unabhängige Meilensteine gemeinsam mit Ihnen ein Ergebnis erarbeiten. Diese Aufteilung ermöglicht es Ihnen, sich in einem Maß zu beteiligen, das Sie an Ihre Arbeitsbelastung und Ihre Interessenschwerpunkte anpassen können. Die genaue Form der Zusammenarbeit wird von der Anzahl, der geografischen Verteilung und den fachlichen Hintergründen der Teilnehmer abhängig gemacht.

Verschiedene Definitionen des Data Science-Begriffs

Das Thema Data Science hat in den letzten Jahren in vielen Unternehmen stark an Aufmerksamkeit gewonnen, an einer allgemein akzeptierten und einheitlichen Definition mangelt es jedoch zurzeit. Während der Begriff in wissenschaftlichen Veröffentlichungen häufig noch vermieden zu werden scheint, fallen Definitionen aus der Praxis vor allem durch ihre Heterogenität auf, was wiederum in falschen Erwartungen und Missverständnissen beteiligter Personengruppen resultiert. Zudem konzentrieren sie sich meist an einer kompetenzbasierten Auseinandersetzung, die abhängig von den Interessen der definierenden Gruppe einen stärkeren informationstechnischen, mathematisch-statistischen oder domänenspezifischen Schwerpunkt aufweist. Da der Data-Science-Begriff jedoch nicht nur als ein Synonym oder Oberbegriff für bestehende Konzepte wie etwa Data Mining oder Operations Research zu sehen ist, sondern eine tatsächliche Erweiterung bestehender Analyseszenarien darstellt, ist eine einheitliche Definition, die relevante Merkmale einschließt und eine Abgrenzung zu irrelevanten Merkmalen ermöglicht, von hoher Relevanz.

Neben der Einführung einer geeigneten Begriffsdefinition ist es notwendig, ein Standardvorgehensmodell für Data Science-Projekte zu entwickeln, das möglichst domänenübergreifend eingesetzt werden kann. Auch wenn bereits vielversprechende Ansätze aus etablierten Anwendungsbereichen existieren, sind diese entweder zu stark auf bestimmte Einsatzzwecke und/oder auf bestimmte Methoden fokussiert. Prominente Beispiele stammen hier insbesondere aus dem Bereich des Data Minings. Zu nennen sind neben dem KDD- und dem SEMMA-Prozess vor allem der Cross Industry Standard Process for Data Mining (CRISP-DM). Obwohl dieser nicht ohne weiteres auf Data Science-Szenarien übertragen werden kann, sollte dessen Einfachheit und die Ermöglichung der Zusammenarbeit von Domänen- und Data Science-Experten bei der Bearbeitung von fortgeschrittenen Analysen als Vorbild für neue Entwicklungen dienen.

Falls Sie Interesse an einer Mitarbeit in der virtuellen Arbeitsgruppe haben oder weitere Informationen benötigen, freuen wir uns, von Ihnen zu hören.

 

Ansprechpartner

 

Prof. Dr.  Michael Schulz

NORDAKADEMIE Hochschule der Wirtschaft | valantic Business Analytics GmbH

Michael.Schulz@bitte nicht bespammenba.valantic.com

Telefon:     +49 40 226 32 48 0
Mobil:        +49 151 180 499 20

 

 


Alle Nachrichten im Überblick