Ein Checklisten-Manifest für den Aufbau von Data-Science-Teams

Home Wissen Ein Checklisten-Manifest für den Aufbau von Data-Science-Teams

KI, ML und Data Science haben sich für Unternehmen in allen Bereichen grundlegend verändert. Unternehmen wenden heute enorme Ressourcen für den Aufbau des idealen Data-Science-Teams auf. Der Aufbau eines Teams, ganz zu schweigen von Data Science, ist eine entmutigende Aufgabe.

Ein Data-Science-Team hat keine flache Zusammensetzung. Es gibt viele Bezeichnungen, Rollen und Verantwortlichkeiten, die in den Zuständigkeitsbereich dieses Teams fallen. Obwohl die Struktur eines Data-Science-Teams von den Endzielen der Organisation abhängen kann, bleiben einige Parameter gleich, wie z. B. der Bedarf an Innovation und Skalierbarkeit.

Bauen Sie hocheffiziente und skalierbare Data-Science-Teams auf

Eine KI-basierte Organisation nutzt künstliche Intelligenz, um ihr Endziel zu erreichen. Beim Aufbau von Data-Science-Teams geht jedoch häufig die Ausrichtung verloren, und der Schwerpunkt liegt auf dem Aufbau von Kapazitäten. Sogar einige Fortune-500-Unternehmen kämpfen mit Data Science. Noch schwieriger wird das Problem für Dienstleister, vor allem aufgrund ihres komplexen und dynamischen Portfolios.

Daher ist es wichtig, mit einer klaren Vision und Mission zu beginnen. Data-Science-Teams sollten nicht als Kostenstelle aufgebaut werden. Früher oder später würde es dem Team schwer fallen, den Return on Investment nachzuweisen. Der beste Ausgangspunkt ist die Erstellung einer Pipeline vorrangiger Probleme, die das Unternehmen lösen möchte: Identifizieren Sie das Problem; die Machbarkeit einer Data-Science-basierten Lösung bewerten; Erfolgskriterien definieren; und den Return on Investment überwachen.

Es ist wichtig, die organisatorische Ausrichtung und Integration von Teams mit strategischen Initiativen sicherzustellen. Fehlen solche Aspekte, kann das Data-Science-Team wie ein weiteres Shared-Services-Team enden. Schließlich muss das Team ein Gleichgewicht zwischen Innovation und Experimentieren im Vergleich zu Skalierbarkeit und Bereitstellung aufrechterhalten.

Kredit: Autor

Ausrichten

Man geht fälschlicherweise davon aus, dass ein Data-Science-Exzellenzzentrum nur mit Data Scientists besetzt wäre. Ein Data-Science-Team kann man sich wie ein Cricket-Team vorstellen. Der Erfolg des Teams hängt von Schlagmännern, Keglern, einem Kapitän, einem Trainer und Leistungsanalysten ab. Alle müssen zusammenarbeiten, um den Erfolg sicherzustellen.

Data Science hat viele Nischenrollen. Beispielsweise kann es für einen Ingenieur für maschinelles Lernen schwierig sein, einen Architekten für technische End-to-End-Lösungen zu spielen. Der Lösungsarchitekt kann jedoch über die Fähigkeiten verfügen, aber Schwierigkeiten haben, ein Geschäftsproblem und die damit verbundenen Komplikationen zu entschlüsseln.

Die Lösung besteht hier darin, eine Teamstruktur basierend auf diesen Rollen zu schreiben. Die Rekruten müssen in der Lage sein, Möglichkeiten zu erkennen, Lösungen zu präsentieren, zu entwerfen, Algorithmen auszuführen, skalierbare Lösungen mit Endbenutzermodulen zu erstellen, Fehler zu beheben, die Genauigkeit zu verbessern, Data-Science-Ergebnisse zu pflegen und in Ideen und Maßnahmen umzusetzen usw.

Jede Aufgabe erfordert andere Fähigkeiten. Das Team sollte darauf abzielen, Skalierbarkeit zu erreichen, indem es diese Kompetenzkohorten nutzt, vorbehaltlich des Aufwands und der Bandbreitenanforderungen für vorrangige Initiativen.

Sorgen Sie für die richtige Munition

Der nächste Schritt besteht darin, die Plattformen zu identifizieren, die erforderlich sind, um die Verantwortlichkeiten zu erfüllen, die eine bestimmte Rolle mit sich bringt. Beispielsweise benötigt die innovationsorientierte Kohorte möglicherweise die neuesten GPUs, um einige fortschrittliche Deep-Learning-Modelle auszuführen. Modelle können lokal von Grund auf neu erstellt oder ein Cloud-Plattformmodul genutzt werden.

Wichtige Überlegungen bei der Entscheidung über die Auswahl der richtigen Plattformen sind:

  1. Der Aufbau einer vollständigen Endzustands-CI/CD-Pipeline-Architektur (Data Warehouse, Data Lake, KI/ML-Entwicklung und -Bereitstellung, Modellverwaltung, Visualisierung und Unternehmensverbrauchsschichten, einschließlich Automatisierung über RPA und Finden der idealen Zustandsarchitektur) ist der Schlüssel zur Integration von richtigen Tools und Plattformen. Die meisten Cloud-Player wie AWS, Azure haben diesen globalen Ansatz übernommen und haben daher viele Module, die auf diese Bereiche eingehen.
  2. Entwicklungs- vs. Produktionstechnologie-Ökosystem und -Architektur basierend auf Volumen und Häufigkeit von Nischenexperimenten (verwendet von KMUs) vs. Massenproduktion (Data Scientists und BAU-Ingenieure).
  3. Build versus Buy, insbesondere angesichts der Anzahl von sofort einsatzbereiten Plattformen und anwendungsfallbasierten Tools
  4. Cloud vs. On-Premises ist eine ganz andere Debatte, aber die Cloud gewinnt den Kampf aus offensichtlichen Gründen der Kosten, Flexibilität und Skalierbarkeit, abgesehen von Sicherheitsproblemen in einigen Fällen.

Prozess und Governance

In vielen Fällen stellen Unternehmen Experten ein und tätigen enorme Investitionen in Tools und Plattformen, nur um zu sehen, wie das Team stagniert. Meistens resultiert dies daraus, dass Menschen und Plattformen mehr Aufmerksamkeit geschenkt wird, nicht dem Prozess selbst. Zum Beispiel betonte MS Dhoni, einer der erfolgreichsten Kapitäne, die die Cricket-Welt je gesehen hat, den „Prozess“, um das Team auf die großen Spiele vorzubereiten. Ebenso gibt es Modelle, Frameworks und Prozesse, die auf Data Science basieren, um den Teamerfolg sicherzustellen. Einige der Bewertungen beinhalten:

  • Problemlösungs-Framework: Das richtige Framework hilft sicherzustellen, dass das richtige Problem mit Data Science als Mittel gelöst wird. Die meisten analytischen und beratungsorientierten Führungskräfte haben ihre eigenen Rahmenbedingungen – Mckinsey hat den Mckinsey Way; MuSigma nennt sein Gerüst muPDNA; eClerx verfügt über das Analytics Consulting Framework.
  • Roadmaps für Innovation: Legen Sie Roadmaps fest, um sicherzustellen, dass ein Gleichgewicht zwischen der Art des Betriebs der Kostenstelle und dem Wert für das Unternehmen besteht, um den Return on Investment zu demonstrieren.
  • Talent: Gewinnen und binden Sie Talente durch Leistungsbeurteilungen von Einzelpersonen und Teams. Um Talente zu halten, bieten Unternehmen Belohnungen und Anerkennung basierend auf Innovation, Effizienz, Leistung usw.
  • Betriebsmodell: Teams sollten sich auf die Wahl des richtigen Betriebsmodells konzentrieren – Push vs. Pull, zentralisiert vs. Hub and Spoke usw.
  • Reifegradbewertungsrahmen und Fortschrittsverfolgung.

Wichtige Fragen zu stellen

Sie haben jetzt die Spieler, die Ausrüstung und die Mechanik, um „match ready“ zu sein, aber die Möglichkeit eines unerwarteten Ereignisses am Spieltag kann nicht ausgeschlossen werden. Um ein „Winning Team“ zu garantieren, müssen folgende Fragen gestellt werden:

Für das Data-Science-Team

  • Führungskräfte kommen mit Problemen zu Ihnen?
  • Können Sie die Rentabilität/Verbesserung der erstellten Lösungen nachweisen?
  • Nimmt die unterschiedliche Anzahl an Lösungen, die in den BAU-Prozessen entwickelt, eingesetzt und vor allem konsumiert werden, kontinuierlich zu?
  • Fällt es Ihnen leicht zu skalieren?
  • Wird die Effizienz kontinuierlich verbessert? Können Sie Lösungen schneller liefern?

Für ein Data-Science-Startup/Dienstleister

  • Sind Ihre Fähigkeiten darauf ausgerichtet, was Kunden suchen?
  • Befinden Sie sich relativ zur aktuellen Marktlage auf einem relativ hohen Reifegrad?
  • Haben Sie eine gute Erfolgsbilanz bei der Umwandlung von Prototypen und Pilotprojekten in langfristige Engagements und Lösungen?
  • Werden Sie von Kunden, Geschäftsteams und internen Data-Science-Teams gemocht (oder vielleicht von ihnen gehasst, wenn Sie es aus einer anderen Perspektive betrachten)?
  • Sind Sie anpassungsfähig und flexibel, aber dennoch skalierbar genug, um sich mit Kunden über Personalprozesse und Plattformen hinweg zu integrieren?
  • Können Sie den Interessenvertretern verbesserte KPIs basierend auf den von Ihrem Team bereitgestellten Lösungen und Erkenntnissen zeigen?
  • Haben Sie einen hohen Anteil an wiederkehrenden/langfristigen Kundenbindungen im Vergleich zu einmaligen Entwicklungen?
  • Sind Sie in der Lage, das Gleichgewicht zwischen Kosten, Qualität und Bauzeit aufrechtzuerhalten?

Wickeln

Während der obige Spickzettel Ihnen beim Aufbau und der Skalierung eines Data-Science-Teams helfen kann, erfordert jeder der genannten Hinweise sorgfältige Überlegung, Bewertung und Planung, um die richtige Entscheidung zu treffen. Der Vorteil ist, dass Sie anhand der Bewertungskriterien nachvollziehen können, ob das Team auf dem richtigen Weg ist. Sich schnell anzupassen, den Kurs zu korrigieren und über die neuesten Branchennachrichten auf dem Laufenden zu sein, das Bewusstsein für Risiken und Erfolgsfaktoren sind der Schlüssel zum Aufbau erfolgreicher Datenteams.