Data Scientist David Seres über Potenzial und Ethik von Big Data

GCI Management | | Mai 18, 2021

Täglich erzeugt jeder Mensch und jedes Unternehmen abertausende Datenpunkte. Der Job von Data Scientist David Seres ist es, aus riesigen Datenmengen relevante Informationen herauszufiltern. Darin schlummern enorme Potenziale, wie der Analyst weiß. Wieso große Datenmengen offenbaren können, was im Kleinen oft verborgen bleibt, und warum mit dieser Erkenntnisquelle verantwortungsvoll umgegangen werden muss, erzählt David Seres im Interview.

Als Data Scientist verwandeln Sie riesige Datenmengen in wertvolle Erkenntnisse und helfen so Unternehmen dabei, datenbasierte Entscheidungen zu treffen. Wie gehen Sie dabei vor?
Ich glaube, dass man mit der Zeit ein Gefühl dafür bekommt, welche Informationen und Potenziale sich in Datenmengen verbergen. Je mehr man sich mit einer Sache beschäftigt, umso mehr wird die Intuition Teil des Prozesses. Gleichzeitig braucht intuitives Arbeiten aber auch einen Rahmen. Der erste Schritt ist also, sich einen Überblick darüber zu verschaffen, was gebraucht wird und wozu die Analysen dienen sollen. Das stellt auch das Grundgerüst des Rahmens dar und sollte schon zu Beginn eines Projekts weitgehend klar sein. Ohne das Big Picture zu kennen, ist es nicht sinnvoll, mit der Umsetzung überhaupt zu beginnen. Das ist eine wichtige Vorarbeit, bei der Kommunikation ein ausschlaggebender Faktor ist. Überhaupt ist Kommunikation in allen Prozessphasen wesentlich. Sobald die Erwartungen geklärt sind, erstelle ich ein Profil über die relevanten Tools, Pakete, Programmierkenntnisse und Methoden, um die Vorstellungen der Kund*innen in die Realität umzusetzen. Ich skizziere mir immer die einzelnen Prozessschritte, wie sie miteinander verknüpft sind, welche Schnittstellen nötig sind usw. 

 

Derzeit entwickeln Sie in Zusammenarbeit mit GCI Management eine WebApp für das hauseigene Working Capital Management Tool. Können Sie darüber mehr erzählen?
Ich erstelle die Webapplikation in R Shiny - ein Entwicklungstool, das für die Erstellung von einfachen bis hin zu komplexen Webapplikationen in der Programmiersprache R konzipiert wurde. Das Tool soll die Zusammenhänge des Working Capitals darstellen und die darin verborgenen Potenziale ins Sichtfeld der Benutzer*innen rücken. Working Capital Management ist zwar ein bekanntes Thema, gleichzeitig gibt es aber noch kaum praktische Anwendungsgebiete, bei denen die Liquidität eines Unternehmens auch aus dieser Perspektive beleuchtet wird. Das Tool soll sich genau in dieser Nische ansiedeln. 

 

Was offenbaren große Datenmengen, das sich im Kleinen nicht erkennen lässt?
Statistisch gesehen haben große Datenmengen den Vorteil, die Realität genauer abzubilden als das mit kleinen Datenmengen möglich ist. Das lässt sich gut vergleichen mit einer Umfrage, bei der entweder die Antworten von 100.000 Befragten analysiert werden, oder nur von 100. Die Aussagekraft von Datensätzen lässt sich - gegeben einer entsprechenden Qualität - an der Quantität messen. Hierbei spielt das Gesetz der großen Zahlen eine wichtige Rolle: Je mehr untersuchte Datenpunkte vorhanden sind, desto eher nähern sie sich einer theoretischen Verteilung an.

 

Schafft die Arbeit mit Massendaten in Unternehmen Ihrer Erfahrung nach mehr Vertrauen oder ist möglicherweise gerade das Gegenteil der Fall?
Das ist eine Frage, die immer individuell beantwortet werden muss, und für die es in vielen Fällen keine eindeutige Antwort gibt. Große Datenmengen bedeuten oft mehr Informationsdichte. Je mehr Datenpunkte und Variablen man zur Verfügung hat, desto bessere Erkenntnisse kann man wahrscheinlich aus ihnen gewinnen und desto präzisere Ergebnisse liefern auch die angewandten statistischen Methoden. Auf der anderen Seite werden Daten oft missbräuchlich verwendet und eingesetzt, um etwa die Bevölkerung zu überwachen (wie das in China gemacht wird), Wahlen zu manipulieren (Cambridge Analytica), Menschen bewusst in die Irre zu führen (Fake News)… Daten und die daraus gezogenen Erkenntnisse sind an sich aber wertfrei. Ausschlaggebend ist, wer diese Daten interpretiert und wofür sie eingesetzt werden.

 

Teilen Sie die Sorge, dass Mitarbeiter*innen - besonders in der produzierenden Industrie - irgendwann wie Maschinenanlagen überwacht werden? Oder sind gläserne Mitarbeiter*innen schon heute Realität?Leider ist das heute schon Realität und der Trend zeigt in eine dystopische Zukunft. Ich glaube, dass davon nicht nur Mitarbeiter*innen betroffen sind, sondern alle Bürger*innen. Gerade wenn es um die „Wirtschaftlichkeit“ von Mitarbeiter*innen geht, ist eine kapitalistische Einstellung - also eine Messbarkeit von menschlicher Arbeitsleistung - seitens des Managements wichtig, um die Planbarkeit sicherzustellen. Das ist aber natürlich ein äußerst kritisches und zu kritisierendes „Business as usual“ in vielen Unternehmen. Meine Erfahrung zeigt: Je kapitalistischer ein Unternehmen geführt wird, umso mehr gerät der humane Aspekt in Verdrängung. Je wichtiger der Gewinn und das Wachstum ist, umso eher werden Praktiken eingesetzt, die die dystopische Vorstellung von Mensch = Maschine in die Realität umsetzen. Persönlich denke ich, dass Kapitalismus per se ein geeignetes System ist, um den Entwicklungsdrang von Menschen zu unterstützen, jedoch müssen rechtliche und politische Rahmenbedingungen geschaffen werden, die die humanen Aspekte (Wunsch nach Anerkennung, Freiheit, Privatsphäre etc.) wieder in den Vordergrund stellen.


Sind wir alle maschinenlesbar geworden, beruflich und privat?
Ja. Je mehr ich mich im Internet präsentiere, umso größer mein Fußabdruck, der nachverfolgt werden kann und in den meisten Fällen auch verfolgt wird. Cookies tracken das individuelle Verhalten von Websitebesucher*innen. Poste ich einen Beitrag auf Facebook, wird das nicht nur gespeichert - es wird auch analysiert, wie oft es geklickt wurde, wem es gefällt, wie lange es angeschaut wurde und wie oft es geteilt wurde. Das gleiche passiert wenn ich auf Instagram ein Bild aus meinem privaten Leben hochlade. Oder wenn ich auf Tinder jemanden like. Und auch wenn ich auf Amazon einkaufe. Mithilfe all dieser Daten werden Nutzerprofile erstellt, die dann das Verhalten mit erschreckender Genauigkeit abbilden. Man darf sich dann nicht wundern, wenn man mit Freund*innen z.B. über Fahrräder redet und man später während des Lesens eines Artikels auf einer Website plötzlich eine Werbeanzeige von Fahrrädern sieht. 


Wie handhaben Sie es persönlich eigentlich mit Ihren Daten?
Ich versuche, so wenig von mir preiszugeben, wie möglich. Es liegt in meiner Hand, welche Daten ich welchen Unternehmen zur Verfügung stelle. Natürlich kann man die eigenen Spuren nicht völlig aus dem Internet wischen und eine gewisse Gemütlichkeit ist mir auch wichtig. Gleichzeitig versuche ich, meinen elektronischen Fußabdruck mit Tools wie CookieAutoDelete oder Ghostery klein zu halten. Ich ändere meine Passwörter regelmäßig bzw. verwende oft andere Benutzernamen, da in den vergangenen Jahren weitläufige Hackerangriffe fast zum Alltag geworden sind. Weiters hab ich ein natürliches Misstrauen gegenüber großen Konzernen wie Facebook, Apple, Google, Amazon und Co. entwickelt und achte darauf, diesen nur die nötigsten Informationen zukommen zu lassen. Auch die Verwendung von VPN ist wichtig und oft recht nützlich. 


Sie haben letztes Jahr das Propädeutikum Ihrer Psychotherapieausbildung abgeschlossen. Inwiefern kommt Ihnen die Sozialkompetenz auch als Datenanalyst und Entwickler zugute?
Über die Entwicklung meiner Sozialkompetenzen während meiner Ausbildung könnte ich ein Buch schreiben. Ein ganz wichtiges Element, das ich aus dieser Ausbildung und dem Praktikum mitnehme, ist der Umgang mit meinen Mitmenschen. Für mein Praktikum habe ich mich entschieden, in einer psychiatrischen WG für Kinder und Jugendliche zu arbeiten, was meine Sozialkompetenzen ordentlich auf die Probe gestellt hat. Ich habe in dieser Zeit mehr über die menschliche Psyche gelernt als jemals zuvor, und war oft mit extremen Situationen konfrontiert. Ich habe die Gelegenheit bekommen, den Kindern auf Augenhöhe zu begegnen, über ihre Störungen hinaus zu blicken und sie in ihrer Gesamtheit zu sehen. Aus dem heraus habe ich gelernt, wie man intra- und interpsychisch Emotionen gesund reguliert und wie man Konflikte managen kann. Nachdem ich das im Extremfall einer psychiatrischen WG gelernt habe, fällt mir die Anwendung vom Gelernten in den (meist) nicht-psychiatrischen Alltagssituationen deutlich leichter.

Neben Ihrer Arbeit als Data Scientist und Developer engagieren Sie sich sozial, spielen Squash und machen Musik. Das klingt nach einem vollen Programm.
Ich bin ein Energiebündel und unternehme sehr gerne alles mögliche. Dank meines ADHS habe ich auch meist die nötige Energie um vieles umzusetzen. Musik hat mich schon in jungen Jahren fasziniert. Ich finde darin eine wundervolle Möglichkeit, meine Emotionen zu kanalisieren und sie nach außen zu tragen. Beim Sport verhält es sich ähnlich - mit dem großen Plus, dass man davon körperlich wie auch psychisch erschöpft ist. Squash ist für mich in vielerlei Hinsicht der ideale Ausgleich zu meinem eher gedanklich orientierten Alltag.

Anmeldung GCI Newsletter

 

Über den Autor

Kommentare