Wann ist ein guter Zeitpunkt, joggen oder auf den Spielplatz zu gehen?

cimt beschäftigt sich mit cloud-basierten Strategien zur Verarbeitung von Umweltdaten. Dabei geht es ihnen vor allem darum Data Science zukunftsfähig und transparent zu machen.

Share this post

Beim InfraLab Berlin BizBreakfast können alle, die auf dem EUREF-Campus arbeiten oder an der InfraLab-Community interessiert sind, entspannt in den Tag einsteigen, netzwerken und jedes Mal ein neues Projekt kennenlernen.
Wer Qualitätsdaten erheben und sammeln möchte, hat es heute leichter als noch vor wenigen Jahren. Allein 11 offizielle Messstellen bieten in Berlin Daten zum Wetter oder zur Luftverschmutzung, mit hoher Messgenauigkeit und Prognosen an, die sie auch online zur Verfügung stellen. Flankiert werden diese Messstationen von einem Datennetz aus „Low Costs“-Sensoren, die Berliner Firmen und Privatnutzer kostengünstig erwerben und eigenständig betreiben.
Aber was tun mit Daten, die in großen Mengen gesammelt werden? Wie kann man eine Daten-Infrastruktur mithilfe cloud-basierter Technologie schaffen und Informationen gezielt verwerten?
cimt ist ein bundeweiter Anbieter, der sich seit 20 Jahren mit den Themen Data-Warehouse, Datenmanagement und Datenvisualisierung auseinandersetzt und Lösungen findet. Anhand eines Use Cases für Luft- und Wetterdaten beschreiben Sebastian und Matthias den Weg der Daten entlang eines technischen Verarbeitungsprozesses. Dabei geht es weniger um die Datenerhebung, als vielmehr um deren Weiterentwicklung und Nutzbarkeit. Es geht um Wissenstransfer, um Data Science.

Wie wird Datenverarbeitung produktiv?

Sebastian erklärt den cimt-Lösungsansatz: Die Daten werden in das offene Datenmanagement-Tool „Talent“ geladen. Dort landen sie als Rohdateien nicht etwa in einem unübersichtlichen „Skript-Wald“, sondern werden von Algorithmen dokumentiert und visuell aufbereitet.
Anschließend prüfen Analyse- und Visualisierungsprogramme (Exasol und Tableau) die Daten auf Qualität. Sie werden gereinigt und mit bereits bestehenden Datensätzen verknüpft. Python, die komplizierte Programmiersprache, wird dadurch beispielsweise für jeden Projektmanager lesbar und kann über gängige Befehle – wie in einem Word-Dokument – gesteuert und gefiltert werden. Die daraus entstehende Auswahl macht zeitliche sowie qualitative „Ausreißer“ sichtbar, ebenso wie die tatsächliche Anzahl der Feinstaubpartikel in der Luft.
Es gibt viele Ausreden, um sein Jogging-Programm zu verschieben, aber das Wissen über schlechte Wetter- und Luftverhältnisse direkt vor der Haustür ist sicherlich die Innovativste.
Den gesamten Vortrag von Matthias und Sebastian könnt ihr euch hier ansehen: