1 von 91.893 IT- und Engineering-Profilen

Fachlicher Schwerpunkt dieses Freiberuflers

Data Science and Data Security, Datenwissenschaft und Datensicherheit

verfügbar ab
01.12.2017
verfügbar zu
100 %
davon vor Ort
60 %
PLZ-Gebiet, Land

D0

D1

D2

Schweiz

Kontaktwunsch

Ich möchte bevorzugt für Projekte in diesen Einsatzorten kontaktiert werden.

Kommentar

Position

Kommentar

Seit 16 Jahren arbeite ich nun mit unterschiedlichen Daten in den Bereichen: Gesundheit, Defense und Marketing. Eine breite Ausbildung erfolgte in Mathematik an der ETH Zürich und am Max-Planck-Institut für molekulare Genetik sowie Freie Universität Berlin in der Modellierung von biologischen Vorgängen. Dafür wurden auch Methodenvergleiche zwischen Machine Learning, Informationstheorie und statistischen Ansätzen durchgeführt, eigene Methoden entwickelt und im Rahmen von Workshops vermittelt.

Seit 9 Jahren habe ich Erfahrung im Informationsschutz von Organisation bis 1000 Personen im digitalen wie nicht-digitalen Bereich. Informationssicherheit kann nur erreicht werden mit prozessübergreifenden Massnahmen in einer Organisation. Dieses Schutzbedürfnis erhält derzeit zunehmende Beachtung mit neuesten Online-Technologien und kann abgedeckt werden.

Datenwissenschaft/Data Science: Entwerfen und Aufsetzen einer Cloud-basierten, skalierbaren Datenverar-beitung (Hadoop, R/BioConductor, Kommandozeilen Streaming); Erfassung der Datenbestände; Aufzeigen von Auswertungsmöglichkeiten und Eruieren der Wertschöpfungspotenziale; Schrittweiser Aufbau  von ma-thematischen Datenmodellen; Präsentation von datenbasierten Geschäftsmodellen gegenüber Investoren; Evaluierung von 16s-Sequenzierdaten;


Datensicherheit: Konzept zur Auswertung von Patientendaten in der Cloud; Erfassung und Beschreibung von Risiken; Risikobewertung und Erarbeitung von Informationssicherheits-Konzepten mit Massnahmeplänen; Umfassende Konzepte mit geschäftsprozessübergreifenden Massnahmen;


Beispielprojekte: Interim-CTO in einem Biotech Startup; Markt-Analyse einer Sharing-Plattform zur Prüfung einer Geschäftsidee; Bestimmen einer Strategie für netzwerk-basiertes Marketing; Entwicklung einer minimalen Cloud-Lösung und geeigneter Prozesse für Kleinunternehmen und Arbeitsgruppen; Umsetzung und Erprobung durch einen Partner; Modellieren und Berechnen in Wolfram Mathematica.

Projekte

01/2016 - Heute

1 Jahr 10 Monate

Datenwissenschaftler und Informationssicherheitsbeauftragter

Projektinhalte
  • Zielgruppe sind kleinere und mittlere Unternehmen mit hohem Innovationsgrad, deren Geschäfts- und
    Entwicklungstätigkeit grosse Datenmengen aufwerfen und in der Folge neue Wertschöpfungspotenziale
    entstehen
  • Datenwissenschaft/Data Science: Entwerfen und Aufsetzen einer Cloud-basierten, skalierbaren
    Datenverarbeitung (Hadoop, R/BioConductor, Kommandozeilen Streaming); Erfassung der Datenbestände;
    Aufzeigen von Auswertungsmöglichkeiten und Eruieren der Wertschöpfungspotenziale; Schrittweiser
    Aufbau von mathematischen Datenmodellen; Präsentation von datenbasierten Geschäftsmodellen gegenüber Investoren; Evaluierung von 16s-Sequenzierdaten
  • Informationssicherheit: Konzept zur Auswertung von Patientendaten in der Cloud; Erfassung und
    Beschreibung von Risiken; Risikobewertung und Erarbeitung von Informationssicherheits-Konzepten mit
    Massnahmeplänen; Umfassende Konzepte mit geschäftsprozessübergreifenden Massnahmen;
  • Beispielprojekte: Interim-CTO in einem Biotech Startup; Markt-Analyse einer Sharing-Plattform zur Prüfung einer Geschäftsidee; Bestimmen einer Strategie für netzwerk-basiertes Marketing; Entwicklung meiner minimalen Cloud-Lösung und geeigneter Prozesse für Kleinunternehmen und Arbeitsgruppen; Umsetzung und Erprobung durch einen Partner; Modellieren und Berechnen in Wolfram Mathematica.

04/2017 - 08/2017

5 Monate

Auswertung von Kunden-Messdaten

Rolle
CTO
Kunde
SmartFlora
Einsatzort
London
Projektinhalte

Verarbeiten und Auswerten von 16s-Sequenzierdaten der Illumina MiSeq Experimentplattform; Übersicht der bakteriellen Datenbanken pflegen; Auswahl von Bioinformatik Werkzeugen und Methoden; Konzept für die Datenauswertung in der Cloud; Konzept für die Informationssicherheit um Kundendaten zu schützen; Entwickeln eines qualitativen mathematischen Modells zum Vergleich von Kundendaten mit einer Produktplattform; Repräsentation des Geschäfts und der verwendeten Modelle gegenüber Investoren.

Kenntnisse

R

Hortonworks Hadoop Data Platform

02/2017 - 02/2017

1 Monat

Datenauswertung und Formulierung einer Strategie für netzwerk-basiertes Marketing

Rolle
Data Scientist
Einsatzort
Berlin
Projektinhalte

Auswertung eines Datensatzes von Kunden mit gemeinsamen Shopping-Präferenzen und Shopping-Events. Übertragung des Ergebnisses in einen Vorschlag für die Vertriebsoptimierung.

09/2016 - 11/2016

3 Monate

Betriebsinterne Cloud-Lösung mit begleitendem Sicherheitskonzept

Rolle
Berater
Einsatzort
Berlin
Projektinhalte

Entwickeln einer minimalen Cloud-Lösung und begleitender Prozesse für Kleinunternehmen und Arbeitsgruppen; Implementation und Überprüfung in Zusammenarbeit mit einem Projektpartner.

Kenntnisse

Ubuntu

ownCloud

09/2009 - 12/2015

6 Jahre 4 Monate

Wissenschaftlicher Mitarbeiter

Kunde
Max-Planck-Institut für molekulare Genetik
Einsatzort
Berlin
Projektinhalte
  • Herausforderungen für die Informationsgewinnung in der Biostatistik liegen in hohen Messungenauigkeiten sowie zahlreichen unverstandenen Stör- und Interaktionseffekten;
  • Datenauswertung von drei Technologien (biomedizinische Messmethoden namens Affymetrix gene expression array, Affymetrix exon array, Illumina next-generation sequencing/RNA-Seq) zur Ermittlung der Gen-Aktivität in Zellen; Implementierung der Daten-aufbereitung und Normalisierung in R und Bash mit Ausgabe als Text, Graphik und Webserver; Standardisierung der Verfahren;
  • Methodenevaluierung z. Bsp. statistische Tests, Machine Learning, bayessche Netze und Informationstheorie basierte Ansätze; Entwicklung neuer statistischer Methoden zur Identifizierung von bestimmten Effekten in biologischen Zellen, u. a. für Zeitreihenauswertungen; Anwendung der Methoden auf mehrere 1000 Datensätze in unterschiedlichen Feldern wie Typ-2 Diabetes Mellitus, Krebs oder Toxikologie;
  • Zusammenführung von ausgewerteten Daten aus heterogenen Datensätzen und Entwicklung einer Methode zur Meta-Analyse in R/BioConductor zur Fokussierung unterschiedlicher Ergebnisse; Implementierung mathematischer Modelle in Python;
  • Koordination mit Projektpartnern auf nationaler und europäischer Ebene; Austausch mit biologischen Labor-Arbeitsgruppen bzgl. des Experiment-Designs und eigenständiges Vorantreiben eigener Fragestellungen;
  • Präsentieren der Ergebnisse als Vorträge an Konferenzen und Publizieren als Artikel in wissenschaftlichen Fachmagazinen; Begutachtung von Beiträgen für Konferenzen und Fachmagazine;
  • Organisation von wissenschaftlichen Seminaren, Weiterbildungsmassnahmen und Kursen für Doktoranden, sowie Vermitteln von R-Kenntnissen im Rahmen von Workshops; Betreuung von studentischen Hilfskräften, Praktikanten, Bachelor- und Master-Studenten.

06/2008 - 12/2015

7 Jahre 7 Monate

ARH-seq

Rolle
Research scientist
Einsatzort
Berlin
Projektinhalte

Herausforderungen für die Informationsgewinnung in der Biostatistik liegen in hohen Messungenauigkeiten sowie zahlreichen unverstandenen Stör- und Interaktionseffekten;
Datenauswertung von drei Technologien (biomedizinische Messmethoden namens Affymetrix gene expression array, Affymetrix exon array, Illumina next-generation sequencing/RNA-Seq) zur Ermittlung der Gen-Aktivität in Zellen; Implementierung der Daten-aufbereitung und Normalisierung in R und Bash mit Ausgabe als Text, Graphik und Webserver; Standardisierung der Verfahren;
Methodenevaluierung z. Bsp. statistische Tests, Machine Learning, bayessche Netze und Informationstheorie basierte Ansätze; Entwicklung neuer statistischer Methoden zur Identifizierung von bestimmten Effekten in biologischen Zellen, u. a. für Zeit-reihenauswertungen; Anwendung der Methoden auf mehrere 1000 Datensätze in unterschiedlichen Feldern wie Typ-2 Diabetes Mellitus, Krebs oder Toxikologie;
Zusammenführung von ausgewerteten Daten aus heterogenen Datensätzen und Entwicklung einer Methode zur Meta-Analyse in R/BioConductor zur Fokussierung unterschiedlicher Ergebnisse; Implementierung mathematischer Modelle in Python;
Koordination mit Projektpartnern auf nationaler und europäischer Ebene; Austausch mit biologischen Labor-Arbeitsgruppen bzgl. des Experiment-Designs und eigenständiges Vorantreiben eigener Fragestellungen;
Präsentieren der Ergebnisse als Vorträge an Konferenzen und Publizieren als Artikel in wissenschaftlichen Fachmagazinen; Begutachtung von Beiträgen für Konferenzen und Fachmagazine;
Organisation von wissenschaftlichen Seminaren, Weiterbildungsmassnahmen und Kursen für Doktoranden, sowie Vermitteln von R-Kenntnissen im Rahmen von Workshops; Betreuung von studentischen Hilfskräften, Praktikanten, Bachelor- und Master-Studenten.

Kenntnisse

statistical algorithms

information theory

R

method development

04/2008 - 12/2015

7 Jahre 9 Monate

Alternatives Spleissen Robuste Vorhersage mit Entropie (ARH) für Diabetes, Krebs

03/2008 - 12/2015

7 Jahre 10 Monate

Illumina RNA-Sequencing differentielles Spleissen für Krebs

03/2008 - 12/2014

6 Jahre 10 Monate

Begutachtung von 4 Publikation und Beiträgen zu drei Konferenzen

03/2007 - 08/2009

2 Jahre 6 Monate

Affymetrix GeneChip® Exon Array Auswertungspipeline für Type-2 Diabetes, Krebs

11/2004 - 08/2009

4 Jahre 10 Monate

Forschungsassistent

Kunde
Max-Planck-Institut für molekulare Genetik
Einsatzort
Berlin
Projektinhalte
  • Herausforderungen für die Informationsgewinnung in der Biostatistik liegen in hohen Messungenauigkeiten sowie zahlreichen unverstandenen Stör- und Interaktionseffekten;
  • Datenauswertung von drei Technologien (biomedizinische Messmethoden namens Affymetrix gene expression array, Affymetrix exon array, Illumina next-generation sequencing/RNA-Seq) zur Ermittlung der Gen-Aktivität in Zellen; Implementierung der Daten-aufbereitung und Normalisierung in R und Bash mit Ausgabe als Text, Graphik und Webserver; Standardisierung der Verfahren;
  • Methodenevaluierung z. Bsp. statistische Tests, Machine Learning, bayessche Netze und Informationstheorie basierte Ansätze; Entwicklung neuer statistischer Methoden zur Identifizierung von bestimmten Effekten in biologischen Zellen, u. a. für Zeitreihenauswertungen; Anwendung der Methoden auf mehrere 1000 Datensätze in unterschiedlichen Feldern wie Typ-2 Diabetes Mellitus, Krebs oder Toxikologie;
  • Zusammenführung von ausgewerteten Daten aus heterogenen Datensätzen und Entwicklung einer Methode zur Meta-Analyse in R/BioConductor zur Fokussierung unterschiedlicher Ergebnisse; Implementierung mathematischer Modelle in Python;
  • Koordination mit Projektpartnern auf nationaler und europäischer Ebene; Austausch mit biologischen Labor-Arbeitsgruppen bzgl. des Experiment-Designs und eigenständiges Vorantreiben eigener Fragestellungen;
  • Präsentieren der Ergebnisse als Vorträge an Konferenzen und Publizieren als Artikel in wissenschaftlichen Fachmagazinen; Begutachtung von Beiträgen für Konferenzen und Fachmagazine;
  • Organisation von wissenschaftlichen Seminaren, Weiterbildungsmassnahmen und Kursen für Doktoranden, sowie Vermitteln von R-Kenntnissen im Rahmen von Workshops; Betreuung von studentischen Hilfskräften, Praktikanten, Bachelor- und Master-Studenten.

02/2005 - 03/2009

4 Jahre 2 Monate

Betreuung einer Institutsseminarreihe, u.a. mit Themen wie Bioethik

04/2005 - 06/2008

3 Jahre 3 Monate

T2DM-GeneMiner

Rolle
Research Scientist
Einsatzort
Berlin
Projektinhalte

Background: Multiple functional genomics data for complex human diseases have been published and made available by researchers worldwide. The main goal of these studies is the detailed analysis of a particular aspect of the disease. Complementary, meta-analysis approaches try to extract supersets of disease genes and interaction networks by integrating and combining these individual studies using statistical approaches.

Results: Here we report on a meta-analysis approach that integrates data of heterogeneous origin in the domain of type-2 diabetes mellitus (T2DM). Different data sources such as DNA microarrays and, complementing, qualitative data covering several human and mouse tissues are integrated and analyzed with a Bootstrap scoring approach in order to extract disease relevance of the genes. The purpose of the meta-analysis is two-fold: on the one hand it identifies a group of genes with overall disease relevance indicating common, tissue-independent processes related to the disease; on the other hand it identifies genes showing specific alterations with respect to a single study. Using a random sampling approach we computed a core set of 213 T2DM genes across multiple tissues in human and mouse, including well-known genes such as Pdk4, Adipoq, Scd, Pik3r1, Socs2 that monitor important hallmarks of T2DM, for example the strong relationship between obesity and insulin resistance, as well as a large fraction (128) of yet barely characterized novel candidate genes. Furthermore, we explored functional information and identified cellular networks associated with this core set of genes such as pathway information, protein-protein interactions and gene regulatory networks. Additionally, we set up a web interface in order to allow users to screen T2DM relevance for any – yet non-associated – gene.

Conclusion: In our paper we have identified a core set of 213 T2DM candidate genes by a meta-analysis of existing data sources. We have explored the relation of these genes to disease relevant information and – using enrichment analysis – we have identified biological networks on different layers of cellular information such as signaling and metabolic pathways, gene regulatory networks and protein-protein interactions.

Kenntnisse

R

statistical algorithms

method development

11/2004 - 06/2008

3 Jahre 8 Monate

Meta-Analyse von heterogenen Datensätzen für Type-2 Diabetes, Krebs, Toxikologie

03/2005 - 03/2007

2 Jahre 1 Monat

Affymetrix GeneChip® 3' Array Auswertungspipeline für Krankheiten und Toxikologie

Kompetenzen

Sprachkenntnisse
Deutsch
Muttersprache
Englisch
Verhandlungssicher
Französisch
Konversationsniveau

Produkte / Standards / Erfahrungen

Führung

Zertifikat Stufe 3 der SKO für Mitarbeiterführung und Führungstechniken

Software

  • MS Windows
  • Linux
  • diverse Office Software
  • Python
  • SQL
  • LaTeX/LyX
  • Bash
  • Hadoop

Math Software

  • R/BioConductor
  • Mathematica
  • MatLab

Überprüfung

Persönliche Sicherheitsüberprüfung gemäss Militärgesetz der Schweizer Armee

Berufliche Tätigkeiten
01/2016 – heute

Berater für Data Science und Informationssicherheit, selbständig


09/2009 – 12/2015

Wissenschaftlicher Mitarbeiter, Max-Planck-Institut für molekulare Genetik, Berlin


11/2004 – 08/2009
Forschungsassistent, Max-Planck-Institut für molekulare Genetik, Berlin


Aus- und Weiterbildung

04/2016 - 04/2016

1 Monat

ISMS Spezialist & Lead Auditor & Implementer nach ISO/IEC 27001

Abschluss
Zertifikat
Institution, Ort
CBT Training & Consulting GmbH
Schwerpunkt

ISMS Spezialisten & Lead Auditor nach ISO/IEC 27001, Zertifikat CBT Training & Consulting GmbH 04/2016

lnformationen und lnformationssicherheit

• Begriffe und Definitionen, Abgrenzung zu angrenzenden Bereichen (z.B. Datenschutz)

• Warum lnformationssicherheit?

• Anforderungen aus dem Unternehmen, aus Gesetze (u.a. IT-Sicherheitsgesetz, GoBD), aus Verträgen, etc.

• Schutz von lnformationen, Schutzbedarf (Vertraulichkeit, Verfügbarkeit, lntegrität etc.)

Information Security Management auf Basis der Normreihe 2700x

• Einführung in lnformations-Sicherheits-Management-Systeme (ISMS)

• Kernelemente der Norm ISO 27001:2013 (Managementrahmen, Anhang A, Controls/Massnahmen)

• Best Practice-Vorgehensweise zur lmplementierung eines Information-Security-Management-Systems auf Basis der ISO 2700x Normenreihe

• Organisation der lnformationssicherheit im Unternehmen

• Policies (Richtlinien) und Prozesse im ISMS

• Messbarkeit & ISMS-Kennzahlen auf Basis von ISO 27004:2009

• Einführung in Business Continuity Management (gemäss den Anforderungen in A.17 der ISO

27001:2013, nach ISO 27031:2011 und BSI 100-4).

Information Security Risk Management auf Basis der Normenreihe 2700x

• Allgemeine Einführung in das Risikomanagement

• Anforderungen an IS-Risikomanagement gemass ISO 27001:2013, ISO 27005:2011 und anderen Vorgaben (Gesetze, andere Normen und Standards, etc.)

• Risikomanagement im Bereich lnformationssicherheit

• Der Risikomanagement-Prozess (Asset-lnventarisierung, Schutzbedarf, Bedrohungen, Schwachstellen, Risiko)

• Best Practice Vorgehen für Risiko Assessment

• Behandlung von IS-Risiken

• Auswahl von Massnahmen

• Ausführliche Erläuterung des Prozesses anhand Fallbeispiele und selbst durchgeführter Risikoanalyse.

Auditor für lnformationssicherheit - Lead Auditor

• Einführung in die Auditierung

• Der ISMS Auditprozess

• Rollen und Zuständigkeiten

• Auditplanung

• Ablauf eines Audits (Vorbereitung, Durchführung, Dokumentation, Nachbereitung) Best Practices

• Simulation von Auditsessions / Rollenspiel / Fallstudien

• Zertifizierung nach ISO 27001

10/2015 - 10/2015

1 Monat

IT-Security Beauftragter

Abschluss
Zertifikat
Institution, Ort
TÜV Rheinland
Schwerpunkt

Information Security Delegate.

During the examination participants prove their knowledge in the following areas:

• Organisation of IT security

• Physical security

• Entrance, access and network security

• Legal background

• Standards and norms

“IT Security Representatives (TÜV)” have mastered the essential aspects and requirements of IT security as well as the relevant standards for the implementation of an IT security management system.

11/2008 - 01/2010

1 Jahr 3 Monate

Bioinformatik

Abschluss
Doctor rer. nat.
Institution, Ort
FU Berlin
Schwerpunkt

Doktor der Naturwissenschaften in Bioinformatik

08/1998 - 04/2004

5 Jahre 9 Monate

Mathematik

Abschluss
Dipl. Math. ETH
Institution, Ort
ETH Zürich
Schwerpunkt

Schwerpunkte in Stochastik, theoretischer Informatik, Kryptographie, Optimierung.

Ausbildungshistorie

10/2002 – 08/2003

Erasmus Studentenaustausch, Humboldt-Universität zu Berlin

×
×