Microsoft Professional Program Data Science – Modul 6 und folgende

Nun bin weiter im Plan, was diesen Kurs betrifft, derzeit stehe ich hier:

Modul 6 ist sehr Azure ML lastig. Um ehrlich zu sein, bin ich derzeit noch dabei, mich an diese Umgebung zu gewöhnen. Eigentlich sieht es ja fast etwas wie ein SSIS-Projekt aus, Nur wenn man ein paar Steps drinnen hat, leidet die Übersichtlichkeit schon sehr. Ich muss mich da mal schlau machen, wie so ein Projekt ordentlich dokumentiert werden kann:

Die nächsten Module gehen dann wieder stark Richtung R, ich werde mich im 7. Teil des Kurses für diese Option entscheiden:

Und sehr gute finde ich, dass im 8. Teil eine neue Option dazu gekommen ist, wieder geht es um R im Hinblick auf Big Data:

Somit kriege ich hier sicher einen umfassenden ersten Einblick in diese Materie…

Microsoft Professional Program Data Science – Modul 5 – Review

Auch dieses Modul habe ich mittlerweile erfolgreich abgeschlossen. Der erste Eindruck hat nicht getäuscht, das war wirklich eine tolle Sache. Kurze Einführungsvideos, die obligatorischen Fragen beantworten und dann gleich jeweils ein Lab. Die hier von datacamp bereitgestellte Onlineumgebung war wirklich sehr übersichtlich und benutzerfreundlich.

Etwas Bammel hatte ich fur dem abschliessenden Test, 40 Fragen, jeweils 4 Minuten Zeit für die Lösung. Immerhin macht dieser Test bis zu 40 % der Gesamtnote aus. Aber auch das hat gut geklappt, wobei mir die lokal installierte RStudio Umgebung bei der Lösung doch sehr geholfen hat.

Freue mich schon auf den Programming with R Kurs, wirklich beindruckend, wie leicht sich z.B. Visualisierungen in R realisieren lassen. Aber dazwischen liegt ja noch dieses Modul:

Es bleibt also spannend…

 

 

Microsoft Professional Program Data Science – Modul 3

So, den dritten Teil mit dem Namen „Analyse and Visualise Data“ habe ich nun auch abgeschlossen. Im Prinzip war es eine nette Einführung in Power BI. Fragen wie „Welche drei Eigenschaften kann man durch Klicken auf das Objekt xy ändern?“ könnte man sich meiner Meinung nach getrost sparen. Aber die labs waren kurzweilig und es ist schon immer wieder verblüffend, welch tolle und interaktive Grafiken man mit Power BI erstellen kann. Wirklich interessant fand ich die Abschnitte zum Thema Direct Query und Developer API.

Kurz gesagt, dieses Modul war echt kurzweilig und hat richtig Spass gemacht.

Jetzt habe ich mich an das vierte Modul „Statistical Thinking for Data Science and Analytics“ gemacht. Da habe ich im Internet gelesen, dass es eher eine trockene Geschichte ist, viel Theorie usw. Week 1 habe ich bereits absolviert, war aber schon interessant, den Professoren zuzuhören, was sie unter Data Science verstehen, wie sie zu Data Science gekommen sind und was es braucht, um ein Data Scientist zu werden. Nur die Fragen am Ende waren dann wieder überflüssig, im Prinzip musste man die Antworten aus zwei Artikeln heraussuchen…

Mal sehen, was mich noch erwartet…

Microsoft Professional Program Data Science – Modul 2

Zwischenzeitlich habe ich nun das zweite Modul absolviert:

capture1

Meine Erfahrungen  hierzu:

Ich muss gestehen, dass ich nur wenige der Lernvideos angeschaut habe, sondern mich eher auf das Beantworten der einzelnen Fragen ohne entsprechende Vorbereitung konzentriert habe. Grundsätzlich ist es wirklich eher eine Einführung in die SQL Abfragesprache, wobei einige Befehle wie with rollup oder grouping sets durchaus eine gute Wiederholung sind. Interessant fand ich es noch, wie einfach eine Azure-Testumgebung (die Module sehen eigentlich vor, dass der Kurs mit einer SQL Azure DB gemacht wird)  mittlerweile aufzusetzen ist.

Im abschliessenden Test gibt es im Unterschied zum restlichen Kurs nur einen Versuch zur Beantwortung jeder Frage , also kein zweiter Versuch. Ich muss gestehen, dass ich mir mit der Formulierung der einen oder anderen Frage etwas schwer getan habe,  vielleicht auch darum, weil ich diese meist erst immer spät abends nach einem harten Arbeitstag durchgeackertt habe. Wie auch immer, mit etwas Vorkenntnissen, den Lernvideos und Mister Internet sollten es eigentlich jedem möglich sein, die geforderten 70 % zu erreichen.

Somit habe ich nun das dritte Modul gestartet, man kann hier zwischen 2 Varianten wählen:

capture3 capture4

Ich habe mich natürlich für Power BI entschieden und auch schon ein paar Videos überflogen. Ist anfänglich auch ziemlich basic, lustig finde ich, dass gleich im ersten Lab Daten aus einer Access DB geladen werden und zwar ca. 10 Mio. Sales Datensätze, da wird wohl in der Praxis eher ein anderern Ansatz sinnvoller sein. Wie auch immer, ich harre der Dinge, die da noch kommen…