Statistikformeln und Datenanalyse

Datenanalysen sind in vielen Bereichen unverzichtbar geworden. Um das volle Potenzial von Excel auszuschöpfen, ist es wichtig, einige grundlegende Statistikformeln zu verstehen. In diesem Blogbeitrag stelle ich Dir einige wichtige Formeln vor, erläutere ihre Syntax und zeige jeweils zwei mögliche Anwendungsfälle auf.

Standardabweichung (STABW)

Die Standardabweichung ist ein Mass für die Streuung von Datenpunkten um den Durchschnitt (auf die wohl allbekannte Formel "MITTELWERT" gehe ich hier nicht ein), wobei es eine Unterscheidung zwischen STABW.N (Grundgesamtheit) und STABW.S (Stichprobe) gibt.

Syntax

=STABW.S(Zahl1; Zahl2; ...)

Die Funktion berechnet die Standardabweichung einer Gruppe von Zahlen.

Anwendungsfälle

  1. Qualitätskontrolle: In der Produktion kann die Funktion verwendet werden, um die Streuung von Produktionsmessungen zu analysieren und die Qualität zu überwachen.
    Beispielsweise: "=STABW.S(3; 4; 2; 5; 3)"
  2. Finanzanalyse: Bei der Analyse von Finanzdaten kann die Standardabweichung verwendet werden, um das Risiko einer bestimmten Investition zu bewerten.

Korrelationskoeffizient (KORREL)

Der Korrelationskoeffizient misst die Stärke und Richtung der linearen Beziehung zwischen zwei Variablen respektive zwei Bereichen.

Syntax

=KORREL(Matrix1; Matrix2)

KORREL berechnet den Korrelationskoeffizienten zwischen zwei Datenbereichen.

Anwendungsfälle

  1. Marktforschung: In der Marktforschung wird der Korrelationskoeffizient verwendet, um die Beziehung zwischen Werbeausgaben und Verkaufszahlen zu analysieren.
    Beispielsweise: "=KORREL(A2:A13; B2:B13)", wobei Spalte A die Werbeausgaben für 12 Monate beinhaltet, Spalte B die Verkaufszahlen.
  2. Sportanalyse: Bei der Analyse von sportlichen Leistungen zeigt der Korrelationskoeffizient den Zusammenhang zwischen Trainingsstunden und Leistungsergebnisse auf.

Quantile (QUANTIL.INKL)

Die QUANTIL.INKL-Funktion gibt den Wert zurück, unter welchem eine gegebene Prozentsatzmenge der Daten liegt.

Syntax

=QUANTIL.INKL(Bereich; K)

Die Funktion QUANTIL-INKL gibt das Quantil (K) einer Datenmenge zurück, wobei K im Bereich von 0 bis 1 liegt. Das Quantil entspricht dem Wert, unter welchem eine bestimmte Prozentsatzmenge der Daten fällt. (Es gibt zudem die Option "QUANTIL-EXKL", wobei K ausgeschlossen und nicht eingeschlossen ist.)

Anwendungsfälle

  1. Einkommensverteilung: Um das k-te Quantil des Einkommens in einer Bevölkerung zu berechnen.
    Beispielsweise: "=QUANTIL.INKL(A2:A100; 0.9)"
  2. Leistungsanalyse: Um den unteren Leistungsstand zu identifizieren, kann das 25. Quantil von Prüfungsergebnissen ermittelt werden.

Regressionsanalyse (RGP)

Die RGP-Funktion führt eine einfache lineare Regression durch und gibt eine Analyse der Regressionsstatistik zurück. Dies dient zur grafischen Darstellung der linearen Beziehung einer unabhängigen und einer abhängigen Variablen.

Syntax

=RGP(Y-Werte; X-Werte; Konstante; Statistik)

Die Funktion berechnet die Regressionsstatistik für eine Gruppe von Datenpunkten und gibt verschiedene Statistiken zurück, einschliesslich der Regressionsgeraden und dem Bestimmtheitsmass (R²).

Anwendungsfälle

  1. Verkaufsprognose: Um den Zusammenhang zwischen Werbeausgaben (X) und Verkaufszahlen (Y) zu analysieren und darzustellen, kommt die Regressionsanalyse (RGP-Funktion) zum Einsatz.
    Beispielsweise: "=RGP(B2:B13; A2:A13; WAHR; WAHR)", wobei Spalte A die Werbeausgaben für 12 Monate beinhaltet, Spalte B die Verkaufszahlen.
  2. Wettervorhersage: Meteorologen verwenden die Funktion, um den Zusammenhang zwischen der Temperatur (X) und der Niederschlagsmenge (Y) zu untersuchen.

Die Anwendung dieser Formeln erweitert Deine Fähigkeit in der Datenanalyse mit Excel und ermöglichen es, fortgeschrittenere Einblicke in Deine Daten zu gewinnen. Experimentiere mit verschiedenen Datensätzen und passe die Formeln auf Deine spezifischen Analyseanforderungen an.

Text verketten (mit und ohne leeren Inhalten)

Vor einiger Zeit wurde hier das Verketten (Aneinanderreihen) von mehreren Spalteninhalten dargestellt. Hierzu wurde die Formel "=VERKETTEN" verwendet (siehe dieser Beitrag). Dabei wurde jeweils das Trennzeichen zwischen jeder Einzelzelle gesetzt. Die Formel "=TEXTVERKETTEN" jedoch ermöglicht es uns, ein generelles Trennzeichen zu definieren, mit welchem wir die zusammengefügte Zeichenfolge trennen möchten. Das kann ein Leerzeichen sein oder auch ein Sonderzeichen wie ",", ";" oder auch "|". Das kennen wir insbesondere, wenn wir eine "csv-Datei" (comma-separated values) erstellen oder anbinden möchten.

Zur Illustration haben wir folgende Datentabelle:
Textverketten_raw

Wenn wir diese Inhalte nun miteinander verketten möchten, fügen wir folgende Formel in der Zelle "F2" ein:

=TEXTVERKETTEN("|";FALSCH;A2:E2)

Als Trennzeichen haben wir das "Pipe-Symbol" ("|") definiert. Danach folgt eine wichtige Entscheidung mittels Angabe von "WAHR" oder "FALSCH", nämlich ob wir leere Zellen ignorieren möchten. Das Resultat sehen wir sogleich. Es ist für uns nicht dienlich, allfällige leere Zellen zu ignorieren (z.B. wenn kein Kommentar eingefügt wurde). Denn das führt lediglich dazu, dass jemand bei der Anbindung der Daten im Nachgang eine falsche Spaltenzuweisung haben könnte.

Das aggregierte Resultat sieht demnach so aus:
Textverketten_FALSCH

 Wie Du im Beispiel sehen kannst, sind die verketteten Einträge zum Dienstag, Mittwoch, Donnerstag und Freitag ohne Kommentar. Sie verfügen jedoch über zwei Trennzeichen zwischen "Temp." (Temperatur) und "Eintrag durch". Hätten wir in der Formel anstelle dessen "WAHR" aufgeführt und leere Zellen ignoriert, wäre das Resultat wie folgt:
Textverketten_WAHR

UiPath Excel AddIn - Einführung und Installation

Das Excel AddIn von UiPath erlaubt es, umfassende Anwendungsfälle aus einer beliebigen Excel-Datei zu starten. Somit können Daten in der aktuellen Datei angereichert oder auch in andere Zielsysteme weitergereicht werden. In diesem Blog zeige ich Dir, wie Du das AddIn installierst und im Weiteren, wie Du einen Prozess dafür bauen könntest. Voraussetzung für die Verwendung des Add-In ist, dass UiPath Assistant (Version 2023.4.2 oder höher) auf dem Gerät installiert ist. Das würde für das Ausführen von Prozessen reichen. Für die Entwicklung von Prozessen benötigst Du "UiPath Studio".

Installationsanleitung

Du könntest das Add-In direkt aus dem Microsoft Store via diesem Link abrufen: https://appsource.microsoft.com/en-us/product/office/WA200005457?flightCodes=UiPathAssistantExcel

Öffne alternativ eine neue Excel-Mappe und gehe unter dem Menüpunkt "Einfügen" auf "Add-Ins abrufen":

ExcelAddIn_Installer_Store

Daraufhin kannst Du nach dem Add-In "WA200005457" suchen und den "UiPath Assistant for Excel" hinzufügen:

ExcelAddIn_Installer_AddIn

Der UiPath Assistant für Excel wird daraufhin verfügbar sein, in meinem Fall noch "ohne Excel Automationen (Prozesse)":

ExcelAddIn_Assistant_empty

Falls Du an der Manifest-Datei interessiert wärst, finde sämtliche Informationen unter diesem Kapitel in der offiziellen UiPath Dokumentation: https://docs.uipath.com/robot/standalone/2023.4/user-guide/excel-add-in#using-the-manifest-file

Entwickeln eines Prozesses in UiPath Studio

Du könntest simple Prozesse und Funktionalitäten von Grund auf bauen. Es gibt jedoch unter den "Templates" (Vorlagen) den folgenden Inhalt, mit welchem die spezifischen Excel-Cases einfacher gebaut werden können. Suche einfach nach "Excel" und Du wirst "UiPath Assistant for Excel Process" finden.

ExcelAddIn_UiPath_Template

Selbstverständlich ist dies lediglich ein "Template", das womöglich Exception-Handling oder Vorgaben Deiner Organisation nicht berücksichtigt, aber für den Umgang mit einer geöffneten Excel-Datei (für den UiPath Assistant) sehr geeignet ist. Die Vorlage beinhaltet einen Subworkflow "Parse Excel Selection", damit die Benutzerauswahl von Zelle(n) interpretiert werden kann. In der Haupt-Sequenz (Main) ist der Umgang mit dem aktuellen Excel-Tabellenblatt vorbereitet. Füge die gewünschten Interaktionen ein, die auf Basis des Excels vorgenommen werden sollen. Das können auch Interaktionen mit dem Web, lokalen Applikationen (Legacy-Systemen) oder APIs sein, um weitreichende Anwendungsfälle zu verarbeiten. In der Vorlage finden sich zudem zwei dynamische Parameter, die diese Vorhaben ermöglichen:

  • in_FilePath (String) - bezieht sich auf den Dateipfad, von welchem das Add-In den Prozess startet.
  • in_Selection (String) - bezieht sich auf die Zelle(n), welche beim Start des Prozesses ausgewählt sind. Bestimmte Funktionalitäten im Prozess können also auf die Benutzer-Selektion im Spezifischen angewandt werden. Zum Beispiel: "Suche mir diese spezifischen Fremdwährungskurse" oder "Frage die selektierte(n) Kundennummer(n) im CRM ab und reichere sie mit bestimmten Daten an".

Nachdem der Prozess erarbeitet wurde, sollte dieser via UiPath Orchestrator veröffentlicht werden. Zunächst würdest Du den Prozess noch nicht im Excel Add-In sehen. Damit ein Prozess im AddIn ersichtlich wird, muss der veröffentlichte Process in UiPath Orchestrator mit dem Tag "excelAddin" versehen werden. Du findest die Einstellung in den Process-Settings auf Orchestrator:

ExcelAddIn_UiPath_ProcessTags

Somit habe ich einen Beispiel-Prozess, der mir für die gewünschten Währungs-Paare die Umrechnungskurse und ein Beispiel davon erarbeiten würde. Ich kann den Prozess jederzeit aus Excel starten und habe einen virtuellen Helfer (Assistant), welcher mich bei der täglichen Excel-Arbeit tatkräftig unterstützen kann.

ExcelAddIn_Assistant_ExchangeRate