{"id":2527,"date":"2021-07-11T12:05:03","date_gmt":"2021-07-11T11:05:03","guid":{"rendered":"https:\/\/recode.law\/?p=2527"},"modified":"2021-07-11T15:05:18","modified_gmt":"2021-07-11T14:05:18","slug":"big-data-glossary","status":"publish","type":"post","link":"https:\/\/recode.law\/en\/big-data-glossary\/","title":{"rendered":"Was ist Big Data ?"},"content":{"rendered":"<p><strong>Was ist Big Data?<\/strong><\/p>\n<p><em><span style=\"font-weight: 400;\">\u201cDaten als das neue \u00d6l\u201d und schon wieder neue Rekordstrafen gegen die \u201cDatenkraken\u201d &#8211; Daten sind in aller Munde, insbesondere der Begriff \u2018Big Data\u2019. Doch was ist \u201cBig Data\u201d eigentlich?<\/span><\/em><\/p>\n<p><span style=\"font-weight: 400;\">Um sich der Definition von Big Data in strukturierte Weise anzun\u00e4hern, wurde das Modell der \u201c3 Vs\u201d &#8211; Volume, Variety und Velocity entwickelt. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Volume<\/span><span style=\"font-weight: 400;\"> bezieht sich auf die schiere Menge an Daten, die produziert, gespeichert und verwendet werden. Bis 2020 soll diese Zahl 35 Zettabytes (ZB) erreichen &#8211; dabei handelt es sich um eine Zahl mit unvorstellbaren 21 Nullen. <\/span><span style=\"font-weight: 400;\">Heutzutage wird alles gespeichert: Umweltdaten, Finanzdaten, medizinische Daten, \u00dcberwachungsdaten, und die Liste geht weiter und weiter. Allein Twitter generiert t\u00e4glich mehr als 7 und Facebook\u00a0 mehr als 10 Terabyte an Daten.\u00a0 <\/span><span style=\"font-weight: 400;\">Mit den exponentiell wachsenden Analyse- und Speicherkapazit\u00e4ten, die sich dem Moore\u2019schen Gesetz zufolge alle 12 bis 24 Monate verdoppeln, werden auch die zur Verf\u00fcgung stehenden Daten exponentiell zunehmen.\u00a0 <\/span><span style=\"font-weight: 400;\">Variety<\/span><span style=\"font-weight: 400;\"> bezieht sich auf die wachsende Vielfalt der unterschiedlichen Datenquellen und Datenformate, welche verarbeitet und miteinander verkn\u00fcpft werden k\u00f6nnen. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Dabei wird zwischen strukturierten, und unstrukturierten Daten unterschieden. <\/span><span style=\"font-weight: 400;\">Strukturierte Daten sind solche, die bereits in Datenbanken vorsortiert sind und in einer bestimmten Beziehung zueinander stehen. <\/span><span style=\"font-weight: 400;\">Bei unstrukturierten Daten handelt es sich um eine reine Menge an Daten, welche in keiner Beziehung zueinander stehen. Dies sind Daten in Form von\u00a0 Text-, Audio-, Bild- und Videodateien insbesondere aus den sozialen Netzwerken wie\u00a0 Facebook, Instagram oder Twitter.\u00a0 <\/span><span style=\"font-weight: 400;\">Diese m\u00fcssen verarbeitet und miteinander verkn\u00fcpft werden, um daraus Erkenntnisse gewinnen zu k\u00f6nnen. <\/span><span style=\"font-weight: 400;\">Velocity <\/span><span style=\"font-weight: 400;\">ber\u00fccksichtigt, wie schnell die Daten ankommen und gespeichert werden und die damit verbundenen Abrufraten &#8211; dies geschieht schon jetzt teilweise in Echtzeit. <\/span><span style=\"font-weight: 400;\">Ein anschauliches Beispiel welches die Geschwindigkeit der Daten und die damit verbundenen Chancen aufzeigt ist der BlackFriday Verkauf von Macys.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Um abzuleiten, wie viele Personen sich auf Macys Parkpl\u00e4tzen am BlackFriday aufhielten wurden Standortdaten von Mobiltelefonen ausgewertet. Dadurch war es m\u00f6glich, die Verk\u00e4ufe des Einzelh\u00e4ndlers an diesem entscheidenden Tag abzusch\u00e4tzen, noch bevor Macy&#8217;s selbst diese Verk\u00e4ufe erfasst hatte. <\/span><span style=\"font-weight: 400;\">Dies kann in einer von immer schnelleren und k\u00fcrzeren Entscheidungsprozessen bestimmten Wirtschaft einen enormen Wettbewerbsvorteil schaffen.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Das urspr\u00fcngliche Modell der 3 Vs wurde in der Folgezeit um zwei weitere Vs erg\u00e4nzt &#8211; Validity und Value. <\/span><span style=\"font-weight: 400;\">Validity<\/span><span style=\"font-weight: 400;\"> bezieht sich auf die Qualit\u00e4t der Daten &#8211; je h\u00f6her die Datenqualit\u00e4t, im Sinne von Richtigkeit und Vertrauensw\u00fcrdigkeit ist, desto solider ist das Berechnungsergebnis. Somit ist erfolgsentscheidend, die zugrundeliegenden Daten vor ihrer Berechnung von Verunreinigungen zu befreien. Damit sind Daten ohne informativen Mehrwert, unvollst\u00e4ndige, besch\u00e4digte oder sortenfremde Daten gemeint. <\/span><span style=\"font-weight: 400;\">Value<\/span><span style=\"font-weight: 400;\"> steht f\u00fcr die Verwertbarkeit der mit Big Data erschlossenen Daten f\u00fcr den jeweiligen Nutzer, welche je nach Einsatzgebiet variiert.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Somit ist \u201cBig Data\u201d im Sinne der \u201c5 Vs\u201d eine Sammlung von Daten, welche auf Grund ihrer Menge, Vielf\u00e4ltigkeit, Schnelligkeit und Qualit\u00e4t einen Wert f\u00fcr den jeweiligen Nutzer schafft.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Da wir nun wissen was unter dem Begriff \u201cBig Data\u201d zu verstehen ist, schlie\u00dft sich selbstverst\u00e4ndlich die Frage an, wie \u201cBig Data\u201d denn genutzt werden kann. Dies wird das Thema in unserem n\u00e4chsten Glossary-Artikel sein.<\/span><\/p>","protected":false},"excerpt":{"rendered":"<p>Was ist Big Data? \u201cDaten als das neue \u00d6l\u201d und schon wieder neue Rekordstrafen gegen die \u201cDatenkraken\u201d &#8211; Daten sind in aller Munde, insbesondere der Begriff \u2018Big Data\u2019. Doch was ist \u201cBig Data\u201d eigentlich? Um sich der Definition von Big Data in strukturierte Weise anzun\u00e4hern, wurde das Modell der \u201c3 Vs\u201d &#8211; Volume, Variety und [&hellip;]<\/p>","protected":false},"author":17,"featured_media":2666,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_lmt_disableupdate":"","_lmt_disable":"","footnotes":""},"categories":[50,76],"tags":[77],"class_list":["post-2527","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-magazin","category-glossary","tag-big-data"],"acf":[],"modified_by":"Gionatan Sole","_links":{"self":[{"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/posts\/2527","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/users\/17"}],"replies":[{"embeddable":true,"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/comments?post=2527"}],"version-history":[{"count":2,"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/posts\/2527\/revisions"}],"predecessor-version":[{"id":2553,"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/posts\/2527\/revisions\/2553"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/media\/2666"}],"wp:attachment":[{"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/media?parent=2527"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/categories?post=2527"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/recode.law\/en\/wp-json\/wp\/v2\/tags?post=2527"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}