{"id":469,"date":"2020-02-18T08:00:28","date_gmt":"2020-02-18T07:00:28","guid":{"rendered":"https:\/\/www.claravista.ai\/blog\/?p=469"},"modified":"2020-02-20T09:44:36","modified_gmt":"2020-02-20T08:44:36","slug":"le-mot-de-la-semaine-datalake-datamart-datawarehouse","status":"publish","type":"post","link":"https:\/\/www.claravista.ai\/blog\/2020\/02\/18\/le-mot-de-la-semaine-datalake-datamart-datawarehouse\/","title":{"rendered":"Le Mot de la Semaine \u2013 DataLake, Datamart &#038; DataWarehouse"},"content":{"rendered":"<div class=\"pt-1\"><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-medium wp-image-473\" src=\"https:\/\/www.claravista.ai\/blog\/wp-content\/uploads\/2020\/02\/Le-mot-de-la-semaine-5-300x169.png\" alt=\"\" width=\"300\" height=\"169\" srcset=\"https:\/\/www.claravista.ai\/blog\/wp-content\/uploads\/2020\/02\/Le-mot-de-la-semaine-5-300x169.png 300w, https:\/\/www.claravista.ai\/blog\/wp-content\/uploads\/2020\/02\/Le-mot-de-la-semaine-5.png 560w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\r\n<p>&nbsp;<\/p>\r\n<p style=\"font-weight: 400;\"><span style=\"font-family: helvetica, arial, sans-serif;\">Chaque m\u00e9tier poss\u00e8de son jargon. Cette r\u00e9alit\u00e9 semble \u00eatre une \u00e9vidence, mais peut cr\u00e9er parfois des surprises\u2026<em>\u00a0<\/em>Chez\u00a0<strong>ClaraVista<\/strong>, les data-scientists c\u00f4toient les consultants en strat\u00e9gie marketing, les professionnels de l\u2019exp\u00e9rience et les d\u00e9veloppeurs en Intelligence Artificielle. Gr\u00e2ce au\u00a0<a href=\"https:\/\/www.claravista.ai\/blog\/2020\/01\/21\/le-mot-de-la-semaine-edge-effect\/\"><strong><span style=\"color: #fa7575;\"><em>Edge Effect<\/em><\/span><\/strong><\/a>, cette collaboration entre plusieurs univers est source d\u2019infinie richesse\u00a0; mais elle n\u00e9cessite que tout le monde \u00ab\u00a0parle la m\u00eame langue\u00a0\u00bb et comprenne les besoins et outils de chacun.<\/span><\/p>\r\n<p style=\"font-weight: 400;\"><span style=\"font-family: helvetica, arial, sans-serif;\"><strong>ClaraVista<\/strong> accompagne quotidiennement clients et prospects dans la d\u00e9couverte de\u00a0ce vocabulaire\u00a0et vous propose une s\u00e9rie d\u2019articles expliquant les termes employ\u00e9s couramment dans nos m\u00e9tiers.<\/span><\/p>\r\n<p>&nbsp;<\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\"><span style=\"color: #e36464;\"><em><strong>DataLake<\/strong><\/em><\/span> (litt\u00e9ralement \u00ab\u00a0lac de donn\u00e9es\u00a0\u00bb) <span style=\"color: #e36464;\"><em><strong>DataWarehouse<\/strong><\/em><\/span> (litt\u00e9ralement \u00ab\u00a0entrep\u00f4t de donn\u00e9es\u00a0\u00bb) et <em><span style=\"color: #e36464;\"><strong>DataMart<\/strong><\/span><\/em> sont des outils de stockage de donn\u00e9es.<\/span><\/p>\r\n<p>&nbsp;<\/p>\r\n<p><span style=\"color: #de6464; font-size: 18pt;\"><em><span style=\"font-family: helvetica, arial, sans-serif;\"><span style=\"color: #000000;\">Un\u00a0<\/span><strong>DataLake<\/strong> <\/span><\/em><\/span><\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\">vise \u00e0 stocker l\u2019int\u00e9gralit\u00e9 des donn\u00e9es d\u2019une entreprise - structur\u00e9es ou non - sans pr\u00e9sumer de leur utilisation future. Les donn\u00e9es stock\u00e9es dans un <em><span style=\"color: #e36464;\"><strong>DataLake<\/strong><\/span><\/em> ne sont pas nettoy\u00e9es ou agr\u00e9g\u00e9es (ou tr\u00e8s peu). Elles seront structur\u00e9es, agr\u00e9g\u00e9es, nettoy\u00e9es lors de leur utilisation, en fonction de l'usage que l'on veut alors en faire.<\/span><\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\">Un des usages les plus courant du <span style=\"color: #e36464;\"><em><strong>DataLake<\/strong><\/em><\/span> est de rendre les donn\u00e9es accessibles aux data scientists de l'entreprise, qui pourront ensuite les utiliser pour \u00e9tablir des mod\u00e8les ou des analyses. Si les <span style=\"color: #e36464;\"><strong><em>DataLake<\/em><\/strong><\/span>, mettent \u00e0 disposition des informations plus exhaustives que d\u2019autres outils de stockage de donn\u00e9es, il n\u00e9cessite un travail pr\u00e9alable de structuration des donn\u00e9es important.<\/span><\/p>\r\n<p>&nbsp;<\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif; font-size: 18pt;\"><span style=\"color: #000000;\"><em>Une<\/em><\/span><strong><span style=\"color: #e36464;\"><em> DataWarehouse<\/em><\/span><\/strong> <\/span><\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\">stocke des donn\u00e9es nettoy\u00e9es, ordonn\u00e9es, agr\u00e9g\u00e9es. Ces donn\u00e9es peuvent \u00e9ventuellement servir \u00e0 un data scientist pour qu'il cr\u00e9e des mod\u00e8les, mais ont plus souvent vocation \u00e0 alimenter un syst\u00e8me d'information d\u00e9di\u00e9 au reporting.<\/span><\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\">Les <span style=\"color: #e36464;\"><strong><em>DataWarehouse<\/em><\/strong><\/span> sont rarement exhaustives, car structurer l\u2019ensemble des informations collect\u00e9es et\/ou g\u00e9n\u00e9r\u00e9es par une entreprise est un processus souvent lourd et co\u00fbteux.\u00a0Il faut donc faire des choix en mati\u00e8re d\u2019informations stock\u00e9es. L\u2019agr\u00e9gation de donn\u00e9es et leur traitement cause par ailleurs une perte d\u2019informations in\u00e9vitable. Ce type de base de donn\u00e9es ne permet donc que rarement de r\u00e9pondre \u00e0 une question pointue, car des informations utiles sont manquantes. \u00a0Elle reste par contre parfaitement exploitable pour identifier des tendances globales, et simplifie grandement l\u2019exploration des \u00e9quipes op\u00e9rationnelles.<\/span><\/p>\r\n<p>&nbsp;<\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif; font-size: 18pt;\"><em>Un<\/em> <span style=\"color: #e36464;\"><em><strong>DataMart<\/strong><\/em><\/span><\/span><\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\">stocke des donn\u00e9es structur\u00e9es, \u00e0 l\u2019image d\u2019une <span style=\"color: #e36464;\"><strong><em>DataWarehouse<\/em><\/strong><\/span>. Ils ne sont pas pour autant tout \u00e0 fait \u00e9quivalents. L\u00e0 o\u00f9 les <span style=\"color: #e36464;\"><strong><em>DataWarehouse<\/em><\/strong><\/span> structurent des donn\u00e9es pour l'ensemble des m\u00e9tiers de l'entreprise (logistique, marketing\u2026), le <span style=\"color: #e36464;\"><em><strong>DataMart<\/strong><\/em><\/span> est d\u00e9di\u00e9 \u00e0 une utilisation pr\u00e9cise comme la gestion de la relation client.<\/span><\/p><\/div>","protected":false},"excerpt":{"rendered":"<p>&nbsp; Chaque m\u00e9tier poss\u00e8de son jargon. Cette r\u00e9alit\u00e9 semble \u00eatre une \u00e9vidence, mais peut cr\u00e9er parfois des surprises\u2026\u00a0Chez\u00a0ClaraVista, les data-scientists c\u00f4toient les consultants en strat\u00e9gie marketing, les professionnels de l\u2019exp\u00e9rience et les d\u00e9veloppeurs en Intelligence Artificielle. Gr\u00e2ce au\u00a0Edge Effect, cette collaboration entre plusieurs univers est source d\u2019infinie richesse\u00a0; mais elle n\u00e9cessite que tout le monde <a class=\"more-link small\" href=\"https:\/\/www.claravista.ai\/blog\/2020\/02\/18\/le-mot-de-la-semaine-datalake-datamart-datawarehouse\/\">[lire la suite]<\/a><\/p>\n","protected":false},"author":11,"featured_media":473,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[70],"tags":[45,11,14,73,74],"_links":{"self":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post\/469"}],"collection":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post"}],"about":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/users\/11"}],"replies":[{"embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/comments?post=469"}],"version-history":[{"count":5,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post\/469\/revisions"}],"predecessor-version":[{"id":476,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post\/469\/revisions\/476"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/media\/473"}],"wp:attachment":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/media?parent=469"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/categories?post=469"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/tags?post=469"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}