{"id":27,"date":"2018-03-29T15:37:10","date_gmt":"2018-03-29T13:37:10","guid":{"rendered":"http:\/\/www.claravista.fr\/blog\/?p=27"},"modified":"2018-07-13T16:19:24","modified_gmt":"2018-07-13T14:19:24","slug":"glossaire-d-comme-datalake","status":"publish","type":"post","link":"https:\/\/www.claravista.ai\/blog\/2018\/03\/29\/glossaire-d-comme-datalake\/","title":{"rendered":"Glossaire : Datalake"},"content":{"rendered":"<div class=\"pt-1\">\t\t<div class=\"elementor elementor-27\">\n\t\t\t<div class=\"elementor-inner\">\n\t\t\t\t<div class=\"elementor-section-wrap\">\n\t\t\t\t\t\t\t<section data-id=\"c534bce\" class=\"elementor-element elementor-element-c534bce elementor-section-boxed elementor-section-height-default elementor-section-height-default elementor-section elementor-top-section\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t<div class=\"elementor-row\">\n\t\t\t\t<div data-id=\"4918899\" class=\"elementor-element elementor-element-4918899 elementor-column elementor-col-100 elementor-top-column\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-column-wrap elementor-element-populated\">\n\t\t\t\t\t<div class=\"elementor-widget-wrap\">\n\t\t\t\t<div data-id=\"62db5ab\" class=\"elementor-element elementor-element-62db5ab elementor-widget elementor-widget-text-editor\" data-element_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-text-editor elementor-clearfix\"><h1>Qu&rsquo;est-ce qu&rsquo;un Datalake ?<\/h1>\n<p>On en entend parler de la data du lac comme autrefois du monstre du Loch Ness. L&rsquo;existence de cette cr\u00e9ature-ci &#8211; le datalake &#8211; est bien av\u00e9r\u00e9e et nous en d\u00e9mystifions la teneur.<\/p>\n<h4 style=\"color: #3b3b3b;\"><em>Structure<\/em><\/h4>\n<p>Un datalake permet de stocker une tr\u00e8s grande quantit\u00e9 de donn\u00e9es brutes dans leur format d\u2019origine. Cette absence de contrainte d\u2019harmonisation permet une grande flexibilit\u00e9 : tous types de donn\u00e9es peuvent \u00eatre agr\u00e9g\u00e9s en temps r\u00e9el sans traitement.<\/p>\n<h4 style=\"color: #3b3b3b;\"><em>Exploitation<\/em><\/h4>\n<p>Le datalake permet ensuite d\u2019effectuer des analyses \u00e0 grande \u00e9chelle qui recoupent de nombreux \u00e9l\u00e9ments de sources diverses. L\u2019absence de limite de quantit\u00e9 et la multiplicit\u00e9 des formats peuvent cependant rendre cette caverne d\u2019Ali Baba fort obscure. L\u2019utilisateur qui veut exploiter les donn\u00e9es du datalake doit donc identifier clairement ses besoins. Il saura alors quoi sourcer et comment en faire sens. Le datalake\u00a0permet \u00e9galement de faire progresser le Machine Learning puisque les algorithmes pr\u00e9dictifs s\u2019affinent en continu \u00e0 mesure qu\u2019ils consomment de la donn\u00e9e : de la r\u00e9currence naissent des sch\u00e9mas.<\/p>\n<h4 style=\"color: #3b3b3b;\"><em>Le mot de ClaraVista<\/em><\/h4>\n<p>Si un datalake permet une grande flexibilit\u00e9, il doit imp\u00e9rativement \u00eatre con\u00e7u avec rigueur pour \u00eatre exploitable. Une indexation pr\u00e9cise des donn\u00e9es de toute forme int\u00e9gr\u00e9es au fil de l&rsquo;eau est ainsi incontournable.<\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section data-id=\"846528d\" class=\"elementor-element elementor-element-846528d elementor-section-boxed elementor-section-height-default elementor-section-height-default elementor-section elementor-top-section\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t<div class=\"elementor-row\">\n\t\t\t\t<div data-id=\"cec9881\" class=\"elementor-element elementor-element-cec9881 elementor-column elementor-col-100 elementor-top-column\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-column-wrap\">\n\t\t\t\t\t<div class=\"elementor-widget-wrap\">\n\t\t\t\t\t\t<\/div>\n\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t\t\t<\/div>\n\t\t\t<\/div>\n\t\t<\/div>\n\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>Qu'est-ce qu'un Datalake ? On en entend parler de la data du lac comme autrefois du monstre du Loch Ness. L'existence de cette cr\u00e9ature-ci - le datalake - est bien av\u00e9r\u00e9e et nous en d\u00e9mystifions la teneur. Structure Un datalake permet de stocker une tr\u00e8s grande quantit\u00e9 de donn\u00e9es brutes dans leur format d\u2019origine. Cette <a class=\"more-link small\" href=\"https:\/\/www.claravista.ai\/blog\/2018\/03\/29\/glossaire-d-comme-datalake\/\">[lire la suite]<\/a><\/p>\n","protected":false},"author":11,"featured_media":41,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[10],"tags":[13,11,12],"_links":{"self":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post\/27"}],"collection":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post"}],"about":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/users\/11"}],"replies":[{"embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/comments?post=27"}],"version-history":[{"count":23,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post\/27\/revisions"}],"predecessor-version":[{"id":348,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post\/27\/revisions\/348"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/media\/41"}],"wp:attachment":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/media?parent=27"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/categories?post=27"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/tags?post=27"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}