{"id":498,"date":"2020-03-10T08:00:26","date_gmt":"2020-03-10T07:00:26","guid":{"rendered":"https:\/\/www.claravista.ai\/blog\/?p=498"},"modified":"2020-03-09T14:13:23","modified_gmt":"2020-03-09T13:13:23","slug":"le-mot-de-la-semaine-hadoop-spark","status":"publish","type":"post","link":"https:\/\/www.claravista.ai\/blog\/2020\/03\/10\/le-mot-de-la-semaine-hadoop-spark\/","title":{"rendered":"Le Mot de la Semaine \u2013 Hadoop &#038; Spark"},"content":{"rendered":"<div class=\"pt-1\"><p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-medium wp-image-503\" src=\"https:\/\/www.claravista.ai\/blog\/wp-content\/uploads\/2020\/03\/Le-mot-de-la-semaine-7-300x169.png\" alt=\"\" width=\"300\" height=\"169\" srcset=\"https:\/\/www.claravista.ai\/blog\/wp-content\/uploads\/2020\/03\/Le-mot-de-la-semaine-7-300x169.png 300w, https:\/\/www.claravista.ai\/blog\/wp-content\/uploads\/2020\/03\/Le-mot-de-la-semaine-7.png 560w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\r\n<p style=\"font-weight: 400;\"><span style=\"font-family: helvetica, arial, sans-serif;\">Chaque m\u00e9tier poss\u00e8de son jargon. Cette r\u00e9alit\u00e9 semble \u00eatre une \u00e9vidence, mais peut cr\u00e9er parfois des surprises\u2026<em>\u00a0<\/em>Chez\u00a0<strong>ClaraVista<\/strong>, les data-scientists c\u00f4toient les consultants en strat\u00e9gie marketing, les professionnels de l\u2019exp\u00e9rience et les d\u00e9veloppeurs en Intelligence Artificielle. Gr\u00e2ce au\u00a0<a href=\"https:\/\/www.claravista.ai\/blog\/2020\/01\/21\/le-mot-de-la-semaine-edge-effect\/\"><strong><span style=\"color: #fa7575;\"><em>Edge Effect<\/em><\/span><\/strong><\/a>, cette collaboration entre plusieurs univers est source d\u2019infinie richesse\u00a0; mais elle n\u00e9cessite que tout le monde \u00ab\u00a0parle la m\u00eame langue\u00a0\u00bb et comprenne les besoins et outils de chacun.<\/span><\/p>\r\n<p style=\"font-weight: 400;\"><span style=\"font-family: helvetica, arial, sans-serif;\"><strong>ClaraVista<\/strong> accompagne quotidiennement clients et prospects dans la d\u00e9couverte de\u00a0ce vocabulaire\u00a0et vous propose une s\u00e9rie d\u2019articles expliquant les termes employ\u00e9s couramment dans nos m\u00e9tiers.<\/span><\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\"><span style=\"color: #f76a6a;\"><strong>Hadoop &amp; Spark <\/strong><\/span>sont\u00a0deux outils utilis\u00e9s pour traiter de gros volumes de donn\u00e9es.<\/span><\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\">En effet, lorsque les volumes sont tr\u00e8s importants, les donn\u00e9es peuvent \u00eatre trop grandes pour \u00eatre stock\u00e9es sur un seul ordinateur, et leur traitement peut prendre trop de temps, l\u00e0 encore \u00e0 cause du volume d\u2019informations \u00e0 traiter. Pour rem\u00e9dier \u00e0 ces probl\u00e8mes, on utilise un groupe de plusieurs machines, pour r\u00e9partir les donn\u00e9es et les calculs entre les diff\u00e9rentes machines.<\/span><\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\">Pour mieux les stocker, les fichiers sont fractionn\u00e9s en blocs et r\u00e9partis entre diff\u00e9rentes machines. <span style=\"color: #f76a6a;\"><strong>Hadoop<\/strong> <\/span>est une infrastructure logicielle destin\u00e9e \u00e0 faciliter la gestion de ce stockage.<\/span><\/p>\r\n<p><span style=\"font-family: helvetica, arial, sans-serif;\">Quant aux calculs, ils peuvent \u00eatre effectu\u00e9s s\u00e9par\u00e9ment sur chaque partie des donn\u00e9es. Pour cela, on utilise <span style=\"color: #f76a6a;\"><strong>Spark<\/strong><\/span>, un outil de traitement de donn\u00e9es distribu\u00e9es. Capable de distribuer les traitements entre les diff\u00e9rentes machines, l\u2019outil permet aussi de regrouper les r\u00e9sultats obtenus sur chaque partie des donn\u00e9es.<\/span><\/p><\/div>","protected":false},"excerpt":{"rendered":"<p>Chaque m\u00e9tier poss\u00e8de son jargon. Cette r\u00e9alit\u00e9 semble \u00eatre une \u00e9vidence, mais peut cr\u00e9er parfois des surprises\u2026\u00a0Chez\u00a0ClaraVista, les data-scientists c\u00f4toient les consultants en strat\u00e9gie marketing, les professionnels de l\u2019exp\u00e9rience et les d\u00e9veloppeurs en Intelligence Artificielle. Gr\u00e2ce au\u00a0Edge Effect, cette collaboration entre plusieurs univers est source d\u2019infinie richesse\u00a0; mais elle n\u00e9cessite que tout le monde \u00ab\u00a0parle <a class=\"more-link small\" href=\"https:\/\/www.claravista.ai\/blog\/2020\/03\/10\/le-mot-de-la-semaine-hadoop-spark\/\">[lire la suite]<\/a><\/p>\n","protected":false},"author":11,"featured_media":503,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post\/498"}],"collection":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post"}],"about":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/users\/11"}],"replies":[{"embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/comments?post=498"}],"version-history":[{"count":4,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post\/498\/revisions"}],"predecessor-version":[{"id":510,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/post\/498\/revisions\/510"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/media\/503"}],"wp:attachment":[{"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/media?parent=498"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/categories?post=498"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.claravista.ai\/blog\/wp-json\/wp\/v2\/tags?post=498"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}