{"id":4113,"date":"2020-04-27T14:37:37","date_gmt":"2020-04-27T17:37:37","guid":{"rendered":"https:\/\/help.roicommerce.com.br\/?p=4113"},"modified":"2024-04-29T08:50:20","modified_gmt":"2024-04-29T11:50:20","slug":"ferramentas-de-analise-de-dados-veja-como-elas","status":"publish","type":"post","link":"https:\/\/help.roicommerce.com.br\/index.php\/2020\/04\/27\/ferramentas-de-analise-de-dados-veja-como-elas\/","title":{"rendered":"Ferramentas de an\u00e1lise de dados: veja como elas podem ajudar!"},"content":{"rendered":"<p>Existem v\u00e1rias medidas para resumir uma vari\u00e1vel, como veremos mais adiante, mas a forma da distribui\u00e7\u00e3o \u00e9 t\u00e3o importante quanto estas medidas. Por exemplo, saber que a m\u00e9dia de sal\u00e1rios da empresa \u201cMilsa\u201d \u00e9 11.12 \u00e9 importante, mas saber como os sal\u00e1rios se distribuem entre os funcion\u00e1rios da empresa <a href=\"https:\/\/tripleten.com.br\/blog\/analise-exploratoria-de-dados-o-que-e-e-para-que-serve\/\">an\u00e1lise explorat\u00f3ria de dados<\/a> (como vimos pelo histograma) pode ser mais  importante. Nesse caso, assumimos que cada valor num\u00e9rico \u00e9 uma categoria, e constru\u00edmos as tabelas de frequ\u00eancia como se a vari\u00e1vel fosse qualitativa ordinal. Note, no entanto, que quando existem poucos valores num\u00e9ricos, essa abordagem \u00e9 vi\u00e1vel.<\/p>\n<ul>\n<li>Esta an\u00e1lise pode ser feita por meio de tabula\u00e7\u00e3o cruzada, por exemplo.<\/li>\n<li>Uma maneira de testar e ter certeza se nossa vari\u00e1vel segue uma distribui\u00e7\u00e3o normal \u00e9 utilizar os testes de normalidade.<\/li>\n<li>Aqui estamos considerando um teste para uma vari\u00e1vel categ\u00f3rica validando a independ\u00eancia do qui-quadrado (Sexo).<\/li>\n<li>Dados ordinais t\u00eam uma ordena\u00e7\u00e3o expl\u00edcita, por exemplo os 3 n\u00edveis de uma m\u00e1quina de lavar (alto, m\u00e9dio e baixo).<\/li>\n<\/ul>\n<p>No final das contas, o que se quer \u00e9 potencializar um neg\u00f3cio\u201d, explica Jo\u00e3o. Ao explorar os dados, \u00e9 poss\u00edvel observar rela\u00e7\u00f5es entre vari\u00e1veis e identificar correla\u00e7\u00f5es que podem ser \u00fateis na constru\u00e7\u00e3o de modelos preditivos. Essas informa\u00e7\u00f5es podem fornecer insights importantes para tomadas de decis\u00e3o e desenvolvimento de estrat\u00e9gias. A interpreta\u00e7\u00e3o de dados \u00e9 uma etapa crucial do processo de an\u00e1lise de dados, fornecendo descobertas relevantes e acion\u00e1veis com base em dados para informar decis\u00f5es de neg\u00f3cio. Um estudo feito pela MicroStrategy revelou que 64% das empresas utilizam dados para aprimorar a efici\u00eancia e a produtividade.<\/p>\n<h2>O que \u00e9 An\u00e1lise Explorat\u00f3ria de Dados?<\/h2>\n<p>No s\u00e9culo XXI, a an\u00e1lise de dados emergiu como um pilar fundamental na tomada de decis\u00f5es informadas, seja no \u00e2mbito dos neg\u00f3cios, na ci\u00eancia ou na pol\u00edtica. Em um mundo cada vez mais inundado por informa\u00e7\u00f5es, a an\u00e1lise de dados se destaca como uma ferramenta primordial para transformar dados brutos em insights acion\u00e1veis, impulsionando o sucesso em diversas \u00e1reas. Para ilustrar a aplica\u00e7\u00e3o destas t\u00e9cnicas de estat\u00edstica multivariada utilizamos uma tabela de composi\u00e7\u00e3o de alimentos6 que traz os teores de calorias, glic\u00eddios, prote\u00ednas, lip\u00eddios, c\u00e1lcio, f\u00f3sforo e ferro para 20 frutas. Neste caso, portanto, a matriz de dados \u00e9 representada por 7 vari\u00e1veis e 20 amostras.<\/p>\n<p>Aqui no gr\u00e1fico do sal\u00e1rio mensal, percebemos que ele n\u00e3o est\u00e1 espelhado e, portanto, h\u00e1 \u201cmovimento\u201d entre eles. A conclus\u00e3o \u00e0 qual se chega \u00e9 que essa vari\u00e1vel ajuda a separar o bom do mau pagador. Novamente, \u00e9 importante olhar o boxplot para obter outra percep\u00e7\u00e3o a respeito. Q1 nos mostra que 25% dos dados tem at\u00e9 5 linhas de cr\u00e9dito em aberto e o restante (75%) tem uma quantidade superior. O EDA Local \u00e9 uma sistem\u00e1tica que permite pressupor a HIST\u00d3RIA DOS DADOS, sem depender de um dicion\u00e1rio de dados, conectando fatos ou situa\u00e7\u00f5es. Essa t\u00e9cnica permite levantar hip\u00f3teses e perguntas que dever\u00e3o ser sanadas junto \u00e0 \u00c1rea de Dados ou \u00e0 \u00c1rea de Neg\u00f3cios da empresa e, desta maneira, ter a compreens\u00e3o verdadeira da HIST\u00d3RIA DOS DADOS.<\/p>\n<h2>Compreendendo Dados<\/h2>\n<p>As tabelas de frequ\u00eancias s\u00e3o obtidas de forma semelhante \u00e0 mostrada anteriormente. A frequ\u00eancia absoluta \u00e9 a contagem do n\u00famero de vezes que cada categoria foi observada. Note que aqui, a ordem tem import\u00e2ncia, portanto, a tabela tamb\u00e9m deve seguir a ordem natural das categorias. Abaixo, mostramos a tabela de frequ\u00eancia absoluta j\u00e1 com o somat\u00f3rio de todas as classes.<\/p>\n<div style='text-align:center'><iframe width='562' height='319' src='https:\/\/www.youtube.com\/embed\/poNtfi3hUys' frameborder='0' alt='an\u00e1lise explorat\u00f3ria de dados' allowfullscreen><\/iframe><\/div>\n<p>Doutor em Engenharia da Computa\u00e7\u00e3o pela Universidade de S\u00e3o Paulo (USP). Gradua\u00e7\u00e3o e mestrado em  ci\u00eancia da computa\u00e7\u00e3o com \u00eanfase em intelig\u00eancia artificial. Mais de 10 anos de experi\u00eancia no mercado de tecnologia da informa\u00e7\u00e3o e computa\u00e7\u00e3o de alto desempenho. Assim, voc\u00ea unifica toda sua base de dados (de seus sistemas <a href=\"https:\/\/tripleten.com.br\/\">https:\/\/tripleten.com.br\/<\/a> principais e complementares) em uma s\u00f3 plataforma, centralizando os diferentes tipos de an\u00e1lise e contando com recursos inovadores. O sucesso da coleta e an\u00e1lise de dados est\u00e1 associado ao uso de ferramentas modernas e completas, capazes de buscar as informa\u00e7\u00f5es, gerar relat\u00f3rios e facilitar a interpreta\u00e7\u00e3o dos dados.<\/p>\n<h2>Import\u00e2ncia da interpreta\u00e7\u00e3o de dados<\/h2>\n<p>Utiliza t\u00e9cnicas estat\u00edsticas e hist\u00f3ricas, com o objetivo de auxiliar na tomada de decis\u00f5es. Essa an\u00e1lise \u00e9 aplicada para prever o comportamento do p\u00fablico-alvo e tend\u00eancias de mercado, al\u00e9m de acompanhar varia\u00e7\u00f5es econ\u00f4micas e tend\u00eancias de consumo. \u00c9 importante refor\u00e7ar que, nesse processo, \u00e9 necess\u00e1rio coletar dados relevantes para an\u00e1lise, sejam eles quantitativos ou qualitativos, e garantir a qualidade e precis\u00e3o dos dados. Afinal, a qualidade dos dados impactar\u00e1 diretamente na interpreta\u00e7\u00e3o dos resultados e na extra\u00e7\u00e3o de insights valiosos. Assim, os objetivos da an\u00e1lise devem ser claros e bem constru\u00eddos para que os resultados sejam mais alinhados e relevantes para a tomada de decis\u00e3o do neg\u00f3cio.<\/p>\n<ul>\n<li>Imagine que voc\u00ea tem um conjunto de dados onde se tem a lista das notas dos estudantes de um curso e voc\u00ea quer resumir em um \u00fanico n\u00famero a nota da sala.<\/li>\n<li>Alguns modelos, como os da TOTVS, j\u00e1 se integram ao que h\u00e1 de novo em Intelig\u00eancia Artificial e Business Intelligence.<\/li>\n<li>Conhecida como uma fun\u00e7\u00e3o de distribui\u00e7\u00e3o cumulativa emp\u00edrica e uma fun\u00e7\u00e3o de distribui\u00e7\u00e3o cumulativa (Cumulative Distribution Function -CDF) s\u00e3o basicamente a mesma coisa.<\/li>\n<li>Utilize gr\u00e1ficos adequados para cada tipo de vari\u00e1vel e explore diferentes perspectivas dos dados.<\/li>\n<\/ul>\n<p>Para uma empresa financeira, por exemplo, pode ajudar a simplificar a an\u00e1lise de cr\u00e9dito de seus clientes, automatizando a libera\u00e7\u00e3o do mesmo de acordo com crit\u00e9rios e fatores de risco pr\u00e9-estabelecidos. Assim, por memio da an\u00e1lise e em conjunto com metodologias como o Business Intelligence, \u00e9 poss\u00edvel resolver problemas e desafios espec\u00edficos dentro da organiza\u00e7\u00e3o. Inclusive, de acordo com relat\u00f3rio recente da Forrester, organiza\u00e7\u00f5es data-driven (orientadas por dados) podem crescer mais de 30% ao ano.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Existem v\u00e1rias medidas para resumir uma vari\u00e1vel, como veremos mais adiante, mas a forma da distribui\u00e7\u00e3o \u00e9 t\u00e3o importante quanto estas medidas. Por exemplo, saber que a m\u00e9dia de sal\u00e1rios da empresa \u201cMilsa\u201d \u00e9 11.12 \u00e9 importante, mas saber como os sal\u00e1rios se distribuem entre os funcion\u00e1rios da empresa an\u00e1lise explorat\u00f3ria de dados (como vimos [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[334],"tags":[],"_links":{"self":[{"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/posts\/4113"}],"collection":[{"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/comments?post=4113"}],"version-history":[{"count":1,"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/posts\/4113\/revisions"}],"predecessor-version":[{"id":4114,"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/posts\/4113\/revisions\/4114"}],"wp:attachment":[{"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/media?parent=4113"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/categories?post=4113"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/help.roicommerce.com.br\/index.php\/wp-json\/wp\/v2\/tags?post=4113"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}