ao vivo
Data Analytics Bootcamp
Módulo único
Aprenda na prática e de forma intensiva a fazer a Análise de Dados com Python
Objetivo do curso
Apresentar de forma prática os principais conceitos que são necessários para se trabalhar com dados utilizando a linguagem Python. O curso percorre todo o fluxo dos dados, desde os principais conceitos de programação com Python e como utiliza-los para realizar análises dos dados, depois vendo as diversas formas de extrair e preparar o dado, finalizando com as diversas formas de visualização dos dados (dataviz), com isto valorizando os seus resultados. Para tornar o profissional mais capacitado, o curso também possui um módulo de SQL para análise de dados, assim apresentando o tipo de banco de dados mais utilizado no mundo.
Estará apto a:Utilizar a principal e mais completa linguagem de programação para se trabalhar com dados: Python. Sabendo como extrair e preparar os dados, como realizar análises de dados obtidos e quais os principais tipos de análises que podem ser feitas, também conhecerá e saberá como e quando utilizar os principais gráficos disponíveis para a análise de dados, assim valorizando os seus resultados. Por fim irá ver os principais comandos para trabalhar com a linguagem SQL, utilizada em bancos de dados relacionais.
Público Alvo:Profissionais e estudantes de todas as áreas que queiram conhecer Data Analytics e descobrir formas de extrair, analisar e apresentar os resultados obtidos.
SalárioA média salarial nacional de um Data Analyst depende do nivel de conhecimento do profissional. Podendo variar em um salário de R$ 5.984/mês a R$ 8.298/mês.
Revisão de Fundamentos de Python
Criação de variáveis;
Tipos de variáveis;
Listas;
Tuplas;
If-else;
Laços.
Introdução ao shell IPython e Jupyter Notebook
Principais funcionalidades de ambas as ferramentas.
Biblioteca NumPy para cálculos numéricos
Conceito de array;
Índices;
Fatiamento de matrizes;
Operações entre arrays.
Biblioteca Pandas para análise de dados
Criação e manipulação de dataframe;
Concatenação e fusão de dataframes;
Métodos de seleção loc e iloc.
Biblioteca Matplotlib e Seaborn para criar visualizações e gráficos.
A importância de se criar bons gráficos e como utilizá-los para dar força às suas análises.
SciPy
Ferramenta de computação científica de alta performance.
Apresentar a distribuição Anaconda direcionada para análise de dados.
Aprenda a agregar todas as ferramentas para análise de dados;
Bibliotecas e recursos necessários para trabalhar com Data Science e Machine Learning;
Python, Jupyter Notebook, NumPy, Pandas e Scikit-Learn.
Armazenamento de dados
Formas de realizar carga e armazenamento de dados em vários formatos de arquivos.
Tratamento de Dados
Tratamento e manipulação de dados: princípios de data minings.
Operação de dados
Fundamentos para realizar agregação e operações em grupos de dados.
Introdução sobre séries temporais
Introdução sobre séries temporais, conversões, indexação, seleção e geração de subconjuntos.
Introdução à estatística básica
Medidas centrais;
Quartis;
Decis e como utilizá-las na análise.
Bibliotecas de modelagem de dados
Principais modelagens do Scikit-Learning.
Introdução ao ETL
Aprenda o que é Extract, Transform and Load (ETL).
Introdução a linguagem Python
Programação orientada a objetos;
Pacotes Pandas, Numpy, Scipy, Scikit-learn e Seaborn;
Trabalhe com Machine Learning.
Extração de dados na prática
Comunicação com outros sistemas ou bancos de dados para capturar os dados que serão inseridos no destino onde serão convertidos para um único formato;
Importância da transformação do dado
Correção, padronização e tratamento dos desvios e inconsistências, transformando os dados de acordo com as regras do negócio;
Operações de Qualidade de Dados.
Processo preparação de dados na prática
Os dados são trabalhados para serem transformados em informação.
Como transferir dados de diversas fontes para diversos destinos
Assim que são finalizados os tratamentos necessários nos dados, a carga no destino (um banco de dados ou arquivo CSV) é iniciada;
O processo de Load é a etapa final.
Geração de relatórios com ferramentas gráficas do Python
Realize funções de análise e gere relatórios.
Introdução
Introdução a Visualização
Quarteto de Anscombe
Exemplos bons e ruins de visualizações
Motivos para aplicar a visualização
Principais bibliotecas de visualização em Python
Tipos de visualização
Tipos de Visualização (comparativo entre diferentes tipos de dados e a visualização adequada)
Visualização com gráficos
Gráfico de Pontos
Gráfico de Barras
Gráfico de Dispersão
Gráficos de séries temporais
Mapa de calor
Gráficos de redes
Gráficos de sunburst
Gráficos estatísticos (Boxplot, Pizza)
Visualização avançada
Nuvem de palavras
Gráficos de Mapas
Gráficos interativos com Plotly
Gráficos interativos com Bokeh
Instalação e configuração do banco de dados
Instalação e Configuração do SGBD (Sistema de gerenciamento de banco de dados)
Introdução ao banco relacional
SQL (Structured Query Language ou Linguagem de Consulta Estruturada)
Diferenciar entre DDL (LInguagem de Definição de Dados) e DML (Linguagem de Manipulação de Dados)
Tipos de dados
Conceitos de tabela e relacionamento
Exercícios de fixação
DDL (Data Definition Language) - Linguagem de Definição de Dados
Base de dados
Criação de tabelas
Chave primaria
indice
Relacionamentos
Chave estrangeira
Alteração de tabelas
Exclusão de tabelas
Exercícios de fixação
DML (Data Manipulation Language) - Linguagem de Manipulação de Dados
Inclusão de dados
Atualização de dados
Exclusão de dados
DQL (Data Query Language) - Linguagem de Consulta de dados
Consultas simples
Consultas elaboradas
Join
Inner join
Outer join
Left join
Right join
Full join
Como salvar os resultados das consultas em arquivo *.CVS
Conhecimentos de lógica de programação.