Modelação e Análise de Dados com R

Análise de dados com ferramentas de acesso aberto: R, RStudio, Jupyter Notebooks e JupyterLab

Formato: Online via Cisco Webex

DATA

A Anunciar

Horário

18h às 20h30 – Portugal
15h às 17h30 – Brasília

Duração: 20h | 5h Cada Módulo

LOCAL

Online via Cisco Webex

PREÇO

340€

descrição

Depois do sucesso do curso Data Analysis School, temos o prazer de anunciar o curso: Modelação e Análise de Dados com R.

Os cursos são ministrados de forma interativa, utilizando teoria, demonstrações práticas e exercícios. Os cursos serão ministrados em R, RStudio, Jupyter Notebooks e JupyterLab.

Os cursos destinam-se a investigadores académicos, incluindo alunos de mestrado/doutoramento, que possuam conhecimentos básicos de estatística e econometria e que lidem com diversos tipos de dados e projetos no seu dia-a-dia de trabalho.

O curso também é recomendado para não académicos, com interesse na análise de dados numa perspetiva econométrica. Os profissionais interessados ​​em aprender diferentes técnicas e aumentar o seu conhecimento sobre possíveis metodologias que podem ser utilizadas nos seus projetos, atuais ou futuros, serão muito beneficiados com este curso.

Os formadores têm ampla experiência no ensino de estatística, economia e econometria aplicada. Os participantes deste curso são incentivados a trazer questões das suas investigações, beneficiando da ampla colaboração dos formadores, que possuem uma vasta experiência com diferentes investigadores, de vários países, assim como experiência de colaboração com alunos de pós-graduação.

FORMADORES

Miguel Portela

Doutorado em Economia pela Universidade de Amesterdão (2007). Atualmente é Professor Associado com Agregação da Universidade do Minho e diretor do Programa de Doutoramento em Economia. É, igualmente, afiliado do NIPE / U Minho, CIPES / U Porto e IZA, Bona. Tem em curso uma colaboração com o Banco de Portugal. Os seus interesses de investigação centram-se nas áreas de Economia do Trabalho e da Educação e Econometria Aplicada. Tem diversos artigos científicos publicados em revistas de referência, incluindo Econometrica, Scandinavian Journal of Economics e Regional Studies. Tem em curso colaborações com equipas de investigação internacionais, lidera equipas investigação, tendo elaborado relatórios de apoio à elaboração de políticas públicas sobre salário mínimo, educação e emprego no mercado de trabalho português. Tem, adicionalmente, experiência de consultoria, tanto para instituições públicas, como para o setor privado, incluindo Microsoft, Associação Portuguesa de Seguradores, Ministério da Economia e Organização Internacional Trabalho (OIT).

Nelson Areal

Professor Associado de Finanças na Escola de Economia e Gestão do Departamento de Gestão da Universidade do Minho. Os seus interesses de investigação incluem medição e previsão de risco, avaliação de opções usando métodos numéricos, medição de desempenho, investimentos socialmente responsáveis ​​e educação de gestão. Possui um PhD em Contabilidade e Finanças (Lancaster University, 2006; título da tese “Essays on FTSE-100 volatility and options valuation”); Mestre em Administração de Empresas com especialização em Finanças Empresariais (Universidade do Minho, 1998); Licenciatura em Gestão pela Universidade do Minho (1992). A sua carreira também inclui dois anos (1992-1994) como Auditor de Sistemas de Informação na Ernst & Young. Co.

Rita Sousa

Doutorada em Estatística e Gestão de Risco pela Universidade Nova de Lisboa. É Analista de Dados Sénior no Laboratório de Investigação de Microdados (BPLIM), Departamento de Economia e Investigação, do Banco de Portugal, desde 2015. Tem 15 anos de experiência como Metodóloga no Departamento de Metodologia e Sistemas de Informação do INE, de 2000 a 2015. Foi Professora Auxiliar Convidada na Universidade do Porto durante mais de 10 anos. Tem também experiência como Instrutora em Software Estatístico. Os seus interesses de investigação são Amostragem, Análise de Grandes Conjuntos de Dados, Controlo de Divulgação Estatística e Estimativa de Variáveis ​​Sensíveis.

Recursos Disponibilizados

– Link para instalação do R e RStudio
– Certificado GADES Solutions e DGERT
– Gravações das Sessões do Curso
– Slides e material demonstrado no decorrer do curso, em formato digital

Programa

Módulo 0: Instalação e Configuração

Neste módulo será realizada uma primeira visão geral sobre as ferramentas a utilizar no decorrer do curso.

Módulo 1: Introdução ao R

O objetivo deste módulo é fornecer uma introdução ao R, permitindo aos participantes adquirirem os alicerces para os módulos subsequentes através da aprendizagem dos fundamentos da linguagem R.

Começaremos com o R base e suas estruturas de dados fundamentais. Serão apresentadas as noções básicas de manipulação de dados retangulares (a saber: selecionar, modificar, filtrar, e agregar dados) utilizando o R base.

> Programa:

  1. R, o que é, e por que você deve considerar utilizá-lo.
  2. RStudio IDE.
  3. Introdução ao R base:
    • Operações matemáticas; comparações; funções em R; consulta e utilização da ajuda.
    • Estruturas básicas de dados em R: vetores, matrizes, listas e “data frames”.
    • Pacotes em R e gestão de pacotes.
    • Manipulação de dados com R base (selecionar, modificar, filtrar, e agregar dados).
    • Fórmulas de modelos em R (aplicação ao modelo de regressão simples).

Módulo 2: Otimização de Fluxo de Análise de Dados e da Sua Partilha: Literate Programming e Jupyter Notebooks

‘Literate Programming’ trata-se de fusão de uma narrativa descritiva com um código de computador num único documento, a partir do qual tanto a documentação legível por humanos, quanto os arquivos legíveis por computador, podem ser criados. Este conceito permite, de forma particularmente eficiente, apresentar o trabalho de forma transparente, com uma enorme facilidade de manutenção, atualização e replicação. Deste modo, permite economizar tempo e esforço, permitindo dedicar mais tempo à análise dos dados. ‘Literate Programming’ tem aplicação, não só no mundo académico, quer ao nível da investigação, quer na componente da educação, mas também no mundo empresarial.

Um ‘Jupyter Notebook’ é um ambiente de computação interativo, orientado para a exploração dinâmica de dados, que permite criar e partilhar documentos que contêm código ativo, equações, visualizações, entre outros. O código e os resultados associados a cada projeto são integrados num único documento. Constitui, atualmente, a ferramenta de eleição entre a comunidade de analistas de dados para a realização de limpeza e transformação de dados, simulação numérica, modelação estatística, visualização de dados ou ‘Machine Learning’.

> Programa:

  1. ‘Markdown’ e ‘Pandoc’.
  2. Desenvolvimento de um modelo de análise de dados em R utilizando ‘notebooks’.
  3. Elaboração de documentos em ‘RMarkdown’.
  4. Execução de ‘notebooks’ na ‘cloud’: Binder, Google Colab, Kaggle Kernels
  5. Produção e publicação de relatórios.

Módulo 3: Big Data: Preparação e Análise de Dados Exploratórios

A Análise Exploratória de Dados ajuda um analista a entender conjuntos de dados complexos e responder a perguntas de investigação, utilizando diversas técnicas de sumarização numérica e gráfica. Este módulo mostra como explorar e preparar os seus dados, utilizando a linguagem de programação R. Veremos ferramentas e exemplos de boas práticas no acesso e manipulação de dados, com recurso a packages como o ‘tidyverse’, abordando os desafios mais comuns enfrentados ao lidar com ‘Big Data’.

> Programa:

  1. Principais conceitos ‘Big Data’.
  2. Importação de conjuntos de dados e conexão de banco de dados.
  3. Limpeza e manipulação de dados.
  4. Manipulação de dados com ‘pipes’.
  5. Técnicas exploratórias para resumir dados.

Módulo 4: Visuzalição de Dados com R

Este módulo começa com a apresentam de alguns princípios básicos de uma boa visualização e identificando os principais erros a evitar. De seguida é apresentada a Gramática de Gráficos e a sua implementação através do pacote ‘ggplot2’ que sendo bastante flexível, permite ao utilizador facilmente controlar o resultado final do gráfico.  Será demonstrado como pode criar-se diversos tipos de gráficos para variáveis ​​categóricas e contínuas, gráficos que exibem várias variáveis ​​simultaneamente, adicionando camadas como resumos, criar pequenos múltiplos, anotar gráficos.

> Programa:

  1. Princípios básicos de visualização. O que devemos saber e o que devemos evitar.
  2. Introdução ao ‘ggplot2’: princípios básicos.
  3. Construir gráficos de variáveis ​​categóricas e contínuas.
  4. Pequenos múltiplos.
  5. Adicionar resumos.
  6. Gráficos de anotação.

Rácio Teoria/Prática: 50% Teórico | 50% Prático

Preço

340€ (Isento de IVA)

Data e Horário

A Anunciar

PRÉ-REQUISITOS

– Familiaridade e conhecimentos básicos, a nível do utilizador, dos produtos da família Microsoft e/ou MAC
– Computador com os software R instalado

Formato

ONLINE 
A formação será realizada online, em tempo real, através da plataforma Cisco Webex.

Inscrição

Escolha uma das seguintes opções:

Talk to us

gades solutions

Rua Ferreira de Castro nº19

2635-361, Sintra, Portugal

Telephone: +351 210 124 743

Cellphone: +351 932 027 860

Email: info@gades-solutions.com

inscrição

Por favor, introduza os seus dados. Entraremos em contacto brevemente.

13 + 14 =

Usaremos seus dados para fornecer informações sobre produtos e serviços da Gades Solutions. Para mais informações, consulte a nossa Política de Privacidade

 

COPYRIGHT © 2019 • GADES SOLUTIONS • TODOS OS DIREITOS RESERVADOS