Estatística e Análise de Dados com R

Nível Avançado

Formato: Online via Cisco Webex

Em Parceria com CEAUL (Centro de Estatística e Aplicações da Universidade de Lisboa)

DATA

A Anunciar

Horário

8 Sessões – 18h30 às 20h30

Duração: 16h

Formato

Online via Cisco Webex

> Todas as gravações das sessões serão disponibilizadas

PREÇO

295€

descrição

No mundo em que vivemos, o fluxo e volume de dados tem assistido a um crescimento avassalador que é transversal a toda sociedade. Esta realidade exige a adoção de ferramentas que permitam a manipulação e tratamento dos dados de uma forma célere e desejavelmente isenta do pagamento de licenças comerciais por parte dos seus utilizadores. A linguagem R ao longo de três décadas tem conseguido dar resposta a estes e a inúmeros outros desafios. Contudo a utilização de técnicas estatísticas multivariadas presentes na linguagem R exige um conhecimento profundo e amplo por parte dos seus utilizadores, em particular para as condições de aplicabilidade das mesmas e respetivas limitações. Contudo tal realidade nem sempre está presente nas análises estatísticas realizadas.

Na sequência das formações “Estatística e Análise de Dados com R” e “R for Data Science” a presente formação irá visar as seguintes temáticas: Análise Discriminante (Linear e Quadrática), Escalonamento Multidimensional (Multidimensional Scaling), Análise Fatorial e Análise em Componentes Principais.

Será dada particular atenção para as condições de aplicabilidade das várias metodologias estatísticas propostas sendo veiculados os aspetos quantitativos/matemáticos essenciais, assim como uma rigorosa e detalhada interpretação dos outputs. Todos os conteúdos ministrados serão acompanhados por bases de dados fornecidas durante a formação bem como de material pedagógico desenvolvido e concebido para o efeito bem como todo o código (script) em linguagem R.

Pretende-se que no final da formação os formandos identifiquem as técnicas estatísticas mais apropriadas para os diversos estudos de caso propostos bem como se tornem progressivamente autónomos para a implementação das mesmas na linguagem R, com a respetiva análise crítica de resultados/outputs, interpretação e verificação dos pressupostos. Adicionalmente serão lançados desafios aos formandos com proposta de resolução dos mesmos recorrendo à linguagem R.

a quem se destina

O curso destina-se a todos que necessitem de realizar análise de dados com recurso ao R, em particular:
– Estudantes de todos os ciclos de estudo, em particular de Mestrado/Doutoramento;
– Profissionais (académicos ou não) que no seu quotidiano lidam com informação que necessita ser analisada e suportada com metodologia estatística com foco na resolução de problemas e no apoio à tomada de decisão.

formador

Ricardo São João

Licenciado em Matemáticas Aplicadas ramo Estatística e Investigação Operacional (CEUL, 2000) e Mestre em Matemática Aplicada às Ciências Biológicas (ISA-UTL, 2007). O interesse pela área da saúde levou-o a concluir a pós-graduação em Epidemiologia (FM-UL, 2011) e o seu doutoramento em Ciências da Vida na especialidade de Saúde das Populações/Bioestatística (FCM-UNL, 2015).

Ricardo São João tem-se dedicado à modelação estatística com um elevado background computacional. O entusiasmo e paixão pelo ensino, aliado ao desafio de modelação de fenómenos complexos com grande impacto na saúde e bem-estar das populações, fá-lo-ão sentir-se duplamente motivado. Professor no Ensino Superior desde 2001, ministra cursos graduados, pós-graduados e de curta duração, com especial ênfase na manipulação de software estatístico (SPSS e R).

É membro do CEAUL com interesses de investigação em: Estatística Multivariada e Espacial, Bioestatística e Epidemiologia.

Recursos Disponibilizados

– Link para instalação do R
– Certificado GADES Solutions, CEAUL e DGERT
– Gravações das Sessões do Curso
– Slides e material demonstrado no decorrer do curso, em formato digital

programa

0. Breve introdução ao R
Descrição do ambiente R, importação/exportação da informação, armazenamento (tipo de dados e variáveis); plug-ins do R e livrarias/pacotes (libraries/packages) a serem utilizados.

1. Análise Discriminante (AD)
– Introdução, contextualização e objetivos da AD;
– Análise Discriminante Linear (ADL) e Análise Discriminante Quadrática (ADQ);
– Pressupostos da AD e apresentação de testes estatísticos a ela associados (Teste de Mardia; Energy test, Teste M de Box) com as respetivas formulações de hipóteses e implementações;
– Etapas na implementação da AD;
– Expressão matemática do modelo AD;
– Modelação da AD recorrendo a amostra de treino e de teste;
– Função discriminante & representação gráfica;
– Previções e construção da matrix de classificação (confusion matrix);
– Seleção automática vs seleção manual das variáveis integrantes no modelo AD;
– Estudos de Caso envolvendo o modelo ADL e ADQ implementados no R;
– Apresentação de um desafio envolvendo a AD e respectiva resolução.

2. Escalonamento Multidimensional (Multidimensional Scaling- MDS)
– Introdução, contextualização e objetivos do MDS;
– Pioneiros do MDS e respetivos contributos;
– Terminologia e conceitos: Julgamentos de (dis)semelhança; ordenação de preferências; STRESSE; mapa espacial; Scree plot; Diagrama de Shepard; critérios de Mardia e P2;
– Pressupostos do MDS e apresentação de testes estatísticos a ele associados com as respetivas formulações de hipóteses e implementações;
– Tipologia de dados de entrada: diretos, derivados, de preferências;
– Etapas na implementação do MDS;
– Tipologias de MDS: Métrico vs Não Métrico;
– Estudos de Caso envolvendo MDS métrico e não métrico implementados no R;
– Representações gráficas: espaço de grupo (group space) e espaço de indivíduos/objectos (subject space);
– Apresentação de um desafio envolvendo MDS e respectiva resolução.

3. Análise Fatorial (AF)
– Introdução, contextualização e objetivos da AF;
– Tipologias de AF: confirmatória e exploratória;
– Terminologia e conceitos na AF: teste de esfericidade de Bartlett e KMO (Kaiser-Meyer-Olkin); matriz de correlações; comunalidades, valores próprios (eigen values); cargas fatoriais (loadings), scree plot; correlograma, rotação varimax.
– Pressupostos da AF e apresentação de testes estatísticos a ela associados com as respetivas formulações de hipóteses e implementações (teste de esferecidade de Bartlett, testes de normalidade Shapiro Wilk e Kolmogorov Smirnov).
– Determinação do nº de fatores, extração e rotação dos mesmos.
– Nomeação das dimensões associadas aos fatores e interpretação das mesmas.
– Estudos de Caso implementados no R
– Representações gráfica através do biplot
– Apresentação de um desafio envolvendo AF e respectiva resolução.

4. Análise em Componentes Principais (ACP)
– Introdução, contextualização e objetivos da ACP;

– ACP vs AF;
– Modelos Formativos e Modelos Reflexivos; –Terminologia e conceitos na ACP;
– Exemplos de Aplicações da ACP e suas limitações;
–  Matemática e Estatística subjacente ao modelo ACP;
– Componentes Principais e sua Determinação
– Packages do R que realizam ACP, em particular o Plug-in FactoMIneR, com particular foco na interpretação de resultados e representação gráfica.
– Contributo das variáveis no modelo ACP e qualidade de representação das componentes
– Três estudos de Caso implementados no R
– Apresentação de um desafio envolvendo AF e respetiva resolução.

preço

295€  (Isento de IVA)

data e horário

A Anunciar

pré-requisitos

– Frequência nos cursos “Estatística e Análise de Dados com R” ou “Data Scientist com R” ou Conhecimento prévio de R
– Familiaridade e conhecimentos básicos, a nível do utilizador, dos produtos da família Microsoft e/ou MAC
– Computador com os software R instalado

Formato

ONLINE 
A formação será realizada online, em tempo real, através da plataforma Cisco Webex.

Bibliografia

Fox, John (2016), Using the R Commander: A Point-and-Click Interface for R. CRC Press.
• Field, A. P., Miles, J., & Field, Z. (2012), Discovering statistics using R. London: Sage.
• Crawley, M (2007), The R Book, Wiley.
• Anderson, R.E, Black, W.C., Hair, J.F. and Tatham, R.L. (2018) Multivariate Data Analysis. 8th Edition. CENGAGE
• Chapman, C., & Feit, E. M. (2015). R for marketing research and analytics. New York, NY: Springer.
• Grigsby, M. (2018). Marketing Analytics: A Practical Guide to Improving Consumer Insights Using Data Techniques. Kogan Page Publishers.
• Malhotra, N. K. (2019) Marketing Research: An Applied Orientation, 7th Edition. Pearson.
• Sorger, S. (2013). Marketing analytics: strategic models and metrics. San Bernadino, CA: Admiral Press.

Inscrição

Escolha uma das seguintes opções:

Fale connosco

gades solutions

Rua Ferreira de Castro nº19

2635-361, Sintra, Portugal

Telefone: 210 124 743

Telemóvel: 932 027 860

Email: info@gades-solutions.com

inscrição

Por favor, introduza os seus dados. Entraremos em contacto brevemente.

13 + 4 =

Utilizaremos os seus dados para informar acerca de produtos ou serviços da GADES Solutions. Para mais informações, por favor consulte a nossa Política de Privacidade

 

COPYRIGHT © 2019 • GADES SOLUTIONS • TODOS OS DIREITOS RESERVADOS