Python em Data Science
Das Noções Básicas de Python à sua Aplicação em Ciência de Dados
Nível Introdutório/Intermédio
Formato: Online via Cisco Webex
Este curso é parte integrante do:
DATA
11/11 a 09/12/2024
(2ª e 4ª feiras)
Horário
9 Sessões – 19h às 21h
Duração: 18h
Formato
Online via Cisco Webex
> Todas as gravações das sessões serão disponibilizadas
PREÇO
295€
> Oferta de 10% de desconto em inscrições, em simultâneo, nos dois níveis: Nível Introdutório/Intermédio e Nível Avançado
Este curso, em conjunto com o curso Python em Data Science – Nível Avançado (Saiba Mais) constituem o Data Science Program em Python.
Os participantes que se inscreverem em ambos os níveis, em simultâneo, beneficiarão de 10% de desconto no valor total da inscrição.
descrição
Das Noções Básicas de Python à sua Aplicação em Ciência de Dados.
Este curso pretende capacitar profissionais ou investigadores académicos a usarem Python como uma ferramenta de apoio a projetos de data science, com o intuito de melhorar a tomada de decisão. Este programa é o nível introdutório nesta área e visa uma explicação do funcionamento da linguagem de programação Python e SQL.
Serão abordadas metodologias orientadas para a análise estatística, visualização explicativa de dados, e transformação dos dados orientados a problemas analíticos, recorrendo a casos práticos e exemplos.
A discussão e a aplicação a casos reais serão incentivadas, sensibilizando para a aplicação de diferentes técnicas em projetos futuros.
Espera-se que no final os alunos sejam capazes de extrair poder dos dados e possam utilizar as técnicas ministradas para executar autonomamente obtenção, limpeza, transformação e análises explicativas com recurso a visualização, aptos a criar valor no âmbito das suas organizações.
Será privilegiada a interação durante as sessões, através da aplicação dos conceitos em casos práticos e da discussão acerca da sua aplicação em problemas reais. Espera-se assim que os formandos sejam capazes de trazer as suas questões e problemas que enfrentam nas suas organizações ou na sua investigação.
a quem se destina
Profissionais e estudantes académicos que queiram incorporar a análise de dados para fins descritivos, preditivos e no suporte à tomada de decisão.
formador
José Guimarães
É formado em Engenharia Industrial e Gestão pela Universidade do Porto e trabalhou durante mais de 6 anos de em consultoria. Ao longo deste período, ajudou organizações de diferentes setores como Retalho, Indústria ou Saúde, a melhorar a sua tomada de decisão usando diferentes técnicas como análise de dados, visualização de dados, simulação ou otimização para resolver problemas de negócio. Ao longo do seu percurso, já trabalhou com diferentes linguagens como Python, R, VBA e SQL. Atualmente trabalha no setor financeiro, onde continua a auxiliar as organizações a obter melhorias de performance sustentáveis através da análise de dados.
Jorge Ferreira
Jorge Ferreira é um Product Manager de produtos digitais. Na sua carreira trabalhou no ecossistema das startups portuguesas, começou como Data Scientist, onde trabalhou na investigação, desenho e implementação de diversas soluções com recurso ao Analytics. Nestes projetos, destacam-se a implementação de modelos de Machine Learning e Otimização aplicados à Indústria da Logística e E-commerce. Também como Product Manager é responsável pelo Roadmap de uma equipa de Software de Inteligência artificial. O seu background académico é Engenharia Industrial e Gestão a qual está a ser agora complementada com um Mestrado em Data Mining.
Pedro Esmeriz
Pedro Esmeriz é cientista de dados, com 5 anos de experiência na criação de algoritmos preditivos e prescritivos para diversas industrias. desde moda, e-commerce e logística. O seu background académico inclui um Mestrado em Engenharia e Gestão Industrial e um Mestrado em Data Analytics. Atualmente leciona no ISLA.
Recursos Disponibilizados
– Link para instalação do Python
– Certificado GADES Solutions e DGERT
– Gravações das Sessões do Curso
– Slides e material demonstrado no decorrer do curso, em formato digital
programa
Módulo 1: Introdução a Data Science com Python (4 Horas)
Neste módulo será realizada uma introdução ao ambiente Python, onde se espera que os formandos ganhem familiaridade com os conceitos que serão usados ao longo do curso, assim como as funcionalidades e potenciais aplicações desta linguagem.
1. O que é Data Science?
2. As fases do Data Science
3. A linguagem Python
4. Variáveis e Objetos
5. Operações
6. Manipulação de strings
7. Controlo de ciclos e condições
8. Funções
9. Bibliotecas comuns (pandas, matplotlib, scikit-learn, etc.)
Módulo 2: Análise exploratória e processamento de dados (4 Horas)
Neste módulo será usada a biblioteca de pandas como ponto de partida para inspeção, tratamento e obtenção de informação a partir de dados presentes em datasets. Serão também abordados conceitos e exemplos de visualização de dados dentro da própria linguagem Python.
1. Aquisição de dados
2. Manipulação de datasets – filtragem, ordenação e cálculo, entre outros
3. Análise estatística dos dados
4. Visualização dos dados
Módulo 3: Tratamento de datasets (4 Horas)
1. Limpeza dos dados
2. Uniformização de variáveis
3. Detecção e tratamento de dados em falta
4. Deteção e substituição de outliers
5. Tratamento de strings
6. Categorização
7. Feature Engineering
Módulo 4: SQL (2 Horas)
Neste módulo serão explicados os conceitos básicos do SQL, uma linguagem de pesquisa em bases de dados. Este módulo dará aos formandos a autonomia necessária para a navegação numa base de dados e para a construção de reports com a estrutura desejada através de filtros, agrupamentos de tabelas e cálculo de métricas agregadas.
1. SQL: as operações possíveis
2. SQL: os elementos de uma query de seleção
3. Agrupamentos de tabelas
4. Métricas agregadas
5. Conexão a base de dados a partir de Python
Módulo 5: Aplicação (4 Horas)
Caso de estudo onde poderão ser aplicados os conceitos de extração de dados SQL e/ou leitura dos dados em ficheiros no Python, tratamento dos dados, análise descritiva exploratória e visualização.
– Teaser: Pequena demonstraçao de modelação de machine learning e resumo do Curso Avançado (Q&A)
1. Conceitos
2. Exemplo demonstrativo – Case Study
Rácio Teoria/Prática: 40% Teórico | 60% Prático
preço
295€ (Isento de IVA)
> Oferta de 10% de desconto em inscrições, em simultâneo, nos dois níveis: Nível Introdutório/Intermédio e Nível Avançado
data e horário
Sessão 1: 11/11/2024 – 19h às 21h
Sessão 2: 13/11/2024 – 19h às 21h
Sessão 3: 18/11/2024 – 19h às 21h
Sessão 4: 20/11/2024 – 19h às 21h
Sessão 5: 25/11/2024 – 19h às 21h
Sessão 6: 27/11/2024 – 19h às 21h
Sessão 7: 02/12/2024 – 19h às 21h
Sessão 8: 04/12/2024 – 19h às 21h
Sessão 9: 09/12/2024 – 19h às 21h
pré-requisitos
– Não exige conhecimento prévio de Python
– Familiaridade e conhecimentos básicos, a nível do utilizador, dos produtos da família Microsoft e/ou MAC
– Recomenda-se a utilização de um 2º monitor
– Conhecimento básico de métricas estatísticas
– Domínio de folhas de cálculo e dados em estrutura
– Predisposição para aprendizagem de linguagens de programação
Formato
ONLINE
A formação será realizada online, em tempo real, através da plataforma Cisco Webex.
Inscrição
Escolha uma das seguintes opções:
Fale connosco
gades solutions
Rua Ferreira de Castro nº19
2635-361, Sintra, Portugal
Telefone: 210 124 743
Telemóvel: 932 027 860
Email: info@gades-solutions.com
inscrição
Utilizaremos os seus dados para informar acerca de produtos ou serviços da GADES Solutions. Para mais informações, por favor consulte a nossa Política de Privacidade
COPYRIGHT © 2019 • GADES SOLUTIONS • TODOS OS DIREITOS RESERVADOS