26 04 im alumniV8
22 11 im fatiado face
22 11 im fatiado twitter
22 11 im fatiado youtube
22 11 im fatiado gmail
22 11 im fatiado brazil
22 11 im fatiado england
22 11 im fatiado spain

Objetivo

Oferecer um curso de pós-graduação lato sensu para os profissionais que atuam com Ciência de Dados em um ambiente corporativo, a fim de fornecer ferramentas computacionais para tomadas de decisão, análise de dados e predição, bem como sólidas bases conceituais.

Apresentação

Ciência de Dados é um espaço a mais para motivar novos desenvolvimentos estatísticos: metodológicos e aplicados. As análises exploratória e confirmatória correspondem às duas culturas da Estatística envolvidas ao se extrair conclusões a partir dos dados: uma de natureza algorítmica e outra, baseada em modelos estocásticos.

Características do curso

O interesse nessa área se deve, sobretudo, à grande evolução nos sistemas de captura de informação (ex. telescópios, microarranjos de DNA, aceleradores de partículas e plataformas digitais de redes sociais) bem como um aumento substancial na nossa capacidade computacional, em particular após o advento da computação com GPU, de modo que é possível coletar uma grande quantidade de dados e ainda sermos capazes de processá-los em um tempo razoável. Portanto, pode-se ver a Ciência de Dados como uma vertente da Estatística onde a computação e seus algoritmos não são somente ferramentas que auxiliam na resolução de problemas, mas sim são fundamentais para esse fim, muitas vezes sendo parte integrante do método estatístico em questão. Em particular, além da análise dos métodos estatísticos, um cientista de dados deve ser capaz, também, de compreender e propor, se necessário, métodos computacionais adequados aos seus problemas.

Estrutura curricular

Período Disciplina 1 Disciplina 2
Introdução à modelagem de incertezas Introdução ao Python
Introdução ao aprendizado estatístico Mineração de dados
3º  Aprendizado supervisionado I Aprendizado supervisionado II
Aprendizado não-supervisionado Banco de Dados
Redes Neurais e Deep Learning Métodos de otimização
6º  Aprendizado Bayesiano e análise de decisões Disciplina extra - tópicos aplicados

Público alvo

Profissional capaz de propor e analisar modelos estatísticos e computacionais para a solução de problemas e tomadas de decisão em Ciência de Dados.

Processo Seletivo

Pré-requisito: o aluno terá contato com uma sólida base conceitual e computacional, bem como aplicações das técnicas aprendidas em conjuntos de dados reais.

Critérios de seleção: Análise curricular (com base no currículo do candidato entregue no momento da sua inscrição);

Metodologia

Aulas teóricas expositivas e aulas práticas no computador, com análise de casos.

Maiores informações

Tel: (21) 99430-6407 | (21) 98102-5730
E-mail: poscd@im.ufrj.br

Coordenação

Professor Adjunto (DME-IM/UFRJ)
Doutor em Engenharia Elétrica (COPPE/UFRJ)

Página do docente.

Professora Associada (DME-IM/UFRJ)
Doutora em Estatística (Warwick)

Página do docente.

Conselho Consultivo

Professor Visitante (DEST/UFMG)
Doutor em Estatística (Warwick)
Lattes.

Professor Emérito (DME-IM/UFRJ)
Doutor em Estatística (Warwick)
Lattes.

 

Corpo Docente

Professor Adjunto (DMA-IM/UFRJ)
Doutor em Matemática (Université Paris-Sud)

Página do docente.

Professor Adjunto (DMA-IM/UFRJ)
Doutor em Matemática (UFRJ)
Lattes.

 

Professor Associado (DM-IM/UFRJ)
Doutor em Matemática (IMPA)
Lattes.

Professor Adjunto (DME-IM/UFRJ)
Doutor em Engenharia Elétrica (COPPE/UFRJ)

Página do docente.

Professor Adjunto (DME-IM/UFRJ)
Doutor em Estatística (UFRJ)

Página do docente.

Professora Adjunta (DME-IM/UFRJ)
Doutora em Estatística (UFRJ)

Página do docente.

Professora Adjunta (DME-IM/UFRJ)
Doutora em Estatística (UFRJ)
Lattes.

Professor Adjunto (DME-IM/UFRJ)
Doutor em Estatística (UFRJ)

Página do docente.

Professora Associada (DME-IM/UFRJ)
Doutora em Estatística (Warwick)

Página do docente.

Ementas

Carga Horária: 24
Descrição: Elementos de Inferência, Clássica e Bayesiana; Métodos de Estimação: Pontual e Intervalar, Teste de Hipótese, Métodos Computacionais Intensivos e Aproximações.

Carga Horária: 24
Descrição: Introdução à modelo linear geral; Regressão múltipla; Regressão na família exponencial; Dados binários e regressão logística; Regressão com penalização L1 e L2; Regressão por splines.

Carga Horária: 24
Descrição: Modelos Em Espaço de Estados, Distribuições a Priori e a Posteriori; Distribuição Preditiva; Seleção de Modelos; Modelos Gráficos Direcionados e Não Direcionados; Inferência e Algoritmos.

Carga Horária: 24
Descrição: K-MEDIAS, Modelos de Mistura, Redes Neurais Não-supervisionadas, Algoritmo EM; Análise de Componentes Principais.

Carga Horária: 24
Descrição: Introdução ao Aprendizado de Máquina, Visualização de Dados, Apresentação de Conceitos Básicos, Apresentação de Alguns Problemas Relevantes.

Carga Horária: 24
Descrição: Exemplos de Problemas de Otimização, Programação Linear e Aplicações, Programação Quadrática a Aplicações, Modelos Mais Gerais, Otimização Diferenciável: Condições de Otimalidade, Métodos de Solução, Análise de Convergência Local e Global, Aplicações, Otimização Robusta, Otimização Estocástica, Controle Ótimo.

Carga Horária: 24
Descrição: Estruturas de Dados no Python, Comandos Básicos, Pacotes e Bibliotecas Essenciais, Numpy, Matplotlib, Seaborn, Pandas, Statmodel, Scikit-learn.

Carga Horária: 24
Descrição: Uso de banco de dados para data science; banco de dados relacionais; formato tabular e colunar; introdução à SQL; estatísticas descritivas em SQL; agregação, janelas e cubos em SQL; preparação dos dados usando SQL; importação e exportação de dados; interface com python.
Referências: 1. Upom Malik, Matt Goldwasser & Benjamin Johnston - SQL for Data Analytics. Ed. Packt Publishing.

Carga Horária: 24
Descrição: Análise de Discriminantes Linear e Quadrático, Bayes Ingênuo, Perceptron de Uma Camada, Métricas para Avaliação de Resultados (Matriz de Confusão), Curva ROC AUC, Estatística F, Precisão Vs Acurácia, Máquinas de Vetor Suporte.

Carga Horária: 24
Descrição: Redes Neurais, Exemplos de Funções de Ativação e Funções Custo, Algoritmo Backpropagation, Redes Neurais Usando Pytorch e Tensorflow, Redes Profundas, Redes Convolucionais e Recorrentes, Exemplos.

Carga Horária: 24
Descrição: Conceitos de Probabilidade, Probabilidade Condicional, Modelos para Variáveis Aleatórias Discretas e Continuas, Distribuições Condicionais, Teorema de Bayes, Momentos.

Carga Horária: 24
Descrição: Assuntos específicos sobre cada tópico.

Carga Horária: 72
Descrição: Trabalho de fim de curso.

Topo