class: center, middle, inverse, title-slide .title[ # PRIMEIROS PASSOS (AULA 02) ] .subtitle[ ## R para Ciência de Dados ] .author[ ### Prof. Victor Valerio ] .date[ ###
Última Atualização
: 25-08-2025 ] --- # APRESENTAÇÃO ---- - [**QUAL O OBJETIVO DA AULA?**](#objetivo_aula) - [**O QUE É ESSE TAL DE R?**](#sobre_r) - [**CONHECENDO O RSTUDIO**](#rstudio) - [**QUAIS OS PRINCIPAIS CONCEITOS DE R?**](#dicionario_r) --- class: inverse, center, middle name: objetivo_aula # QUAL O OBJETIVO DA AULA? <img src="https://media.giphy.com/media/BpGWitbFZflfSUYuZ9/giphy.gif" alt="Gif da série the office para apresentar o professor" width="50%" style="display: block; margin: auto;" /> --- <div style="text-align: justify"> # OBJETIVO DA AULA ---- - Esta aula tem por objetivo principal **apresentar a principal ferramenta da disciplina para aplicação dos conceitos a serem trabalhados a frente: a linguagem de programação R**. Assim, vamos discutir: - Como funciona a "lógica de programação" da linguagem R; - Como organizar a estação do trabalho. - De um lado, não é esperado que você tenha qualquer conhecimento prévio. Iniciaremos realmente "do zero", isto é, desde a fase de configuração inicial. Por outro lado, é esperado que ao final da aula toda a nossa estação de trabalho esteja pronta para uso e, mais que isso, que não tenhamos medo de usá-la. --- <div style="text-align: justify"> # OBJETIVO DA AULA ---- - Não vamos esquecer que será a **linguagem de programação R** que nos permitirá realizar **todas as etapas da ciência de dados em um único software**. Assim, o início do estudo em R pode parecer complicado, mas o resultado é muito importante para a vida profissional e acadêmica. </br> - Vamos lembrar do **ciclo da ciência de dados**? --- <div style="text-align: justify"> # OBJETIVO DA AULA ---- <img src="ciclo.PNG" width="75%" style="display: block; margin: auto;" /> --- <div style="text-align: justify"> # OBJETIVO DA AULA ---- - **Importar**: Trazer os dados de diferentes fontes (planilhas, bancos de dados, APIs, arquivos de texto etc.) para o ambiente R, garantindo que possam ser utilizados nas análises. - **Organizar**: Estruturar e limpar os dados, ajustando formatos, corrigindo inconsistências e preparando-os para etapas posteriores. - **Transformar**: Manipular variáveis e criar novas medidas ou indicadores que melhor representem o fenômeno de interesse. --- <div style="text-align: justify"> # OBJETIVO DA AULA ---- - **Visualizar**: Explorar padrões e tendências por meio de gráficos e tabelas, auxiliando na compreensão inicial e na comunicação das informações. - **Modelar**: Aplicar métodos estatísticos e de aprendizado de máquina para explicar relações ou prever comportamentos com base nos dados. - **Comunicar**: Apresentar resultados de forma clara e acessível, utilizando relatórios, painéis ou apresentações que traduzam a análise para diferentes públicos. --- <div style="text-align: justify"> # OBJETIVO DA AULA ---- - Portanto, o foco da aula de hoje está em programação na linguagem R. <img src="foco_prog.PNG" width="50%" style="display: block; margin: auto;" /> --- class: inverse, center, middle name: sobre_r # O QUE É ESSE TAL DE R? <img src="https://media.giphy.com/media/AEkhbYZRKUaVoEDKph/giphy.gif" alt="Gif da série the office para apresentar o professor" width="50%" style="display: block; margin: auto;" /> --- <div style="text-align: justify"> # O QUE É ESSE TAL DE R? ---- - O **R é um software livre** (*open source*) que foi criado na década de 1990 por dois estatísticos da Universidade de Auckland (Nova Zelândia), **Ross Ihaka** e **Robert Gentleman** (isso mesmo, o nome do software se refere as iniciais dos nomes de seus desenvolvedores). - Ele foi criado por dois estatísticos e para aplicações estatísticas (por isso a escolha do mesmo para esta disciplina). Atualmente, a **R Foudation for Statistical Computing** dá suporte ao software e ele ganhou uma ampla gama de aplicações e funcionalidades se tornando um dos programas mais utilizados em todo o mundo! --- <div style="text-align: justify"> # O QUE É ESSE TAL DE R? ---- - O fato de possuir como mantenedora uma fundação para estatística computacional é uma das principais vantagens de utilização do software R. Assim, pode-se garantir que as aplicações são validadas cientificamente. </br> - Mas afinal de contas, o que é programar na linguagem R? --- <div style="text-align: justify"> # O QUE É ESSE TAL DE R? ---- Programar na linguagem R significa organizar um **algoritmo que seja interpretável pelo software** (na programação, dizemos: **desenvolver um algoritmo a ser compilado pelo software R**). Neste sentido, é interessante desenvolver um pouco melhor este conceito. - **DEFINIÇÃO DE ALGORITMO**: Conjunto de regras e procedimentos lógicos perfeitamente definidos que levam à solução de um problema em um número finito de etapas. - **COMPILAR EM R**: Tradução (ou **interpretação**) de um determinado código escrito (**algoritmo**) em linguagem de máquina para a execução das tarefas definidas. --- <div style="text-align: justify"> # O QUE É ESSE TAL DE R? ---- - Como visto, um algoritmo é uma sequência de etapas escritas em um código e com alguma finalidade específica. Mas essa singela definição pode deixar passar um fato importante: **O código pode ser muito grande, com muitos "atributos"!** </br> - Assim, o seu desenvolvimento pode se tornar complexo em alguns casos e, mais que isso, o seu entedimento no futuro (quando for retomado por você ou mesmo por outros pesquisadores) também pode ser complicado. --- <div style="text-align: justify"> # O QUE É ESSE TAL DE R? ---- - Para nos ajudar nessa tarefa de organizar os algoritmos desenvolvidos, ou em desenvolvimento, utilizamos um outro software denominado: **RStudio**. </br> - Vale ressaltar, isso significa que **continuamos programando em linguagem R**, mas com a ajuda de um organizador de algoritmo chamado **RStudio** (em programação, esse "organizador" é chamado de **IDE - Integrated Development Enviroment**). --- # O QUE É ESSE TAL DE R? ---- <img src="icones.PNG" width="75%" style="display: block; margin: auto;" /> --- class: inverse, center, middle name: rstudio # CONHECENDO O RSTUDIO <img src="https://media.giphy.com/media/myeDS6IoQrnyqus91Q/giphy.gif" alt="Gif da série the office para apresentar o professor" width="50%" style="display: block; margin: auto;" /> --- <div style="text-align: justify"> ## CONHECENDO O RSTUDIO ---- - O **RStudio** possui uma interface dividida em quatro quadrantes, cada um desempenhando um papel específico: - **Script** (Quadrante Superior Esquerdo); - **Console** (Quadrante Inferior Esquerdo); - **Ambiente** (Quadrante Superior Direito); - **Arquivos/Gráficos/Pacotes/Ajuda** (Quadrante Inferior Direito). - Observação: Para "abrir" o quarto quadrante clique no ícone **"new file"** e selecione a opção **"R Script"**. Ou utilize o atalho **(Ctrl + Shift + N)**. --- <div style="text-align: justify"> # CONHECENDO O RSTUDIO ---- - **Script** (Quadrante Superior Esquerdo): Neste quadrante, você pode criar, editar, executar e salvar o algoritmo desenvolvido na linguagem R. - O **Script** permite que você escreva um conjunto de instruções R de forma sequencial (**algoritmo**) e, em seguida, execute todas as instruções de uma vez. Isso é útil para criar fluxos de trabalho complexos ou análises repetíveis. --- <div style="text-align: justify"> # CONHECENDO O RSTUDIO ---- - **Console** (Quadrante Inferior Esquerdo): O console é onde você interage diretamente com o R. Você pode digitar comandos R diretamente no console e ver os resultados imediatamente. É um ótimo lugar para testar pequenos trechos de código, experimentar funções e verificar resultados. - De fato, a integração entre IDE RStudio e o software R ocorre no console. --- <div style="text-align: justify"> # CONHECENDO O RSTUDIO ---- - **Environment** (Quadrante Superior Direito): Este quadrante exibe informações sobre os objetos que você criou e suas propriedades. - Quando você define variáveis ou carrega dados no R, esses objetos são listados no ambiente. Isso permite que você acompanhe as variáveis e objetos que estão disponíveis para uso em sua sessão R. --- <div style="text-align: justify"> # CONHECENDO O RSTUDIO ---- - **Arquivos/Gráficos/Pacotes/Ajuda** (Quadrante Inferior Direito): Neste painel, você pode explorar e navegar pelos arquivos e pastas do sistema de arquivos do seu computador. Ver os gráficos que são gerados a partir dos seus comandos de visualização. Ver informações sobre os pacotes (bibliotecas) que estão instalados no seu ambiente R. Acessar a documentação de ajuda para funções e pacotes do R. --- class: inverse, center, middle name: dicionario_r # QUAIS OS PRINCIPAIS CONCEITOS DE R? <img src="https://media.giphy.com/media/9psHrHyIXciY6lCz8B/giphy.gif" alt="Gif da série the office para apresentar o professor" width="50%" style="display: block; margin: auto;" /> --- <div style="text-align: justify"> # PRINCIPAIS CONCEITOS DE R - **FUNÇÃO:** Um código que determina a **realização de uma tarefa específica**. Em geral, as funções aceitam **entradas** (**argumentos** da função) para produzirem uma determinada **saída**. - **Funções matemáticas**: soma **"+"**, diferença **"-"**, divisão **"/"**, multiplicação **"*"**); - **Funções de manipulação de dados**; - **Funções estatísticas**. --- <div style="text-align: justify"> # PRINCIPAIS CONCEITOS DE R - **OBJETO:** Uma estrutura que armazena dados (número, conjunto de números, imagens, texto, etc.). Para criar um objeto no R (ou seja, armazenar determinada informação em um objeto) utiliza-se o sinal de atribuição "**<-**" (como se fosse uma seta que mostra o dado que está sendo armazenado ao objeto). Os principais tipos de objetos são: - **Vetores**: Um vetor é uma sequência de elementos do mesmo tipo. Pode ser um vetor numérico, de caracteres, lógico, entre outros. - **Matrizes**: Matrizes são vetores bidimensionais com elementos do mesmo tipo; --- <div style="text-align: justify"> # PRINCIPAIS CONCEITOS DE R - **OBJETO:** Uma estrutura que armazena dados (número, conjunto de números, imagens, texto, etc.). Para criar um objeto no R (ou seja, armazenar determinada informação em um objeto) utiliza-se o sinal de atribuição "**<-**" (como se fosse uma seta que mostra o dado que está sendo armazenado ao objeto). Os principais tipos de objetos são: - **Data Frame**: estruturas semelhantes a tabelas, onde as colunas podem ser de diferentes tipos. Eles são usados para armazenar conjuntos de dados tabulares; - **Lista**: coleções ordenadas de objetos, que podem ser de tipos diferentes. --- <div style="text-align: justify"> # PRINCIPAIS CONCEITOS DE R - **PACOTES:** Conjunto de funções (ou conjuntos de dados) com documentação relacionada e que se destinam a realizar tarefas específicas. - Existem milhares de pacotes disponíveis na comunidade R que cobrem uma ampla gama de tarefas, desde análise de dados até criação de gráficos. Para usar as funções de um pacote, você precisa instalá-lo e carregá-lo em sua sessão R. --- # PRINCIPAIS CONCEITOS DE R <img src="pacote_funcao.PNG" width="75%" style="display: block; margin: auto;" /> --- <div style="text-align: justify"> # PRINCIPAIS CONCEITOS DE R A linguagem R é principalmente uma **linguagem de programação orientada a funções**. Isto é, o R permite a criação e manipulação de objetos (dados armazenados), por meio da execução de funções. Esta é uma das grandes diferenças entre o R e o python (esta última, linguagem orientada à objeto). --- ## VOLTANDO, COMO INSTALAR E USAR PACOTES? <img src="console_script.png" width="75%" style="display: block; margin: auto;" /> --- class: inverse, center, middle <img src="https://media.giphy.com/media/n4oKYFlAcv2AU/giphy.gif" alt="Gif para agradecer pela atenção e o tema é da série the office" width="80%" style="display: block; margin: auto;" />