top of page

Aprendizado Supervisionado - Regressão Linear de forma geral

  • Foto do escritor: Andressa Siqueira
    Andressa Siqueira
  • 18 de jan. de 2021
  • 2 min de leitura

Atualizado: 22 de nov. de 2024

A primeira análise que iremos falar aqui será a análise Regressão Linear.


Dando um passo atrás, vamos falar primeiramente sobre Aprendizado Supervisionado de forma superficial aqui!


O aprendizado supervisionado ocorre quando o modelo aprende a partir de resultados pré-definidos. Nesse caso, já temos um conjunto de dados no qual sabemos qual é a saída correta para cada caso e podemos dar pesos ou calibrar o nível de assertividade.


Os problemas de aprendizado supervisionado ~soa classificados em problemas de "regressão" e "classificação".


  • Regressão: métodos de regressão buscam encontrar como uma variável evolui em relação a outras. Estão entre os métodos mais comuns e mais ensinados nas aulas de estatística nas universidades. [4]

  • Classificação: são métodos que buscam explicar uma variável categórica, com duas categorias (variável binária) ou mais.[4]

Alguns exemplos de algoritmos de aprendizado supervisionado [6]

  • Regressão Linear

  • Regressão Logística

  • Árvore de Decisão

  • Florestas Aleatórias (Random Forest)

  • Gradient Boosting

  • Redes Neurais

  • Etc.


E a Regressão Linear?


Ele é um algoritmo que usa os dados passados para "prever" o futuro.


Existem 2 tipos de regressão linear: simples e a múltipla [5]:

  • Regressão linear simples: refere-se quando temos somente uma variável independente (X) para fazermos a predição.

  • Regressão linear múltipla: refere-se a várias variáveis independentes (X)usadas para fazer a predição.

Devemos aplicar esse tipo de algoritmo quando existe uma boa correlação linear entre os dados, independente de ser positiva ou negativa, ou seja, quando existe algum tipo de tendência de crescimento oe descrescimento constante.


Esse algoritmo assume que a função de correlação é linear Y=α+Xβ+ϵ onde:

  • α e β são coeficientes que serão estimados de forma a minimizar o erro quadrático.

E como validar meu modelo?


Nesse caso existe 4 formas de validar no modelo.

  • SQR (Soma dos Quadrados dos Resíduos)

  • MAE (Erro Médio absoluto)

  • MSE (Média dos erros ao quadrado)

SQR (Soma dos Quadrados dos Resíduos)

Mostra a variação de Y que não é explicada pelo modelo elaborado

O R² é uma medida estatística de quão próximos os dados estão da linha de regressão ajustada estando sempre entre 0 e 1. [5]

  • 0: indica que o modelo não explica nada da variabilidade dos dados de resposta ao redor de sua média.

  • 1: indica que o modelo explica toda a variabilidade dos dados de resposta ao redor de sua média.

MAE (Erro Médio absoluto)

Ele calcula o valor dos resíduos para cada um dos pontos e depois é tirado a média de todos esses resíduos. [5]



MSE (Média dos erros ao quadrado)

O MSE é apenas o cálculo do erro mas elevamos ao quadrado.


Uma atenção muito importante que vale ressalva.... Ao avaliar o erro dentro da base de dados que foi ajustada para criar o modelo é uma má pratica pois pode levar ao superajuste ou overfitting.

Se você gostou, da seu like nesse artigo e assim trago mais coisa sobre Regressão Linear.


Referências

Opmerkingen


Assine a newsletter e fique sempre por dentro dos artigos que escrevo 

Obrigado(a)!

CONTATO

Obrigado pelo envio!

© 2020 por Andressa Siqueira. Orgulhosamente criado com Wix.com

bottom of page