Cadeia de Markov e Probabilidades

Vale lembrar que fiz isso apenas para fins de estudo, eu escrevo textos sobre determinados assuntos a fim de entende-lo, então talvez algumas informações estejam erradas, e se sintam a vontade para corrigir :P

Cadeia de Markov

Muitos dos processos que ocorrem na natureza e na sociedade podem ser estudados (pelo menos em primeira aproximação) como se o fenômeno estudado passasse, a partir de um estado inicial, por uma sequência de estados, onde a transição de um determinado estado para o seguinte ocorreria segundo uma certa probabilidade. [...] No caso em que esta probabilidade de transição depende apenas do estado no qual o fenômeno se encontra e do estado a seguir, o processo será chamado processo de Markov e uma sequência de estados seguindo este processo será denominada uma _cadeia de Markov


propondo que exista três bancos: O banco Alfa, o Beta e o Gama. Os clientes são livres para escolher permanecer ou trocar de banco a qualquer momento.

Suponha que no período de um ano, temos as seguintes situações:

  • uma pessoa que usa o banco Alfa atualmente, tem uma chance de 20% de migrar para o banco beta e 35% de migrar para o banco Gama.
  • Uma pessoa que usa o banco Beta atualmente, tem uma chance de 25% de migrar para o banco Alfa e 25% de migrar para o banco Gama.
  • Uma pessoa que usa o banco Gama atualmente, tem uma chance de 30% de migrar para o banco Alfa e 15% de migrar para o banco Beta.

Para efeito de simplificação, suponha que uma pessoa usa apenas um banco por vez. Qual é a probabilidade de alguém continuar usando o banco Gama após dois anos?

Como vamos fazer essa previsão?

Primeiro precisamos de dois componentes importantes:

  • Matriz de transição
  • Vetor de estado inicial

Matriz de transição

A matriz de transição é o coração de uma cadeia de Markov. Ela representa as probabilidades de um sistema passar de um estado para outro em um determinado passo de tempo. Em outras palavras, ela mapeia as transições entre os diferentes estados possíveis de um sistema que evolui ao longo do tempo de forma probabilística.

Dimensão da matriz transição

Quantidade de estados determina a dimensão da matriz, ou seja, quantas mudanças podem ocorrer, no nosso caso, temos 3 bancos, (Alfa, Beta, Gama). Pela matriz de transição ser sempre quadrada, ela vai ter as linhas e colunas iguais as quantidades de estados, ou seja. $T_3x_3$

T =

A B G
A
B
G

Como podemos ver, ordem das colunas, é a mesma que deve ser aplicada as linhas.

Propriedades da matriz

  • Cada coluna é chamada de Vetor de Transição

Colunas e linhas

  • As colunas representam o estado atual.
  • As linhas representam o estado previsto.

Característica essencial de um Vetor de Transição

  • A soma dos elementos das colunas, tem que resultar em um número inteiro. (100%)

Descobrindo uma incógnita da primeira coluna

Baseando-se no pre-suposto que:

  • uma pessoa que usa o banco Alfa atualmente, tem uma chance de 20% de migrar para o banco beta e 35% de migrar para o banco Gama.

Podemos montar a seguinte matriz: T =

A B G
A
0.20 B
0.35 G

Se a nossa primeira coluna é um Vetor de transição, a soma dela precisa ser um número inteiro, então com uma equação básica, nesse pré-suposto, podemos "adivinhar" qual a chance da pessoa que utiliza o banco Alfa, permanecer usando ele, com uma equação básica.

$0,20 + 0,35 = 0,55$ $1.0 - 0,55 = 0,45$

Ou melhor para os menos chegados.

$x + 0,20 + 0,35 = 1$ $x = 1 - 0,20 - 0,35$ $x =45$

Preenchendo a primeira coluna, a matriz de transição $T$ seria:

A B G
0.45 A
0.20 B
0.35 G

E a soma da primeira coluna seria igual a 1 :P.

Como resolver a coluna B, a partir do segundo pre-suposto?

Baseando-se no pre-suposto que:

  • Uma pessoa que usa o banco Beta atualmente, tem uma chance de 25% de migrar para o banco Alfa e 25% de migrar para o banco Gama.

Temos a seguinte Matriz de transição:

$T=$

A B G
0.45 0.25 A
0.20 B
0.35 0.25 G

Como a soma da coluna, ou melhor, do Vetor de Transição deve dar 1:

$1 - 0.25 - 0.25 = x$ $x= 0.5$

Fazendo o mesmo com a coluna G

Baseando-se no pre-suposto que:

  • Uma pessoa que usa o banco Gama atualmente, tem uma chance de 30% de migrar para o banco Alfa e 15% de migrar para o banco Beta.

Permanecer no banco gama = $x$ $1 - 0.3 - 0.15 = x$ $x = 0.55$

Logo, nossa matriz de transição seria: $T=$

A B G
0.45 0.25 0.30 A
0.20 0.50 0.15 B
0.35 0.25 0.55 G

Vetor estado inicial

Precisamos definir o estado inicial, ou melhor o Vetor de estado inicial. Nesse caso, ele se daria por qual banco o cliente está atualmente.

A informação que temos é que a pessoa está utilizando atualmente o banco gama. E para efeito de simplificação, cada pessoa só pode utilizar um banco por vez.

Característica essencial de um Vetor estado inicial

  • A soma dos elementos das colunas, tem que resultar em um número inteiro. (100%)

E se um cliente pudesse usar mais de um banco por vez? Se por exemplo um cliente usasse os 3 bancos, o vetor poderia ser $X⁽⁰⁾ = (0.33, 0.33, 0.33)$, pois a soma precisa resultar em 1.

Vetor estado inicial: $X⁽⁰⁾ =$

0 A
0 B
1 G

Resolvendo previsão

Qual a probabilidade de alguém continuar usando o banco Gama após dois anos?

Vamos resolver essa questão a partir da fórmula $X⁽ⁿ⁾ = Tⁿ . X⁽⁰⁾$

Vamos pensar que cada ano significa uma etapa do nosso vetor de estado. O vetor de estado inicial é representado por $X⁽⁰⁾$ pois ele está na sua etapa de número 0, ou seja, etapa inicial.

Nesse caso, as etapas podem ser compreendida como os anos, e como queremos o vetor de estado após dois anos, estamos a procura do $X⁽²⁾$. Logo, $n = 2$.

Cálculos

Então temos que resolver a seguinte equação: $X⁽²⁾ = T² . X⁽⁰⁾$.

Temos que $T=$

A B G
0.45 0.25 0.30 A
0.20 0.50 0.15 B
0.35 0.25 0.55 G

$T²$ nada mais é do que $T.T$, então temos dois produtos de matriz a ser feito nessa equação, se decompormos essa equação ficaria assim $X⁽²⁾ = T . T . X⁽⁰⁾$, como o vetor de estado inicial tem dois elementos nulos, podemos mudar a prioridade das multiplicações para ficar mais simples, por exemplo executar $X.T$ primeiro, e depois multiplicar esse resultado por $T$.

$T.X$ =

0.30
0.15
0.55

$X⁽²⁾$ = $T . (T.X)$

$X⁽²⁾=$

0,3375 A
0,2175 B
0,445 G

Logo, a probabilidade do usuário permanecer no banco gama após 2 anos, é de 44,50%.

Muito bom, obrigado por compartilhar!