Original Article: Bayesian Source Separation
Author: Rowe


Rowe, D.B. (2003). Estatísticas Bayesianas Multivariadas: Modelos para Separação de Fontes e Unmixing de Sinal.

The Reverend

Thomas Bayes

Separação Bayesiana de Fontes

Há muitos problemas em muitas disciplinas como acústica, EEG, MEG, fMRI, Radar e Vigilância que podem ser lançados como o problema de separação de fonte (SS). Qualquer sinal que se acredita ser constituído por uma combinação linear de sinais elementares é um problema SS. O problema da separação da fonte do mundo real é mais difícil do que parece à primeira vista. Primeiro, o problema é descrito assumindo que o processo de mistura é instantâneo e constante ao longo do tempo. Uma solução estatística bayesiana é então descrita. Estes pressupostos são subsequentemente atenuados com um modelo e uma probabilidade descrevendo componentes de fonte correlacionados e vetores com atrasos de mudança. Uma solução estatística bayesiana é descrita. Se você quiser ignorar meu trabalho específico e continuar apenas com a descrição do problema do BSS, pule as seções com asteriks.


Separação de fontes
Separação Bayesiana de Fontes



Separação de fontes
O
baseia-se em estatísticas Bayesianas Multivariadas: Modelos para Separação de Fontes e Unmixing de Sinal por Rowe. O problema abordado pela separação de fonte é o de separar sinais de fonte não observáveis ou latentes quando se observam sinais mistos. Em outras palavras, para tomar um conjunto de vetores de sinais mistos observados e desmembrá-los ou separá-los em um conjunto de vetores de sinal de fonte verdadeiramente não observáveis.

Introdução

Cocktail Party

Para
motivar o modelo de separação de fontes, considerar o contexto do clássico "Cocktail Party" problema. Em um coquetel, há p microfones que gravar ou observar m partygoers ou alto-falantes em n incrementos de tempo. As conversas observadas consistem em misturas de verdadeiras conversas. O problema é unmix ou recuperar as conversas originais das conversas misturadas gravadas. Um determinado microfone Calrad 500c Microphone não está colocado em uma determinada boca de alto-falantes e não está protegido dos outros alto-falantes. Party
Cada microfone registra uma mistura de todos os alto-falantes.

Mixing Process


Em
outras palavras, estaremos registrando (observando) vetores de sinal misto p-dimensional xi=(xi1,...,xip)' e o objetivo é separar ou unmix esses vetores de sinal observados nos vetores de sinal fonte subjacentes verdadeiros m-dimensionais (componente), si=(si1,...,sim)' onde i = 1, ..., n são os incrementos de tempo. A figura abaixo mostra visualmente a idéia com as conversas dos alto-falantes verdadeiros na primeira coluna, os microfones observaram conversas na coluna do meio e as conversas dos alto-falantes não misturados na última coluna. Observe que existem m = 4 alto-falantes e p = 3 microfones. Observamos a coluna do meio (as gravações do microfone) e queremos a primeira coluna (as conversas originais). A partir das gravações obtemos estimativas das conversas originais (a última coluna). Este é o processo de unmixing.

True, Mixed, and Unmixed Signals


Varios
abordagens com variações têm sido empregadas para tentar resolver o mundo real coquetel problema. O mais popular parece ser análise de componentes independentes (ICA). Infelizmente, o ICA tem pouca promessa em resolver o problema do cocktail. Em um coquetel, os alto-falantes são geralmente divididos em pequenos grupos de conversa. Veja a foto de um coquetel acima. Dentro de cada um desses grupos, os festeiros não estão falando de forma independente. Os partygoers estão falando em uma maneira obviamente correlacionada. Uma pessoa é usuall falando em um determinado momento em um grupo. A suposição de independência na ICA phohibits este fato óbvio. ICA assume que cada pessoa é babbeling sem consideração para as outras pessoas. Ou seja, a ICA modela o caso em que entramos em uma sala, pressiona play em m gravadores e grava em p microfones. A abordagem bayesiana de Rowe parece ser a mais promissora na resolução do verdadeiro problema do coquetel. Ele permite que os alto-falantes dependentes.

O
modelo de separação geral de fontes é

(xi|si,m) = f(si|m) + εi ,
(p x 1) (p x 1) (p x 1)

onde f(si|m) e uma função que mistura os sinais de origem e εi e o erro de medição. Usando uma expansão da série de Taylor, a função f, com suposições apropriadas pode ser expandida sobre o vetor c e escrita como

f(si|m) = f(c) + f'(c)(si - c) + · · ·

e tomando os dois primeiros termos, aproximados por

f(si|m) = f(c) + f'(c) (si - c)
f'(si|m) = [f(c) - f'(c) c] + f'(c) si
f(si|m) = µ + Λ si

onde f '(c) and Λ são matrizes p x m. Este é o modelo de síntese linear. Mais formalmente, o modelo adotado é

(xi|µ,Λ,si,m) = µ + Λ si + ε i ,
(p x 1) (p x 1) (p x m) (m x 1) (p x 1)

onde
µ = a p-vetor da média da população não observada dimensional, µ = (µ1,...,µp)';
Λ = a p x m matrix Λ=(λ1',...,λp')';
si = o ith m-dimensional vetorial não observável, si =(si1,...,sim)'; and
εi = o p-dimensional de erros ou de ruído dos ith vetor de sinal observado εi = (εi1,..., εip)'.
O
sinal misto observado xij e o jth elemento do vector de sinal misto observado i, que pode ser pensado como o sinal de conversação misturado gravado no incremento de tempo i, i=1,...,n para microfone j, j=1,...,p. o sinal observado xij e uma mistura dos componentes ou verdadeiras conversas de sinal de fonte não observadas si com erro, no incremento de tempo i, i=1,...,n. O sinal de fonte não observado sik e o kth componente do vetor fonte i não observado, que pode ser pensado como a conversa de sinal de fonte não observada do falante k, k=1,...,m no incremento de tempo i, i=1,...,n.
O
modelo descreve o processo de mistura escrevendo o sinal observado xij Como a soma de uma parte média global µj mais uma combinação linear os componentes de sinal de fonte não observados sik e o erro de observação εij como

(xijj, λj,si,m) = µj + Σk=1m λjk sik + εij
= µj + λj' si + εij.

O
problema na mão é unmix as fontes não observadas. O acima foi uma descrição muito genérica do problema BSS.