LeGauss: Multiplicando inteiros com Fast Fourier Transform

Aviso: O objetivo destas notas não é fornecer um algoritmo para multiplicar inteiros e, sim, explanar de maneira concisa (e não muito detalhada) o embasamento teórico desta aplicação do FFT.

Você pode entender os computadores modernos simplesmente como grandes e poderosas calculadoras. A capacidade de memória e a velocidade com que estas máquinas realizam cálculos gigantescos é realmente incrível. Por trás disso tudo, existe muita matemática e engenharia. Se você já procurou entender como que um computador realiza seus cálculos, deve ter notado que existem ideias simples e geniais por trás de seus algoritmos.

Mesmo assim, o advento da criptografia RSA (só para dar um exemplo), exigiu que pudéssemos trabalhar com números inteiros muito grandes. Muito grandes mesmo! Para ter uma ideia, dê uma olhada na lista dos maiores primos de Mersenne conhecidos atualmente e você terá uma noção da ordem de grandeza destes números. Estamos falando de milhões de dígitos. A coisa é tão feia que, para esrever um programa que realize operações com estes números, é preciso utilizar uma biblioteca especial (existem várias bibliotecas com este propósito).

Mas o problema é mais em baixo. Multiplicar dois números é um processo extremamente custoso para um computador! Acredite, se você utilizar um algoritmo comum para multiplicar dois números com a ordem de grandeza mencionada anteriormente, terá que esperar sentado durante um bom tempo. Vamos entender mais ou menos o porquê.

Sejam $\inline a=a_0+a_1d + a_2d^2 + \ldots + a_{n-1}d^{n-1}$ e $\inline b=b_0+b_1d + b_2d^2 + \ldots + b_{n-1}d^{n-1}$ dois inteiros de $\inline n$ dígitos, representados na base $\inline d\in\mathbb{N}$ (usualmente, num computador, $\inline d=2$ ). De forma geral, o produto de $\inline a$ por $\inline b$ é dado por

$a\cdot b=\sum\limits_{j=0}^n\sum\limits_{i=0}^j a_ib_{j-i}d^j\text{.}$

Assim, para computar o produto $\inline a\cdot b$ temos de realizar cerca de $\inline n^2$ (isto é $\inline \mathcal{O}(n^2)$ ) multiplicações entre os coeficientes da representação de $\inline a$ e $\inline b$ na base $\inline d$ e depois somá-las da forma adequada. Assim, efetuar o produto "usual'' entre dois inteiros num computador se torna um processo extremamente lento quando $\inline n$ é grande. Para contornar esta situação vamos apresentar a matemática por trás de um algoritmo para multiplicar inteiros cuja complexidade é da ordem de $\inline n\cdot \log(n)$ . Existem outros algoritmos, mas este é um dos melhores.

Para compreender o que segue você precisará saber (se você não sabe, o Google sabe, use-o!):

Álgebra Linear. Por exemplo, você deve saber o que é uma Matriz de Vandermonde, ortogonalidade e produto interno de vetores com entradas em $\inline \mathbb{C}$ .
Raízes da unidade.
Complexidade de algoritmos (pouca coisa, basicamente só saber o que é Big O).

Lema. Dados $\inline n+1$ pontos em $\inline \mathbb{C}^2$ com abscissas distintas, só existe um único polinômio $\inline p(X)\in \mathbb{C}[X]$ de grau $\inline n$ tal que o gráfico $\inline Y =p(X)$ passa por estes pontos.

Demonstração. Expresse os $\inline n$ pontos como solução de um sistema linear onde as incógnitas são os coeficientes do polinômio. A matriz deste sistema será uma Matriz de Vandermonde invertível. $\inline \square$

Em outras palavras, dados $\inline x_0,x_1,\ldots,x_n\in \mathbb{C}$ , o lema acima nos diz que, se conhecemos $\inline p(x_i)$ com $\inline i=0,\ldots,n$ , para um polinômio $\inline p(X)\in \mathbb{C}[X]$ de grau $\inline n$ , então, de alguma forma, conhecemos os coeficientes de $\inline p(X)$ Resta saber que pontos escolher. Esta é a ideia central da Transformada Discreta de Fourier (FFT).

Seja $\inline \omega=e^{\frac{2\pi i}{N}}$ , $\inline N\in \mathbb{N}$ . Definimos a matriz $\inline F_{N}$ por

$F_N=F_N(\omega)=\left(\begin{array}{lllll} 1 & 1 & 1 & \cdots & 1 \\ 1 & \omega &\omega^2 & \cdots &\omega^{N-1} \\ 1 & \omega^2 &\omega^4 & \cdots &\omega^{2(N-1)} \\ \vdots & \vdots &\vdots & \ddots &\vdots \\ 1 & \omega^{N-1} &\omega^{2(N-1)} & \cdots &\omega^{(N-1)^2} \end{array}\right)\text{.}$

No lema seguinte, se $\inline M$ é uma matriz complexa, $\inline M^*$ denota a transposta conjugada de $\inline M$ (isto é, a matriz adjunta).

Lema. A matriz complexa $\inline F_N$ como definida acima é uma matriz ortogonal. Além disso, $\inline F_N^{-1}=\frac{1}{N}F_N^*$ .

Demonstração. Primeiramente, note que

$\overline{e^{i\theta}}=\overline{\cos \theta + i\sin \theta}=\cos \theta - i\sin \theta=\cos(-\theta) + i\sin(-\theta)=e^{-i\theta}\text{.}$

Denote a coluna $\inline k$ de $\inline F_N$ por $\inline C_k$ . Se $\inline k\ne l$ , então $\inline C_l^*\cdot C_k$ é dado por

$1 + \omega^{k-l} + (\omega^{k-l})^2 + \cdots + (\omega^{k-l})^{N-1} = \frac{1-(\omega^{k-l})^N}{1-\omega^{k-l}}=0\text{,}$

pois $\inline (\omega^{k-l})^N=(\omega^N)^{k-l}=1$ . Note que o denominador $\inline 1-\omega^{k-l}\ne 0$ pois $\inline k\ne l$ . Por outro lado, $\inline C_k^*\cdot C_k=1+ \cdots +1=N$ . $\inline \square$

A multiplicação de inteiros pelo FFT consiste em escolher uma base $\inline d$ para representar estes inteiros e interpretar os dígitos como coeficientes de um polinômio. Digamos então que nossos inteiros são representados por $\inline f(X)$ e $\inline g(X)$ e realizamos a multiplicação $\inline f(X)\cdot g(X)=h(X)$ . Com algumas ressalvas, os coeficientes de $\inline h(X)$ serão os dígitos da multiplicação dos inteiros (na realidade, os coeficientes do produto podem, eventualmente, ser maiores que a base $\inline d$ e teríamos que rearranjar os coeficientes). Suponha que o grau de $\inline h(X)$ seja menor que $\inline N$ ; para determinar $\inline h(X)$ , faremos

$h(\omega_i)=(f\cdot g)(\omega_i)=f(\omega_i)\cdot g(\omega_i)\text{,}$

para $\inline N$ $\inline \omega_i$ 's distintos. Estes $\inline \omega_i$ 's serão justamente as $\inline N$ -ésimas raízes da unidade. Se organizarmos os coeficiente de $\inline f(X)$ (recip. $\inline g(X)$ ) num vetor $\inline \textbf{f}$ (recip. $\inline \textbf{g}$ ), então avaliar o polinômio nos $\inline \omega_i$ 's é o mesmo que realizar a multiplicação

$F_N\cdot \textbf{f}\text{.}$

A priori faremos $\inline N^2$ multiplicações novamente, mas o truque consiste em fatorar $\inline F_N$ de forma a realizar menos multiplicações, é exatamente a isto que damos o nome de Transformada Rápida de Fourier (ou FFT, em inglês).

Antes de exibirmos a fatoração, façamos algumas definições. Para $\inline N\in \mathbb{N}$ , denotaremos por $\inline P_N$ a matriz de permutação que, aplicada num vetor, posiciona todas as coordenadas ímpares nas primeiras entradas e depois as pares, isto é

$P_N\cdot(x_1\; x_2\; \cdots\; x_N)^T = (x_1\; x_3\; \cdots\; x_2\; x_4\; \cdots)^T\text{.}$

Por exemplo, para $\inline N=4$ , a matriz $\inline P_N$ é da forma

$P_4=\left(\begin{array}{cccc} 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 1 \end{array}\right)\text{.}$

Se $\inline N$ é par, e $\inline F_N=F_N(\omega)$ é como acima (isto é, $\inline \omega=e^{\frac{2\pi i}{N}}$ ), definimos

$F_{\frac{N}{2}}=F_{\frac{N}{2}}(\omega^2)\text{.}$

Feito isto, temos o grandioso

Teorema. Seja $\inline \omega=e^{\frac{2\pi i}{N}}$ e $\inline N=2^n$ , para algum $\inline n\in \mathbb{N}$ , então

$F_N= \left(\begin{array}{cr} I_{\frac{N}{2}} & D_{\frac{N}{2}} \\ I_{\frac{N}{2}} & -D_{\frac{N}{2}} \\ \end{array}\right) \left(\begin{array}{cc} F_{\frac{N}{2}} & 0 \\ 0 & F_{\frac{N}{2}} \\ \end{array}\right) P_N\text{,}$

onde $\inline I_{\frac{N}{2}}$ é a matriz identidade de ordem $\inline \frac{N}{2}$ e

$D_{\frac{N}{2}}= \left(\begin{array}{ccccc} 1 & & & & \\ & \omega & & & \\ & & \omega^2 & & \\ & & & \ddots & \\ & & & & \omega^{\frac{N}{2}-1} \end{array}\right)\text{.}$

Demonstração. Seja $\inline \textbf{x}=(a_0\; \cdots\; a_{N-1})^T$ , com $\inline a_i\in \mathbb{C}$ . Vamos mostrar que

$F_N\cdot \textbf{x}= \left(\begin{array}{cr} I_{\frac{N}{2}} & D_{\frac{N}{2}} \\ I_{\frac{N}{2}} & -D_{\frac{N}{2}} \\ \end{array}\right) \left(\begin{array}{cc} F_{\frac{N}{2}} & 0 \\ 0 & F_{\frac{N}{2}} \\ \end{array}\right) P_N\cdot \textbf{x}\text{.}$

Multiplicando $\inline P_N$ por $\inline \textbf{x}$ , obtemos

$\textbf{y}=P_N\cdot \textbf{x}=(a_0\; a_2 \; \cdots \; a_1\; a_3\;\cdots)^T\text{.}$

Agora, se $\inline p(X)=a_0 + a_2X^2 + \cdots +a_{N-2}X^{N-2}$ e $\inline q(X)=a_1X + a_3X^3 + \cdots + a_{N-1}X^{N-1}$ , então

$\textbf{z}=\left(\begin{array}{cc} F_{\frac{N}{2}} & 0 \\ 0 & F_{\frac{N}{2}} \end{array}\right)\cdot \textbf{y} = \left(\begin{array}{c} p(1) \\ p(\omega) \\ p(\omega^2)\\ \cdots \\ q(1) \\ q(\omega)\omega^{-1}\\ q(\omega^2)\omega^{-2}\\ \cdots \end{array}\right)\text{.}$

Por fim, se $\inline f(X)=p(X)+q(X)$ , então (note que $\inline \omega^{\frac{N}{2}}=-1$ e, assim, $\inline \omega^{\frac{N}{2}+k}=-\omega^k$ )

$\left(\begin{array}{cr} I_{\frac{N}{2}} & D_{\frac{N}{2}} \\ I_{\frac{N}{2}} & -D_{\frac{N}{2}} \end{array}\right)\cdot \textbf{z}= \left(\begin{array}{c} p(1) +q(1) \\ p(\omega) + q(\omega) \\ p(\omega^2) + q(\omega^2)\\ \cdots \\ p(1) -q(1) \\ p(\omega) -q(\omega)\\ p(\omega^2)-q(\omega^2)\\ \cdots \end{array}\right)= \left(\begin{array}{c} f(1) \\ f(\omega) \\ f(\omega^2)\\ \cdots \\ f(\omega^{\frac{N}{2}}) \\ f(\omega^{\frac{N}{2}+1})\\ f(\omega^{\frac{N}{2}+2})\\ \cdots \end{array}\right) \text{.}$ $\inline \square$

Observação 1. Talvez você tenha notado que, para a demonstração deste teorema, não precisamos do fato de $\inline N$ ser uma potência de 2, bastaria que fosse um número par. Isto realmente não é necessário para esta demonstração. Porém, na prática, o algoritmo é repetido diversas vezes e o tamanho das matrizes é sempre dividido pela metade, assim, sempre trabalhamos com alguma potência de 2 suficientemente grande.

Observação 2. Para sentir como funciona a coisa, tente fazer um exemplo para $\inline N=4$ . Isto é, monte a matriz $\inline F_4$ (neste caso $\inline \omega=e^{2\pi i/4}=i$ ) e depois fatore ela segundo o teorema acima.

Em princício, para multiplicar $\inline F_N$ por um vetor temos de realizar $\inline N^2$ multiplicações. Mas, após fatorar $\inline F_N$ , temos agora que realizar apenas

$2\cdot \left(\frac{N}{2}\right)^2 + \frac{N}{2}$

multiplicações, pois não precisamos contar a matriz de permutação, nem as matrizes identidade, e $\inline D_{\frac{N}{2}}$ só precisa ser contada uma vez. O próximo passo seria repetir um processo análogo e fatorar as duas matrizes $\inline F_{\frac{N}{2}}$ . Como $\inline N$ é uma $\inline n$ -ésima potência de 2, podemos repetir esta fatoração $\inline n$ vezes e, assim, reduzimos drasticamente o número de multiplicações, como mostrará o teorema a seguir. É isso que torna o FFT um algoritmo tão eficiente.

Teorema. Nas condições do teorema acima, o número de multiplicações realizadas é $\inline \mathcal{O}(N\cdot \log_2N)$ .

Demonstração. Na realidade, após realizar o processo $\inline n$ vezes (este $\inline n$ não é arbitrário, lembre que $\inline N=2^n$ ) faremos exatamente $\inline \frac{1}{2}N\log_2 N$ multiplicações. Existem diversas formas de realizar este cálculo. Aqui, vou utilizar o jeito mais ingênuo possível. Começamos com $\inline N^2$ multiplicações. Seja $\inline t_k$ o número de multiplicações realizadas após fatorarmos $\inline k$ vezes. Assim,

[1ª interação] $\inline t_1=2\left(\frac{N}{2}\right)^2 + \frac{N}{2}$
[2ª interação] $\inline t_2=2\left(2\left(\frac{N}{4}\right)^2+\frac{N}{4}\right) + \frac{N}{2}$
[3ª interação] $\inline t_3=2\left(2\left(2\left(\frac{N}{8}\right)^2+\frac{N}{8}\right)+\frac{N}{4}\right) + \frac{N}{2}$
...

Já dá para ter uma ideia do que está acontecendo. Por indução, é fácil mostrar que $\inline t_k=2^k\left(\frac{N}{2^k}\right)^2 + k\frac{N}{2}$ . Iremos parar justamente na $\inline n$ -ésima interação, pois estamos sempre dividindo $\inline N=2^n$ por $\inline 2^k$ . Logo

$t_n=2^n\left(\frac{N}{2^n}\right)^2 + n\frac{N}{2}=2^n+n\frac{N}{2}=N+n\frac{N}{2}=N+\log_2 N\cdot\frac{N}{2}\text{.}$

Opa, algo está errado, não chegamos ao que queríamos! Mas a conta está certa; o fato é que, depois de realizarmos $\inline n$ operações, a matriz dos $\inline F_i$ 's será uma matriz identidade, pois, no final, teremos somente $\inline F_1=(1)$ em todas as entradas da diagonal. No entanto, $\inline t_n$ está contando esta matriz, mas é claro que não precisamos contá-la, pois ela não faz nada. Logo a complexidade final é dada por $\inline t_n-N=\frac{N}{2}\log_2 N$ . $\inline \square$

O próximo problema seria achar a tranformada inversa, ou seja, obter os coeficientes do polinômio resultante da multiplicação. Em geral, inverter uma matriz é um processo custoso, mas inverter $\inline F_N$ é fácil, pois um dos primeiros lemas acima nos garante que ela é ortogonal e, mais que isso, sua inversa é dada por $\inline \frac{1}{N}F_N^*$ . Como sabemos fatorar $\inline F_N$ de forma eficiente, realizamos um processo análogo para fatorar a sua transposta conjugada e, assim, obter a multiplicação de dois inteiros numa velocidade de ordem $\inline N\cdot \log(N)$ .

Isto é tudo. A Transformada Discreta de Fourier tem inúmeras outras aplicações que, por hora, fogem do propósito deste post. Se você se interessou e quer saber um pouco mais sobre o assunto, seguem alguns links (todos em inglês): Video Aula sobre FFT de Gilbert Strang, Discrete Fourier Transform, Fast Fourier Transform, Livro online sobre Transformada Discreta de Fourier.

Referências:

- "Introduction to Linear Algebra'', Gilbert Strang.
- "Primos de Mersenne (e outros primos muito grandes)'', Carlos Gustavo T.A. Moreira e Nicolau C. Saldanha.

6 comentários:

Gabriel Martins disse...: Post legal =P
Sempre que eu multiplico inteiros de cabeça eu uso a FFT (ou não) xD; 10 de julho de 2010 às 23:58
Anônimo disse...: Eu gostei deste artigo já tinha visto a coisa antes mas este aí está bem explicado.; 12 de julho de 2010 às 23:43
Anônimo disse...: correção: deveria ter usado "este aqui" ou "esse aí" o que eu escrevi antes foi tenso... que se dane!; 12 de julho de 2010 às 23:46
Luiz Fellipe disse...: Espetacular sua explicação.; 27 de novembro de 2010 às 00:44
Andre Regis disse...: Olá. Parabéns pela explicação. No entanto, ainda me resta uma dúvida. Quando trabalhamos com softwares tipo MATLAB ou SciLab, ao calcularmos a fft, multiplicamos por um valor 2/N, onde N é o número de amostras para que o resultado das amplitudes sejam verdadeiros. Pela demonstração acima, os valores são multiplicados por Nlog(N). Então, o resultado não deveria ser divido por este valor? Poderia me ajudar a entender? Obrigado.; 13 de maio de 2014 às 16:10
Ítalo disse...: Muito interessante! Principalmente porquê quero especializar-me em Processamento de Sinais e Robótica. :); 28 de abril de 2015 às 22:23

Postar um comentário

sábado, 10 de julho de 2010

Multiplicando inteiros com Fast Fourier Transform - FFT

6 comentários: