Diferenciabilidade
Teorema de Lagrange
Em secções anteriores relativas a funções de classe $C^k$ usámos o teorema de Lagrange para estimar diferenças de valores de uma função entre dois pontos distintos. Neste caso os dois pontos só se distinguiam numa coordenada o que permitiu usar o teorema conhecido para funções reais de variável real. Realizar estimativas para diferenças de valores de funções em pontos distintos à custa de um produto entre a "distância" entre os pontos e um majorante de uma quantidade que só depende da derivada da função num conjunto conveniente é um tema recorrente em Análise Matemática. Vamos generalizar o teorema de Lagrange de maneira a tornar possível essa e outras aplicações.
Começamos com o caso de funções escalares. Seja \(f:A\subset\mathbb{R}^n\to \mathbb{R}\) uma função diferenciável definida num aberto \(A\). Sejam \(\boldsymbol{x},\boldsymbol{y}\in A\) tais que o segmento de recta unindo \(\boldsymbol{x}\) a \(\boldsymbol{y}\) está contido em \(A\), isto é, \[L(\boldsymbol{x},\boldsymbol{y})\equiv \{\boldsymbol{x}+t(\boldsymbol{y}-\boldsymbol{x}): t\in[0,1]\}\subset A.\] Definindo \(g(t)=f(\boldsymbol{x}+t(\boldsymbol{y}-\boldsymbol{x}))\) temos, por aplicação do teorema de Lagrange a \(g\), que para algum \(\theta\in{]0,1[}\), \(f(\boldsymbol{y})-f(\boldsymbol{x})=g(1)-g(0)=g'(\theta)=\nabla f(\boldsymbol{x}+\theta(\boldsymbol{y}-\boldsymbol{x}))\cdot(\boldsymbol{y}-\boldsymbol{x})\) em que na última igualdade usámos o teorema de derivação da função composta. Obtivemos assim
Teorema do valor médio (ou de Lagrange) para funções escalares. Seja \(f:A\subset\mathbb{R}^n\to \mathbb{R}\) uma função diferenciável definida num aberto \(A\) e \(\boldsymbol{x},\boldsymbol{y}\in A\) tais que o segmento de recta \(L(\boldsymbol{x},\boldsymbol{y})\) unindo \(\boldsymbol{x}\) a \(\boldsymbol{y}\) está contido em \(A\). Então existe \(\theta\in{]0,1[}\) tal que \[f(\boldsymbol{y})-f(\boldsymbol{x})=\nabla f(\boldsymbol{x}+\theta(\boldsymbol{y}-\boldsymbol{x}))\cdot(\boldsymbol{y}-\boldsymbol{x}).\]
Hipóteses mínimas
Notamos que as nossas hipóteses são ligeiramente em excesso do mínimo estritamente necessário para obter um análogo do teorema de Lagrange. Bastaria supor que \(f\) era contínua no segmento \(L(\boldsymbol{x},\boldsymbol{y})\) e que possuía derivada dirigida \(D_{\boldsymbol{y}-\boldsymbol{x}}f\) em todos os pontos do segmento, excepto possivelmente nos extremos, para podermos estabelecer um análogo do teorema.
Para funções vectoriais primeiro notamos que a formulação de Lagrange tendo como conclusão uma igualdade similar à do caso escalar não é possível.
Exemplo. Considere-se a função \(F:\mathbb{R}\to\mathbb{R}^2\) definida por \(F(t)=(\cos t, \sen t)\). A derivada de \(F\) num ponto \(t\) é a aplicação linear \(\mathbb{R}\ni \lambda \mapsto \lambda(-\sen t, \cos t)\) e que simplesmente identificamos com o vector \((-\sen t, \cos t)\). Este vector tem sempre norma \(1\). Portanto temos \(F(2\pi)-F(0)=(0,0)\neq 2\pi(-\sen \theta, \cos \theta)=DF(\theta)(2\pi)\) para todo o \(\theta\in {\left]0,2\pi\right[}\).
Vamos então concentrar-nos em formulações alternativas que permitem estabelecer o tipo de estimativas em que estamos interessados. Começamos por estabelecê-las no caso escalar. Do teorema e da desigualdade de Cauchy-Schwarz obtém-se facilmente:
Corolário. Seja \(f:A\subset\mathbb{R}^n\to \mathbb{R}\) uma função diferenciável definida num aberto \(A\) e \(\boldsymbol{x},\boldsymbol{y}\in A\) tais que o segmento de recta \(L(\boldsymbol{x},\boldsymbol{y})\) unindo \(\boldsymbol{x}\) a \(\boldsymbol{y}\) está contido em \(A\). Então \[\left|f(\boldsymbol{y})-f(\boldsymbol{x})\right|\leq \sup_{\theta\in {]0,1[}}\|\nabla f(\boldsymbol{x}+\theta(\boldsymbol{y}-\boldsymbol{x}))\|\|\boldsymbol{y}-\boldsymbol{x}\|.\]
Vai ser este o tipo de resultado que vamos generalizar para termos um teorema do valor médio para funções vectoriais. A ideia de base para obtê-lo é a mesma. Consideramos uma função escalar auxiliar a que aplicamos o teorema de Lagrange. Seja \(\boldsymbol{a} \in \mathbb{R}^m\) um vector a escolher posteriormente e \(F:A\subset\mathbb{R}^n\to\mathbb{R}^m\) uma função diferenciável, \(A\) um aberto, \(\boldsymbol{x}, \boldsymbol{y}\in A\), \(L(\boldsymbol{x}, \boldsymbol{y})\subset A\). Define-se \(g(t)=\boldsymbol{a}\cdot F(\boldsymbol{x}+t(\boldsymbol{y}-\boldsymbol{x}))\). Aplica-se o teorema de Lagrange a \(g\) no intervalo \([0,1]\) para obter que existe \(\theta\in{\left]0,1\right[}\) tal que \[\boldsymbol{a}\cdot(F(\boldsymbol{y})-F(\boldsymbol{x}))=\boldsymbol{a}\cdot (DF(\boldsymbol{x}+\theta(\boldsymbol{y}-\boldsymbol{x}))(\boldsymbol{y}-\boldsymbol{x})).\] Tomando \(\boldsymbol{a}=F(\boldsymbol{y})-F(\boldsymbol{x})\), aplicando a desigualdade de Cauchy-Schwarz e estimando a imagem de uma aplicação linear por um vector de forma análoga ao que já fizemos atrás, obtém-se uma estimativa da forma pretendida
Teorema do valor médio ou de Lagrange para funções vectoriais. Sejam \(F:A\subset\mathbb{R}^n\to\mathbb{R}^m\) uma função diferenciável, \(A\) um aberto, \(\boldsymbol{x}, \boldsymbol{y}\in A\), \(L(\boldsymbol{x}, \boldsymbol{y})\subset A\). Então \[\|F(\boldsymbol{y})-F(\boldsymbol{x})\|\leq \sup_{\theta\in]0,1[} \|DF(\boldsymbol{x}+\theta(\boldsymbol{y}-\boldsymbol{x}))(\boldsymbol{y}-\boldsymbol{x})\|.\] Fim do enunciado do teorema.
Uma estimativa mais explícita, não envolvendo determinar o supremo dos valores de uma aplicação linear mas sim o supremo de derivadas parciais, também é possível.
Corolário. Sejam \(F:A\subset\mathbb{R}^n\to\mathbb{R}^m\) uma função diferenciável, \(A\) um aberto, \(\boldsymbol{x}, \boldsymbol{y}\in A\), \(L(\boldsymbol{x}, \boldsymbol{y})\subset A\). Então existe uma contante, só dependente de \(m\) e \(n\), \(C(m,n)>0\), tal que \[\|F(\boldsymbol{y})-F(\boldsymbol{x})\|\leq C(m,n) \sup_{ i=1,\dots,m,\; j=1,\dots,n}\sup_{\theta\in]0,1[}\left|\frac{\partial F_i}{\partial x_j}(\boldsymbol{x}+\theta(\boldsymbol{y}-\boldsymbol{x}))\right|\|\boldsymbol{x}-\boldsymbol{y}\|.\]
No caso de $F\in C^1(A)$ com $A$ aberto e aplicando o teorema de Weierstrass aplicado às derivadas parciais de $F$ obtém-se
Corolário (Funções $C^1$ são localmente lipschitzianas). Seja $A\subset\mathbb{R}^n$ um aberto e $F:A\to \mathbb{R}^m$ tal que $F\in C^1(A)$. Então para cada limitado e fechado $\omega\subset A$ existe $C(\omega)\gt 0$ tal que \[\left\|F(\boldsymbol{x})-F(\boldsymbol{y})\right\|\leq C(\omega) \|\boldsymbol{x}-\boldsymbol{y}\|.\]
No título do corolário usámos uma designação usada em Análise Matemática para funções verificando este tipo de desigualdades. Em geral:
Definição (Funções lipschitzianas). Seja $F:A\subset\mathbb{R}^n\to \mathbb{R}^m$ uma função tal que existe $C\gt 0$ verificando \[\left\|F(\boldsymbol{x})-F(\boldsymbol{y})\right\|\leq C \|\boldsymbol{x}-\boldsymbol{y}\|\] para todos os $\boldsymbol{x}, \boldsymbol{y}\in A$. Então $F$ diz-se lipschitziana em $A$ e $C$ é designada por constante de Lipschitz de $F$.
Note que a constante de Lipschtz de $F$ não é única. De facto determinar a melhor, isto é, a menor constante de Lipschiz possível é, em geral, um problema não trivial.
Definição (Funções localmente lipschitzianas). Seja $F:A\subset\mathbb{R}^n\to \mathbb{R}^m$ uma função tal que para cada $\omega\subset\mathbb{R}^n$ limitado e fechado existe $C(\omega)\gt 0$ verificando \[\left\|F(\boldsymbol{x})-F(\boldsymbol{y})\right\|\leq C(\omega) \|\boldsymbol{x}-\boldsymbol{y}\|\] para todos $\boldsymbol{x}, \boldsymbol{y}\in A\cap \omega$. Então $F$ diz-se localmente lipschitziana em $A$ e $C(\omega)$ é uma constante de Lipschitz relativa $F$ em $A\cap \omega$.
Exercício. Justifique que $\mathbb{R}\ni x\mapsto x^2$ é localmente lipschiziana mas não é lipschitziana.
Última edição desta versão: João Palhoto Matos, 27/01/2022 11:44:25.