Contenido principal
Curso: Cálculo multivariable > Unidad 3
Lección 4: Optimizar funciones multivariables (artículos)Razonamiento detrás del criterio de la segunda derivada
Para aquellos de ustedes que quieran ver por qué funciona la segunda derivada parcial, aquí está un bosquejo de una demostración.
Antecedentes
En el último artículo, dimos las bases para el criterio de la segunda derivada parcial, pero fue solo una idea intuitiva vaga de por qué es cierta. Este artículo es para aquellos que quieran indagar un poco más en las matemáticas, pero no es estrictamente necesario si solo quieres saber aplicar ese criterio.
Qué vamos a construir
- Para probar si un punto crítico de una función multivariable es un mínimo o máximo local, examina la aproximación cuadrática de la función en ese punto. Es más fácil analizar si esta aproximación cuadrática tiene máximos y mínimos.
- Para funciones de dos variables, esto se reduce al estudio de una expresión que tiene este aspecto:
Estas se conocen como formas cuadráticas. La regla para saber cuándo una forma cuadrática es siempre positiva o siempre negativa se traduce directamente al criterio de la segunda derivada parcial.
Caso de una variable mediante aproximación cuadrática
En primer lugar, seguiremos el razonamiento formal de por qué funciona el criterio de la segunda derivada para una sola variable. Por formal, nos referimos a captar la idea de concavidad con un argumento preciso.
En el cálculo de una sola variable, cuando para alguna función y algún valor de entrada , el criterio de la segunda derivada nos dice que:
tiene un máximo local en si . tiene un mínimo local en si .- Si
, la segunda derivada no es suficiente para determinar si tiene un máximo, un mínimo o un punto de inflexión en .
Para pensar por qué funciona esta prueba, empieza por aproximar la función con un polinomio de Taylor hasta el término cuadrático, que también se conoce como una aproximación cuadrática.
Puesto que , esta aproximación cuadrática se simplifica así:
Observa que para todos los valores posibles de , pues los términos cuadráticos siempre son cero o positivos. ¡Ese simple hecho nos dice todo lo que necesitamos saber! ¿Por qué?
Porque cuando , podemos leer nuestra aproximación así:
Por lo tanto, es un mínimo local de nuestra aproximación. De hecho es un mínimo global, pero eso no nos importa. Cuando la aproximación cuadrática de una función tiene un mínimo local en algún punto, la función misma debe tener un mínimo local en ese lugar. Hablaremos más sobre esto en la última sección; pero por ahora la intuición debe ser clara, pues la función y su aproximación se "abrazan" la una a la otra alrededor del punto de aproximación .
Similarmente, si , podemos leer la aproximación como
En este caso, la aproximación tiene un máximo local en , lo que indica que la función misma también tiene un máximo local ahí.
Cuando , nuestra aproximación cuadrática siempre es igual a la constante , lo que significa que nuestra función es en algún sentido demasiado plana para ser analizada solamente con la segunda derivada.
Qué se obtiene de todo esto:
Cuando , determinar si tiene un máximo o un mínimo local en se reduce a estudiar si el signo del término cuadrático de la aproximación de Taylor, , es positivo o negativo.
Caso de dos variables: calentamiento visual
Ahora considera una función con dos entradas y una salida, que tiene un punto crítico. Esto es, un punto donde ambas derivadas parciales son ,
que de manera compacta se escribe como
Para determinar si este punto es un máximo local, un mínimo local o ninguno de los dos, examinamos su aproximación cuadrática. Empecemos con una vista previa de lo que queremos hacer:
tendrá un mínimo local en el punto crítico si la aproximación cuadrática en el punto es un paraboloide cóncavo hacia arriba. tendrá un máximo local allí si la aproximación cuadrática es un paraboloide cóncavo hacia abajo:- Si la aproximación cuadrática tiene forma de silla,
no tiene ni un máximo ni un mínimo, sino un punto silla. - Si la aproximación cuadrática es horizontal en alguna o todas las direcciones, no tenemos suficiente información para sacar conclusiones sobre
.
Análisis de la aproximación cuadrática
La fórmula para la aproximación caudrática de , en forma de vector, se ve así:
Ya que nos interesan los puntos donde el gradiente es cero, podemos deshacernos de ese término del gradiente
Para ver los detalles del caso de dos variables, expandamos el término hessiano,
(Nota: si sientes que esta aproximación o algo de la notación es extraña o poco familiar, considera revisar el artículo sobre aproximaciones cuadráticas).
Como mostramos en el caso de una sola variable, la estrategia es estudiar si el término cuadrático de esta aproximación es siempre positivo o siempre negativo.
Por lo pronto, escribir este término es tedioso, pero podemos destilar su esencia si estudiamos expresiones de la siguiente forma:
Tales expresiones se llaman usualmente "formas cuadráticas".
- La palabra "cuadrática" indica que los términos son de segundo orden, o sea que involucran el producto de dos variables.
- La palabra "forma" en este contexto es desconcertante, y hace que la idea de una forma cuadrática suene más complicada de lo que realmente es. Los matemáticos dicen "forma cuadrática" en vez de "expresión cuadrática" para enfatizar que todos los términos son de orden
, y que no hay términos lineales o constantes enredando la expresión. Adoptar una frase como "expresión puramente cuadrática" habría sido mucho más razonable y comprensible.
Para hacer la notación de las formas cuadráticas más fácil de generalizar a dimensiones más altas, a menudo las escribimos con respecto a la matriz simétrica
He aquí la pregunta crucial:
- ¿Cómo podemos determinar si la expresión
es siempre positiva, siempre negativa o ninguna de las dos, con solo estudiar las constantes , y ?
Análisis de las formas cuadráticas
Si sustituimos un valor constante para , obtenemos la función cuadrática de una sola variable:
La gráfica de esta función es una parábola, y solo cruzará el eje si esta función cuadrática tiene raíces reales.
De lo contrario, la función es siempre positiva o siempre negativa, dependiendo del signo de .
Podemos aplicar la fórmula cuadrática a esta expresión para ver si sus raíces son reales o complejas.
- El término principal es
. - El término lineal es
. - El término constante es
Aplicar la fórmula cuadrática se ve así:
Si , la parábola tiene una raíz doble en , lo que significa que apenas toca al eje en ese punto. En otro caso, el que las raíces sean reales depende solamente del signo de la expresión .
- Si
, existen dos raíces reales, y la gráfica de cruza el eje . - En caso contrario, si
, no existen raíces reales, y la gráfica de es totalmente positiva o totalmente negativa.
Por ejemplo, considera el caso
En este caso, , así que la gráfica de siempre cruza al eje . He aquí un video que muestra cómo cambia la gráfica conforme dejamos que el valor de varíe lentamente.
Esto corresponde con el hecho de que la gráfica de puede ser tanto positiva como negativa.
En contraste, considera el caso
Ahora . Esto significa que la gráfica de nunca cruza el eje , aunque lo toca si la constante es cero. Aquí mostramos un video donde se ve cómo cambia la gráfica conforme dejamos que la constante varíe:
Esto corresponde con el hecho que la función multivariable siempre es positiva.
Regla para el signo de las formas cuadráticas
Como si se tratara de confundir a los estudiantes familiarizados con la fórmula cuadrática, las propiedades de las formas cuadráticas a menudo se establecen en términos de en lugar de . Ya que una expresión es el negativo de la otra, tenemos que cambiar de a . La razón por la que los matemáticos prefieren es porque este es el determinante de a matriz que describe la forma cuadrática:
Como recordatorio, así es como se ve la forma cuadrática utilizando la matriz.
Al vincular esta convención con lo que encontramos en la sección anterior, escribimos la regla del signo de una forma cuadrática de la siguiente manera:
- Si
, la forma cuadrática puede alcanzar valores positivos y negativos, y es posible que sea cero en otros valores diferentes de . - Si
, la forma es siempre positiva o siempre negativa, dependiendo del signo de , pero en ambos casos solo es igual a en .- Si
, la forma siempre es positiva, por lo que es un mínimo global de esta.
- Si
, la forma siempre es negativa, por lo que es su máximo global.
- Si
- Si
, la forma será de nuevo o siempre positiva o siempre negativa, pero ahora es imposible que sea igual a en valores distintos de .
Un poco de terminología:
Cuando para todo distinto de decimos que la forma cuadrática y su matriz asociada son positivas definidas.
Cuando para todo distinto de decimos que la forma cuadrática y su matriz asociada son negativas definidas.
Si reemplazas los signos y por y , respectivamente, las propiedades correspondientes son positiva semi-definida y negativa semi-definida.
Aplicación a
Bueno, regresando a donde comenzamos, vamos a escribir otra vez nuestra aproximación cuadrática:
La parte cuadrática de está escrita en términos de y en lugar de simplemente y , por lo que donde la regla del signo para la forma cuadrática hace referencia al punto , la aplicamos al punto .
Tal como en el caso de una sola variable, cuando la aproximación cuadrática tiene un máximo (o un mínimo) local en , significa que tiene un máximo (o un mínimo) local en ese punto. Esto quiere decir que podemos trasladar la regla del signo de una forma cuadrática directamente para obtener el criterio de la segunda derivada:
Supongamos que .
- Si
, entonces no tiene ni un mínimo ni un máximo en , sino un punto silla. - Si
, la función definitivamente tiene un máximo o un mínimo en , y debemos determinar el signo de para saber cuál de los dos es.- Si
, la función tiene un mínimo local.
- Si
, la función tiene un máximo local.
- Si
, las segundas derivadas por sí solas no nos pueden decir si tiene un máximo o mínimo local.
Nuestras herramientas actuales no son suficientes
Todo lo que presentamos aquí casi constituye una prueba completa, excepto por un paso final.
Intuitivamente, puede tener sentido que cuando una aproximación cuadrática se dobla y curva de cierta manera, la función debe doblarse y curvarse de la misma manera cerca del punto de aproximación. Pero ¿cómo formalizamos esto más allá de la intuición?
Desafortunadamente no lo haremos aquí. Para hacer rigurosos los argumentos sobre derivadas, requerimos del análisis real, columna vertebral teórica del cálculo.
Más aún, puedes estarte preguntando cómo esto se generaliza a funciones con más de dos entradas. Hay una notación para las formas cuadráticas con múltiples variables, pero enunciar la regla para cuándo tales formas son siempre positivas o negativas requiere varias ideas del álgebra lineal.
Resumen
- Para probar si un punto crítico de una función multivariable es un mínimo o máximo local, examina la aproximación cuadrática de la función en ese punto. Es más fácil analizar si esta aproximación cuadrática tiene máximos y mínimos.
- Para funciones de dos variables, esto se reduce al estudio de una expresión que tiene este aspecto:
Estas se conocen como formas cuadráticas. La regla para saber cuándo una forma cuadrática es siempre positiva o siempre negativa se traduce directamente al criterio de la segunda derivada parcial.