martes, 8 de diciembre de 2020

Notación "Big Oh" (O Grande)

 Ahora que ya conocemos, sin problema, lo que quiere decir la afirmación que hizo Riemann respecto a su famosa hipótesis, intentaremos ir un poco más allá. Con nuestros limitados conocimientos estamos intentando lidiar con matemáticas de altura, por eso de vez en cuando iremos introduciendo conceptos nuevos de una manera lo más sencilla posible.

En esta ocasión vamos a hablar de la notación denominada Big Oh. Realmente en todo lo que he leído la he visto referenciada así, en inglés, y no estaba seguro de que se emplease habitualmente su traducción al español. Pues sí, también se utiliza normalmente la denominación O Grande.

Dicen que el gran matemático húngaro Pál Turán cuando estaba a punto de morir enfermo de cáncer en 1976, según su esposa, las últimas palabras que pronunció fueron: "O Grande de uno.." ¡Qué gran admiración produjo esto en el mundo de las matemáticas! ¡Ese sí que era un matemático de raza, haciendo teoría de números hasta su último suspiro!

Pál Turán

Según se dice O Grande entró en el mundo de las matemáticas de la mano del famoso Edmund Landau y su libro "Handbuch der Lehre von der Verteilung der Primzahlen" cuya traducción sería algo así como "Manual de enseñanza sobre la distribución de los números primos". A cualquier matemático que preguntes te dirá que esto es así, pero quien realmente introdujo esta anotación fue Paul Bachmann en su tratado "Die Analytische Zahlentheorie" es decir "Teoría Analítica de Números". Al César lo que es del César. Ahora vamos a ver qué es eso de O Grande.

Si recordáis del bachiller, una asíntota era una recta a la que la función en su camino hacia infinito se iba acercando cada vez más a ella sin llegarla a tocar nunca, es decir en el infinito. Por ejemplo:


En este caso la función tiene dos asíntotas una es en la línea (discontinua) y=1 y otra en la línea (discontinua) y=-1. Podemos ver que la función conforme crece (x cada vez es mayor) tiende a tocar la línea y=1, pero nunca lo conseguirá, cada vez estará más cerca pero sin alcanzarla. Se dice que la alcanzará en infinito. Si la función en rosa es f(x) podríamos poner con total tranquilidad f(∞)=1. Según el dibujo también es cierto que f(-∞)=-1.
Puede decirse que las asíntotas confinan a la función dentro de unos límites y de ahí no sale. En el ejemplo la función (linea de color rosa) queda confinada entre 1 y -1.
¿Qué pasaría si quien confinara a la función, en vez de ser unas rectas (asíntotas) fuera otra función? Pues que eso sería O Grande.
Si queremos hacer una definición algo más precisa y elegante podemos decir que se trata de una función que sirve de cota superior asintótica a otra función cuando el argumento tiende a infinito.
Con este dibujo lo vamos a ver más claro:


Aquí vemos que f(x) es O Grande de la función g(x). Es decir que conforme x se hace cada vez más grande, tiende a infinito, f(x) siempre es menor que g(x). Esto se expresaría como f(x)= 𝓞(g(x))
Pero el dibujo nos revela algunas propiedades de esta notación.
Aquí se ha puesto c (una constante) porque en realidad el crecimiento de g(x) será más rápido que el de f(x) para cualquier número c por el que multipliquemos g(x), ya que al hablar de crecimiento estamos hablando de derivada y las constantes no la afectan. Por lo tanto si no nos queremos liar demasiado en estas definiciones, podemos suponer que c=1.
También es importante notar que si g(x) confina a f(x), -g(x) también lo hace, por lo tanto f(x) queda confinada por encima y por debajo como le pasaba a la función de color rosa de la gráfica anterior. Esto se expresa matemáticamente mediante el "valor absoluto".
Para que f(x)= 𝓞(g(x)) sea cierto no es necesario que  ocurra para el valor de x desde -∞ hasta + ∞ (como ocurre con la función de color rosa), es suficiente con que ocurra a partir de un determinado valor, en nuestro ejemplo Xo. Para valores menores que Xo, nos da igual lo que pase.
De una manera algo más formal podemos poner todo esto:

Sabiendo ya qué es O Grande, estamos en condiciones de meternos un poco más en las procelosas aguas del análisis numérico que nos esperan por delante y bucear todavía más en la Hipótesis de Riemann.




domingo, 29 de noviembre de 2020

¿Qué son los ceros no triviales?

 Si recordáis de la entrada anterior titulada, "¿Son los números complejos tan complejos" una función de una variable f(x), por ejemplo, podemos representarla en un plano puesto que la variable independiente "x" (argumento) es unidimensional y la podemos dibujar en una línea (eje X). La variable dependiente (valor de la función) "y" también es unidimensional y la podemos dibujar en un línea (eje Y). Ambas líneas forman un plano (plano XY donde podemos dibujar la función). Ejemplo:

                                                                    



Pero como sabemos los números complejos están formados por un par, un número real y otro imaginario, por lo tanto son de dos dimensiones y no podremos representarlos junto a su función en un mismo plano. La opción más realista es representar en un plano los valores del argumento y en otro plano los valores de la función.



En este caso hemos representado la misma función de elevar al cuadrado un número (en este caso un número complejo). A la izquierda vemos los argumentos de la función (variable independiente), en este caso hemos cogido los números complejos que forman la rejilla de un rectángulo. Al pasar esos argumentos por la función de "elevar al cuadrado", los puntos de la rejilla son transformados en esa figura extraña formada por parábolas (esos son los valores de la función)
Como veis en un mismo plano no podemos representar los argumentos (izquierda) y los valores de la función (derecha) porque tendríamos un lío de líneas que no nos aclararíamos.

Hagamos esto con la función de Riemann, pero en vez de representar todos los puntos (formaríamos un lio de lineas que no nos llevarían a ninguna parte) representemos sólo aquellos argumentos que tras pasarlos por la mencionada función nos devuelvan un valor real-puro o real-imaginario. Por ejemplo:
Dicho de otra manera, vamos a intentar dibujar dos gráficas semejantes a las de arriba con fondo negro, pero ahora la función a representar no será "x al cuadrado", sino "La función de Riemann (𝜻)".
Si intentamos dibujar en primer lugar el plano de los argumentos (gráfica de la izquierda) pero solo para aquellos argumentos que nos devuelven un valor puro-real o puro-imaginario obtendríamos algo así:

Podemos observar que los ejes no están igual escalados para que el dibujo sea más entendible. El eje Real va de -5 hasta 2, en cambio el eje imaginario va desde aproximadamente -2 hasta 62. Las líneas azules representan aquellos argumentos que devuelven un valor puro-real y las líneas rojas los que devuelven un puro-imaginario.
Los ceros se representan como círculos negros. Vemos que hay dos ceros, en el eje Real, en -2 y -4 (ceros triviales). Los ceros no triviales aparecen todos en la misma columna (color rosa), perfectamente alineados. Pues bien, estos ceros son los que traen a los matemáticos de cabeza desde que Riemann formuló su famosa hipótesis.
Ahora ya estamos en disposición de entender qué es lo que formula la hipótesis de Riemann:

Todos los ceros no triviales de la función 𝜻
tienen como parte real el valor: 1/2

En la gráfica se ve claramente que los ceros no triviales de dicha función están todos alineados perfectamente uno encima del otro en el valor del eje Real igual a 1/2. El valor de su parte imaginaria se representa en la columna a la derecha de la gráfica.
Pues la demostración de esta sencilla frase es la que trae a todos los matemáticos de cabeza desde mediados del siglo XIX. Se han escrito algoritmos y se han calculado mediante potentes computadoras millones y millones de ceros de la función y todos están perfectamente alineados en la línea de valor 1/2.
¿Pero entonces por qué tanto lío? ¿No es suficiente con que hallamos calculado miles de millones de ceros para pensar que la hipótesis es real? Matemáticamente hay que decir NO. Si por ejemplo hemos calculado 100.000.000.000 ceros y todos cumplen la hipótesis, nadie nos puede asegurar que el cero 100.000.000.001 la cumple también.
Las pruebas matemáticas se basan en eso, empleando su lógica interna y propiedades, intentar demostrar de algo se cumplirá siempre. Una vez que algo ha sido demostrado matemáticamente se convierte en inmutable, será cierto para la eternidad y en cualquier lugar del universo.

Volvamos a la gráfica anterior. ¿Por qué en todas las representaciones del plano de argumentos de 𝜻, siempre aparece una banda centrada en 1/2? En nuestro dibujo esta banda está coloreada en rosa y se extiende de 0 a 1. Siempre se suele colorear porque eso es lo único que han podido demostrar los matemáticos, que los ceros de 𝜻 están dentro de esa banda. Se le denomina "banda crítica"

También se ha podido demostrar que los ceros no triviales aparecen en pares conjugados, es decir si un cero está en 1/2+14.1347i el otro cero estará en 1/2-14.1347i. Utilizando anotación matemática respecto a lo que son pares conjugados:

Algo que también se ha podido demostrar es que los ceros son simétricos respecto a la línea 1/2, según la fórmula que vimos en la última entrada. Si 𝜻(s) es un cero, entonces 𝜻(1-s) también es otro cero. Dicho de otra manera y sabiendo que van a caer todos dentro de la banda crítica; si 1/2+a es la parte real de un cero, 1/2-a será también la parte real de otro cero.

Sigámonos fijando en la gráfica. Puede observarse que conforme los ceros están más arriba (tienen la parte imaginaria mayor) están más juntos, es como si se apretaran. Estudiando la función se llegó a la fórmula empírica donde 𝜟 es el espaciado medio entre ceros a la "altura" T de la "banda crítica".
Cuanto mayor es T, más precisa es la fórmula. Como curiosidad el famoso matemático Ardrew Odlyzko publicó una lista con los 10.000 primeros ceros de la función, el último de ellos caía más o menos cerca de este número: 1/2+1.370.919.909.931.995.308.897i. ¡Vemos que está bastante arriba! ¡No sé si yo sería capaz de nombrar este número tan grande! La diferencia de este cero con su anterior nos da un valor de 0,13416467. Pues bien si metemos esa "altura" en la fórmula, nos da una media de espaciado 𝜟=0,13417894... La aproximación parece funcionar razonablemente bien.

Para terminar con el análisis de la gráfica en cuestión, podemos decir que es simétrica respecto al eje real.
Por simplicidad sólo hemos dibujado la parte superior (valores positivos del eje imaginario). Si hubiéramos dibujado la parte negativa del eje imaginario hubiéramos descubierto que todos los puntos trazados tienen su correspondiente complejo conjugado. Esto se veía venir ya que como se ha dicho antes, se demostró en su día que los ceros no triviales aparecían en pares complejos conjugados.
Por ello puede decirse que:
Nos hemos centrado en el plano de los argumentos y hemos representado aquellos argumentos que tras pasar por la función 𝜻(s) dan un valor real-puro o imaginario-puro. Ahora centrémonos en dibujar el plano de los valores de la función 𝜻(s). Por ejemplo el argumento 1/2+14,134725142...i nos dará 0 en dicho plano, es decir: 
Pero qué argumentos pueden ser de valor ahora representar. En este caso lo tenemos muy fácil, como sabemos que los ceros no triviales está  alineados en el valor real 1/2, vamos a representar los argumentos de la línea crítica, es decir todos aquellos cuya parte real = 1/2. Tendremos una gráfica como esta:
Como hemos dicho que vamos a representar sólo los valores cuya parte real es 1/2, empezamos evidentemente con 1/2+0i. Si recordáis de entradas anteriores del blog 𝜻(1/2)= -1,4603545'88095... Si vamos siguiendo la curva, para los siguientes valores forma una especie de semicircunferencia que recorreríamos en el sentido antihorario, cruzando el eje real cerca de 0,5 y empezando a describir bucles, ahora en sentido horario. El primer bucle cruza al eje real un poco más arriba de 1,5 para enfilarse al origen, punto 0+0i. El valor del argumento tras ese primer cruce por el origen como todos sabemos es: 1/2+14,134725142...i. Después la gráfica sigue describiendo bucles en sentido horario, unos más grandes que otros, pasando por el origen de coordenadas. El siguiente paso por el origen me imagino que lo habéis adivinado, es para el argumento: 1/2+21,022039639...i, el siguiente paso es para 1/2+25,010857580...i y así va pasando por el origen infinitas veces. Recordad que se han calculado trillones de ceros de la función 𝜻(s).

Para terminar podemos decir que los matemáticos consideran la primera gráfica (plano de argumentos), en la que sale la "banda crítica" en color rosado, como una herramienta mucho más potente para desentrañar los misterios de la Función de Riemann.



viernes, 24 de abril de 2020

Ceros Triviales de la función Z. ¿Qué es eso de un cero trivial?

Sabemos que a los matemáticos les gusta liarla, bueno digamos que no se dan por vencidos a las primeras de cambio, y en esta entrada vamos a ver un claro ejemplo de ello.

Si recordáis en la entrada de este blog sobre la Función Z de Riemann se dijo que esta función divergía claramente para valores de s<1, pero como también se dice en esa entrada, el genial matemático alemán tuvo la idea de extender s al dominio de los números complejos y entonces eso cambió las cosas.
Si ahora se podía calcular el valor de la función para s<1, se podía intentar dibujarla para esos valores.

Nosotros no somos tan listos como Riemann, por eso vamos a intentar ver que la función tiene valores para s<1 pero de una manera poco rigurosa. Lo primero, si recodamos de bachillerato, cuando queremos dibujar una función lo primero que calculamos son sus ceros, es decir los puntos en los que corta el eje de abscisas.

El cálculo de esto es bastante complejo, pero con una ayudita y una simplificación matemática no muy rigurosa, lo vamos a entender de una manera muy sencilla, aunque los que más saben de matemáticas pensaran que les estoy tomando el pelo.

Recordando la función de Riemann:
Podemos definir una nueva función muy parecida, pero en la que los signos se vayan alternando.
Como ya hemos visto en otras entradas del blog, este último tipo de series es más fácil que converja que la de Riemann, puesto que siempre vamos restando algo a cada suma y vemos que de alguna manera cada sumando par va restando, cancelando en cierta medida, lo que su antecesor sumó. Se puede demostrar que este tipo de series convergen siempre que s>0
Empecemos ahora con el artificio:
Si miráis la expresión siguiente estaréis de acuerdo conmigo en que si añadimos el mismo término sumando y restando (dentro de círculos rojos) nada cambia.
Luego agrupamos términos y sacamos factor común los sumandos negativos. Hemos hecho este artificio para convertir un suma/resta alternativa en una suma menos un término.
Si asumimos:
Nos queda entonces:
Por lo tanto, sustituyendo los términos tendríamos:
Si tenemos en cuenta que,
Podemos arreglar un poco más la expresión que estamos manipulando para que nos quede,
Ahora ya tenemos identificada cada una de las series conocidas, por lo tanto,
Y finalmente despejamos la función de Riemann para ver a qué podría ser equivalente:
Puesto que tenemos una serie a cada lado del símbolo igual, podemos pensar que si calculo un valor para 𝛈(s) no debe ser muy difícil calcular un valor para 𝛇(s). Si recordamos 𝛈(s) converge para valores de s>0 y si 𝛇(s) para valores s>1, pues con este truco podemos calcular valores de 𝛇(s) para 0<s<1 y así hallar, por ejemplo, el valor antes "prohibido" de 𝛇(1/2) y que resulta ser -1,460354508...
Como he comentado antes este es un truco sin ninguna rigurosidad pero que nos permite calcular valores, que de otra forma sería casi imposible.
Estos trucos malabares algunas veces son utilizados por los matemáticos para hacerse una idea de por dónde van los tiros. De esta forma Riemann en su artículo de 1859 terminó de perfilar una fórmula sugerida por Euler en 1749 para el cálculo de valores de 𝛇(s) conociendo otro valor de la función.



Con esta ecuación funcional ahora es sencillo intuir los llamados ceros triviales. Si vamos dando valores a "s" y sustituyéndolos, la única parte de la ecuación que nos puede dar cero es la función trigonométrica que ahí aparece. Simplifiquemos un poco, por claridad, la función poniendo que es algo multiplicado por la función seno. Para no confundirnos con la variable s al valor que vamos a ir sustituyendo le llamaremos x:

Podemos ver claramente, con esta simplificación, que la función Zeta en los valores 𝜁(-2), 𝜁(-4), 𝜁(6), ... la función vale cero. ¡Estos son los ceros triviales! La función se anula para todos los valores pares menores que cero. Un matemático lo escribiría:
Volviendo a esa ecuación, que hemos llamado funcional, observamos que para calcular su valor en un punto necesitamos conocer el de otro. Por ejemplo, si conocemos 𝜁(16) podemos calcular 𝜁(-15), si conocemos 𝜁(1,5) podemos calcular 𝜁(-0.5) o si conocemos 𝜁(0,29999) podemos calcular 𝜁(0,70001).
¿Pero qué pasa si s=1/2? Entonces tenemos:

¡Vaya tenemos lo mismo, es decir 𝜁(1/2), en los dos lados de la igualdad por lo que no lo podremos calcular! ¿Pero falla la fórmula? Veamos.
Como veis lo único que se ha hecho es sustituir los valores numéricos
Sólo recordaros que los factoriales sí pueden calcularse para número negativos y fraccionarios y en eso tiene mucho que ver la función 𝜞(n) (gamma) y de la que puede que algún día hablemos.
Está claro que la ecuación funciona perfectamente, pero no nos puede calcular ningún valor para 𝜁(1/2) porque lo que nos da es una igualdad evidente. ¡Menos mal que este valor "prohibido" lo hemos calculado con el truco de antes! Podemos pensar que existe una especie de "eje de simetría"  en 1/2 que relaciona un punto  con su opuesto respecto al mismo pero de una manera rarísima y que no es fácil de ver.
Para terminar y cogiendo unas gráficas del libro "Prime Obsession" de John Derbyshire podemos ver una representación de los ceros triviales, su magnitud y rareza de comportamiento.
En la gráfica se representa en abscisa el valor de s y en ordenada el valor de  𝜁(s). Podemos ver en la gráfica de la izquierda que 𝜁(1/2)=-1,4603545... para después cortar al eje de ordenadas en -1/2, es decir 𝜁(0)= -0.5. Después la curva sigue descendiendo hasta que 𝜁(-2)=0, primer cero trivial.
Si ahora nos fijamos en la gráfica de la derecha, hemos hecho una pequeña ampliación, 𝜁(s) va oscilando alrededor del eje s, cortándolo en los valores -4, -6, -8, -10, -12 y -14, siguientes ceros triviales. Las oscilaciones cada vez se hacen más grandes. Por ejemplo , el máximo entre -2 y -4 tiene un valor de 0,0091598... y el mínimo entre -4 y -6 vale -0,003986... El nuevo máximo entre -6 y -8 tiene un valor 0,004194... y a partir de aquí las oscilaciones empiezan a aumentar dando lugar a máximos cada vez más altos y mínimos cada vez más profundos. El mínimo entre -8 y -10 tiene un valor de -0,0078308... y el máximo que hay entre -10 y -12 alcanza 0,022730748....

Los máximos y los mínimos no paran de crecer, por lo que tenemos que ir cambiando de escala continuamente si queremos apreciarlos. Vemos que el máximo que hay entre -18 y -20 ya tiene un valor muy superior a sus anteriores, pero es que en la siguiente gráfica el mínimo que hay entre los ceros -24 y -26 está en el entorno de -80.000.

Seguimos cambiando de escala porque si no no veríamos nada. Vemos que ahora el máximo ente los ceros -30 y -32 está en el entorno de 700.000.000 (la m significa millón en la gráfica). Si no cambiáramos de escala no podríamos ver nada. La prueba es que los máximos y mínimos anteriores aparecen casi como una línea recta superpuesta al eje S debido al rápido aumento de estas oscilaciones de la gráfica. El mínimo entre -36 y -38 vale aproximadamente un poco más de -20 billones (en la gráfica está como tr porque un trillón anglosajón equivale a un billón nuestro)
Pero esto no para aquí.

Podemos ver que las oscilaciones cada vez son más exageradas. Como curiosidad podemos decir que el mínimo entre -48 y -50 vale aproximadamente -305.507.128.402.512.980.000.000
¿Habías visto alguna vez una función tan extraña y con un comportamiento tan espeluznante?
¡Y esto sólo para los valores negativos (ceros triviales)?
¿Qué más nos deparará esta misteriosa función?