*Celso Vargas Elizondo
Escuela de Ciencias Sociales
Email: celvargas@itcr.ac.cr
https://orcid.org/0000-0002-1701-6186
Bajo el título de esta perspectiva, la mitad en serio y la otra mitad en broma, se pretende explorar, brevemente, algunos aspectos de la contribución, la persona y hasta donde entiendo, el estilo de Leibniz, y que podemos rastrear en algunos desarrollos de la IA, especialmente, en el últimos chatbots, del tipo LLAMA, ChatGPT y DeepSeek.
- El cálculo binario. Desde que Konrad Zuse creará sus primeras computadoras mecánicas binarias en los años 1936 y siguientes, el uso del sistema de codificación binario para indicar conectado o no conectado (pico de paso de electricidad y no pico) y para codificar los distintos símbolos del código ASCII, se convertido en el modelo estándar para el diseño, construcción y desarrollo de computadores y de microchips que son actualmente utilizados en distintas aplicaciones de la IA. Leibniz fue uno de los primeros, sino el primero, en desarrollar el sistema aritmético binario. En la colección de Lloyd Strickland and Harry Lewis (2022), titulada: “Leibniz on Binary. The Invention of Computer Arithmetic” (The MIT Press), se reúnen los principales escritos de Leibniz sobre este tema. Leibniz no solo ejemplifica como convertir cualquier número natural en su correspondiente número binario, sino que también proporciona de manera completa las reglas (“Ley Combinatoria formal”, como la llama Leibniz) que podemos utilizar para llevar a cabo este proceso. En este aspecto, Leibniz es un relevante filósofo que deberíamos considerar como pionero (aunque sus trabajos se conocieron posterior a la publicación Boole) de este importante campo de la ciencia y tecnología.
- La Characteristica Universalis. Uno de los sueños leinibzianos fue la construcción de un cálculo universal que permitiera representar, deducir e inventar nuevos símbolos, signos y conocimientos. Realmente lleva razón Eberhard Knobloch, que en el resumen de su trabajo “Leibniz between ars characteristica and ars inveniendi: Unknown news about Cajori’s ‘master-builder of mathematical notations” (s.f.) indica que realmente se trata de tres cálculos o artes: “… el ars característica esto es el arte de inventar caracteres y signos; el ars combinatoria que es el arte de la combinación; el ars inveniendi que es el arte de la invención de nuevos teoremas, nuevos resultados, nuevos métodos. Estas artes están fuertemente correlacionadas unas con las otras”.
Los extraordinarios desarrollos en IA que hemos visto en los últimos años, especialmente a partir del 2023 nos acercan cada vez más a ese sueño leibniziano. Chats como ChatGPT y DeepSeek, entre otros, no sólo proporcionan demostraciones detalles de ecuaciones y teoremas, sino que están en capacidad de proponer nuevos teoremas y proporcionar demostraciones a los mismos. GEMINI en particular asume roles importantes como el de docente en la demostración paso a paso expresiones algebraicas, para mencionar un ejemplo.
3. El proyecto de enciclopedia o ciencia universal. Este proyecto leibniziano está directamente relacionado con el anterior y tiene dos aspectos relevantes para esta perspectiva: a) Leibniz como el último gran pensador que estaba enterado y mostraba un importante dominio de todos los temas relevantes de su tiempo; b) su propuesta de promover la fundación de sociedades científicas. Tal y como señalan Oscar Esquisabel y Manuel Sánchez-Rodríguez (2023) en el estudio introductorio al Volumen 3, Ciencia General y Enciclopedia, publicada por la Editorial Comares, España:
“Este ideal de la función de la ciencia como un camino cierto hacia la promoción del bien común por medio del incremento de las luces es ostensible, ante todo, en el proyecto leibniziano de la enciclopedia, que Leibniz concibe claramente como una empresa colectiva e institucional, para lo cual se requiere de acciones coordinadas del poder público y del mundo erudito. Por esa razón, la realización del programa de la enciclopedia es inseparable del programa científico institucional y político de fundación de academias, o como él mismo las denominaba, de sociedades de ciencias y artes. La Sociedad no es tanto un complemento de la enciclopedia, sino la articulación institucional efectiva de este mismo proyecto, por la cual puede llegar a su realización y aplicación práctica (p. xv).
En nuestra atrevida comparación, podemos ver elementos de cada uno de estos aspectos en dos arquitecturas utilizadas en este momento en IA: La arquitectura que podríamos denominar de mono-estructura y la arquitectura de mezcla de expertos. En la primera, las dos propiedades fundamentales de los modelos fundacionales, a veces llamados, Large Language Models (LLMs), homogenización y emergencia son utilizados para entrenar y para responder preguntas que se hagan, por ejemplo, al ChatGPT. En el proceso de entrenamiento alrededor de 175 mil millones de parámetros son ajustadas en sus valores de manera que esté pronto a responder. Ajustes menores posteriores se realizan para hacer que el sistema se adecúe a las necesidades del usuario. En el caso de la arquitectura de mezcla de expertos, el proceso de entrenamiento se lleva a cabo por módulos (expertos) garantizando la integración del sistema. De esta manera, tenemos tantos módulos expertos (en matemática, química, física, biología, etc.) como sea necesario, y solamente los dominios relevantes son activados en el proceso de consulta. DeepSeek funciona de esta manera y, lo que es interesante es que el sistema complejo contiene más de 780 mil millones de valores (parámetros) involucrados, más de 4 veces que los parámetros de ChatGPT
En este sentido, en nuestra comparación, el modelo de la enciclopedia en IA es un sistema que involucra todo el sistema de IA cuando es corrido. Es como el Leibniz enciclopédico que responde por el mismo todas las preguntas que se le haga. Por otro lado, el modelo mezcla de expertos solamente activa aquel módulo o módulos que están involucrados en la consulta de un programa. Es como su hubiera un panel de expertos (sociedad científica) que responden a las preguntas que se planteen según su especialidad. Pero contrario a lo que sucede en las sociedades científicas, el pago que se hace a los expertos depende solo de las consultas que se le haga, mientras que el experto enciclopédico requiere muchos recursos para hacer su trabajo. La cantidad y calidad de microchips, y el consumo eléctrico asociado es mucho mayor en un experto enciclopédico que en un panel de expertos. Esta es una de las grandes ventajas de DeepSeek sobre ChatGPT, por ejemplo.
De esta manera, una de las consecuencias de este aspecto es que Leibniz como experto universal está en desventaja cuando lo comparamos con el desempeño de una sociedad científica, y está en desventaja en el sentido de requiere mucha memoria, capacidad de procesamiento y energía para funcionar adecuadamente. Desventaja que no encontramos en el enfoque de mezcla de expertos.