En los círculos técnicos hay con frecuencia para la inteligencia artificial (IA), en la que se crearon los modelos fronterizos de última generación y la investigación de las nuevas empresas como OpenAi, que se suponía que estaban dos o tres años frente a sus colegas chinos. La publicación rápida de dos nuevos modelos de la compañía china Deepseek-der V3 en diciembre y R1 en este mes crea esta suposición profundamente arraigada y desencadena una ruta histórica en las acciones tecnológicas de EE. UU.
El modelo de argumentación R1 de Deepseek coincide (y a veces los ritmos) O1 de O1 en una serie de tareas de matemáticas, código y argumentación, y el 2 por ciento del precio de este último. Un modelo de IA chino ahora es tan bueno como los principales modelos USKI y solo usa una pequeña fracción de los recursos de GPU disponibles.
Esto es notable y un gamuchanger para los Global Ki Desert Arms. Por un lado, esto significa que el juego ya no está reservado para profundizar en el Focke con pilas de calificaciones de chips (como Estados Unidos y China). Esta también fue una ventaja estadounidense importante, que alguna vez se vio como un foso crítico al mantener la brecha de habilidad entre los modelos de EE. UU. Y China. Deepseek mostró que las innovaciones algorítmicas pueden superar las leyes de escala. En vista de los chips limitados debido a los controles de exportación de los EE. UU., La compañía china utilizó técnicas innovadoras de optimización de software, desde arquitecturas de expertos en escasas hasta cuantización que les permitieron lograr una eficiencia de costos sin precedentes y superar los modelos competidores.
Cuando el fundador de Deepseek, Liang Wenfeng, que es investigador de IA a través de la capacitación, dijo en uno entrevista El año pasado «frente a las tecnologías disruptivas, las trincheras de la Tierra creadas por la fuente cerrada son temporalmente. Incluso el enfoque de código cerrado de Openai no puede evitar que otros se pongan al día. »
La capacidad de Deepseek para ponerse al día en unos meses en unos meses muestra que ningún laboratorio, ningún código abierto o de código abierto puede mantener una ventaja tecnológica real y permanente. Tenemos una era de la IA Potencias medianas entrará en la pelea, se utilizan las estrategias de capacitación dividido por profundo.
En segundo lugar, China se convierte en un líder mundial en Ki de código abierto. Deepseek es solo una de las muchas compañías chinas de IA que abren completamente sus modelos y les permiten desarrollar, reproducir y cambiar sus pesos y métodos de modelos en todo el mundo. La gran tecnología de China, Alibaba, ha hecho de Qwen, su modelo abierto de la Fundación Insignia AI. Por ejemplo, las nuevas empresas de KI más nuevas como Minimax, que también pueden hacer frente a varios tipos de medios en enero (tanto básicos como multimodales y multimodales).
Las pruebas de referencia competitivas han demostrado que corresponde el rendimiento de estos modelos de código abierto chino con los mejores modelos de origen cerrado. Los LLM chinos se encuentran regularmente entre los más descargados en los abrazos en los que tiene lugar un repositorio de herramientas y datos de origen abierto. Esto no solo lleva a más desarrolladores globales a su ecosistema, sino que también conduce a más innovación.
Imagine un LLM como un sistema operativo, similar al iOS de Apple y Android de Google, en el que los usuarios pueden desarrollar nuevas aplicaciones. Si mantiene los mejores modelos en los Estados Unidos cerrados, China está mejor lista para expandir su influencia tecnológica en los países que compiten con el acceso al estado de las ofertas de arte a bajos costos. Irónicamente, estas compañías chinas de IA también democratizan el acceso a la IA y mantienen viva la misión original de OpenAai: promover la IA en beneficio de la humanidad. Los países fuera de las superpotencias de IA o los centros tecnológicos bien establecidos ahora tienen un intento de desbloquear una ola de innovación con métodos de capacitación asequible.
Tres controles de exportación de EE. UU. Ya no tienen un extraño sobre el progreso de la IA. Las compañías chinas como Deepseek han demostrado lograr la capacidad de lograr un progreso considerable en la IA mediante el uso de sus modelos para una versión NVIDIA H800-ONE que combina con exportaciones de las chips de IA más avanzadas de la mayoría de las empresas estadounidenses, y mediante el uso de técnicas de software más complejas. Una gran parte de las tácticas de «punto de estrangulamiento» de los Estados Unidos hasta ahora se ha centrado en el hardware, pero el panorama en rápido desarrollo de innovaciones algorítmicas significa que Washington puede tener que examinar rutas alternativas de control tecnológico. Como muchos han enfatizado, la necesidad es realmente la madre de la invención. Deepseek y otros no pudieron confiar en los últimos chips, y se vieron obligados a hacer más con menos e ingenio en lugar de la violencia brutal.
Este hito no puede ser subestimado. Mientras que muchos China habían contado previamente con la carrera de IA debido a la inundación de los controles de exportación estadounidense paralizantes, Deepseek muestra que China ha vuelto y puede estar en la cima. Si los esfuerzos occidentales para obstaculizar o obstaculizar el progreso de la IA de China probablemente no tendrán sentido, la carrera real acaba de comenzar: la ingeniería esbelta y creativa ganará; No es mero problema financiero y controles de exportación.