La metodología resultó en un costo de entrenamiento cercano a los 6 millones de dólares, según algunos expertos. La cifra es notablemente menor a los más de 60 millones que Meta destinó para capacitar a su modelo Llama 3.1. El ahorro en recursos informáticos reduce de manera drástica los precios de acceso para los usuarios. El uso de DeepSeek-R1 cuesta una trigésima parte de lo que implica utilizar OpenAI o1.
Mario Krenn, director del Laboratorio de Ciencias Artificiales del Instituto Max Planck, señala que "un experimento que costaba más de 300 libras con OpenAI o1, ahora puede hacerse por menos de 10 dólares. Esta es una diferencia drástica que influirá en la futura adopción [del algoritmo chino]".
DeepSeek-R1 se ha publicado bajo una licencia del Instituto Tecnológico de Massachusetts, como una herramienta "open-weight". Esto significa sus cadenas de pensamiento son accesibles para los investigadores y el modelo puede reutilizarse sin restricciones. No se considera completamente como un producto de código abierto, debido a que sus datos de entrenamiento no están disponibles. Pese a ello Marco Dos Santos, científico informático de la Universidad de Cambridge, afirma que la accesibilidad del programa “permite una mejor interpretación de los procesos de razonamiento del modelo”.
Los expertos destacan que DeepSeek-R1 se ha construido a pesar de los estrictos controles de exportación impuestos por Estados Unidos. El expresidente estadounidense Joe Biden presentó a principios de este mes un programa para limitar aún más el envío de chips y modelos base de inteligencia artificial a China y otros países. François Chollet, investigador de IA y creador de la biblioteca de aprendizaje profundo Kera, enfatiza en que “el hecho de que DeepSeek-R1 provenga de China demuestra que la eficiencia en el uso de recursos es más crucial que la mera escala de cómputo”. Por su parte, Alvin Wang Graylin, vicepresidente global de HTC, concluye que “la ventaja que Estados Unidos alguna vez percibió tener se ha reducido. Ambas naciones deben adoptar un enfoque colaborativo para desarrollar una IA avanzada en lugar de perpetuar la actual competencia estéril de carrera armamentista”.
Fuente: Wired