Noticias

Diseńo, modelado, automatización y simulación de procesos

109

2025-01-28DeepSeek: qué es, cómo funciona y qué opciones tiene esta inteligencia artificial

Xataka |Te explicamos a fondo y de una manera sencilla qué es DeepSeek y por qué está destacando tanto esta inteligencia artificial de China. También te hablamos de su funcionamiento y posibilidades.

Vamos a explicarte qué es DeepSeek, el chat de inteligencia artificial creado por la empresa del mismo nombre. Se trata de una IA que a principios del 2025 está llamando mucho la atención, y que incluso en las tiendas de aplicaciones móviles ya ha conseguido igualar e incluso superar a ChatGPT en descargas. Y por si fuera poco, en las pruebas de rendimiento y razonamiento también les ha igualado con su modelo R1.

En los últimos meses hemos hablado bastante sobre esta empresa y sus modelos, y da la sensación de que vamos a seguir haciéndolo. Sobre todo porque son de código abierto, lo que permite que sea más accesible para todos, y porque muestra lo mucho que está avanzando China en las tecnologías de inteligencia artificial.

Qué es DeepSeek

Fuente: Deepseek V3

DeepSeek es el nombre de una empresa de China especializada en inteligencia artificial. También es el nombre de su chat de IA, una alternativa propia a Copilot, Gemini y compañía. Por lo tanto, puedes escuchar y leer menciones a DeepSeek refiriéndote a ambas cosas.

En este artículo nos vamos a centrar en el chatbot de inteligencia artificial, que es un Gran Modelo Lingüístico o Large Language Model (LLM), creado para ayudar con el desarrollo de software, el procesamiento del lenguaje natural y la automatización empresarial.

DeepSeek destaca por ser de código abierto. Esto quiere decir que cualquier persona puede ver cómo funciona internamente, es totalmente transparente, y cualquiera puede instalarse esta IA de forma local o usarla con total libertad. Un desarrollador o investigador puede descargarlo de GitHub y modificarlo para diversos escenarios, incluyendo algunos comerciales.

Además, el hecho de que esté disponible y su código sea abierto también significa que cualquiera de nosotros puedes descargarlo y hacerlo funcionar en su propio ordenador. Quizá esto haga que vaya más lento, pero permite que todo lo que escribas e interactúes se quede en tu equipo, y que la empresa china no acceda a ello. Vamos, todo se queda en tu PC. Esto contrasta totalmente con el hermetismo y la poca libertad de unos modelos privados.

Se suele tener la falsa percepción de que una de las cosas a favor del código privado y opaco de la mayoría de desarrolladoras es que la calidad de sus productos es superior. Sin embargo, DeepSeek es una prueba de que el código abierto puede igualar e incluso superar en unos aspectos a estas empresas.

Otra de las principales características de DeepSeek es que su chatbot nativo, el de su web oficial, es totalmente gratuito y no requiere de ninguna suscripción para utilizar su modelo más avanzado. Además, puedes usar DeepSeek en Español solo con hablarle en este idioma.

Si lo comparamos con ChatGPT haciendo las mismas preguntas, DeepSeek puede ser un poco más escueto a la hora de responder, va más al grano. Sin embargo, tiene la misma flexibilidad que otros modelos, y puedes pedirle que explique las cosas más ampliamente o que las adapte a ti.

Dos modelos de IA como punta de lanza

Fuente: Deepseek

DeepSeek ha dado mucho que hablar a finales del 2024 y principios del 2025 por dos modelos de IA concretos. Primero está DeepSeek V3, un modelo de larga escala LLM que supera a la mayoría de IA, y también supera a algunos propietarios. En pruebas como la de programación, este modelo logró superar a Llama 3.1 405B, a GPT-4o y a Qwen 2.5 72B, aunque todos ellos tienen muchos menos parámetros y eso puede influir en el rendimiento y las comparaciones.

Pero lo que realmente ha sorprendido de este modelo es que "solo" necesitó 2,788 millones de horas de entrenamiento. Y luego está el tema del coste de este entrenamiento. Se está diciendo que costó tan solo 5,5 millones de dólares frente a los 80 millones de dólares que costaron modelos como los de OpenAI. Sin embargo, algunos analistas indican que la cifra real de la empresa china no se conoce, por lo que no podemos afirmar que estas afirmaciones sean ciertas.

Lo que sí parece más barato es el precio de uso interno, el de los tokens. Este es un concepto difícil de explicar. Las IA funcionan con tokens, que son como fichas de uso por las que pagas. El precio de 1 millón de tokens del modelo que razona es de 55 céntimos de dólar, mientras que el modelo 01 de OpenAI lo cobra por 15 dólares. Vamos, que es mucho más barato de usar.

El otro gran modelo ha sido DeepSeek R1, que está especializado en razonamiento, y ha sido capaz de alcanzar o superar el rendimiento de los modelos más avanzados de OpenAI en pruebas clave de matemáticas y programación. Con él, es la primera vez que un modelo chino de código abierto y gratuito iguala a los líderes occidentales, rompiendo el monopolio de Silicon Valley.

Por poner algunas cifras, este modelo R1 ha costado de desarrollar entre un 90 % y 95 % menos que sus competidores, y tiene 671.000 millones de parámetros. Además, en pruebas matemáticas MATH-500 ha conseguido un 97,3 % de aciertos, frente al 96,4 % de OpenAI.

Sin embargo, hay un punto un poco polémico que conviene explicar, y es el de la posible censura del modelo. El chatbot de DeepSeek, igual que Gemini o ChatGPT, también está sujeto a los valores del país donde ha sido desarrollado. En este caso ha sido desarrollado en China, y se adapta a su regulación, debiendo "encarnar valores socialistas fundamentales". Por poner un ejemplo, esto hace que no responda a preguntas sensibles sobre política y geopolítica, como esas sobre Tiananmen o la autonomía de Taiwán.

Sin embargo, esta censuras no es a nivel del modelo, sino solamente a nivel del chatbot online al que puedes acceder gratis. Vamos, que si te montas el modelo en tu propio ordenador no vas a tener estas limitaciones, ni la IA se va alinear con la ideología del Partido que gobierna China.

Cómo funciona DeepSeek

DeepSeek ha sido desarrollado usando aprendizaje por refuerzo puro, sin datos etiquetados previamente. Esta es una hazaña técnica que hasta ahora se consideraba imposible, y que abre nuevas puertas al entrenamiento de este tipo de sistemas.

Este aprendizaje por refierzo permite que el modelo sea capaz de aprender por si mismo mediante prueba y error, igual que tú puedes aprender a montar en bici o a realizar algunas tareas. Esto hace que el resultado inicial sea más errático e impreciso, pero el propio modelo va descubriendo y desarrollando estrategias de razonamiento únicas para seguir mejorando.

Una vez realizado este entrenamiento, DeepSeek refinó el modelo combinándolo con otros entrenamientos supervisados para pulirlo y crear la versión final de R1, que mantiene este componente pero añadiendo consistencia y pulido.

Fuente: Deepseek

De cara al usuario su funcionamiento es igual que el de otros modelos. Tienes una pantalla de inicio con una campo de escritura y varias opciones de funcionamiento, y luego a la hora de ver los resultados tienes una columna izquierda con un historial de DeepSeek con todos tus chats.

Para usarlo tienes que escribir una pregunta en lenguaje natural, igual que lo harías con una pregunta. Entonces, DeepSeek analizará las palabras de tu pregunta para encontrar el resultado, y luego buscará en la base de datos con la que fue entrenado o en Internet para obtener datos con los que componer una respuesta también en lenguaje natural.

Gracias a la manera en la que ha sido creado, este modelo puede entender contextos complejos de preguntas muy largas y elaboradas. Además, también puede ir aprendiendo y mejorando. Su aplicación puede usarse gratis online o bajándose su app móvil, y no tiene ninguna cuota.

Qué puedes hacer con DeepSeek

Con este modelo de IA puedes hacer prácticamente lo mismo que con otros modelos. Puedes hacerle todo tipo de preguntas, y re responderá en tiempo real. Puedes preguntarle por personajes famosos, por lugares, puedes preguntarle el significado de cosas, y todo lo que se te ocurra.

También sirve para explicarte temas complejos de manera sencilla, siempre y cuando le pidas que lo haga así. También puedes enviarle documentos para que extraiga información clave sobre ellos, y hacerle preguntas relacionadas cobre su contenido.

Sirve para la programación, permitiéndote escribir o depurar código, así como para resolver problemas matemáticos. Además, si eres un creador de contenido puedes pedirle que te genere ideas, textos, que componga poesía, o que te cree plantillas o estructuras para artículos. También puede revisar y corregir textos.

En el cuadro donde escribes tu prompt o pregunta, tienes tres botones. El del clip es para adjuntar archivos. Pero además tienes el botón de DeepThink R1 para hacer que la IA "piense" en lo que te ha respondido antes o en tu contexto, y te de una respuesta razonada. Y luego, el botón Search sirve para obtener la información de Internet, indicando las fuentes antes de la respuesta.

Luego, con cada respuesta que te da tienes botones para copiar el texto, dos botones para calificarlo positiva o negativamente dependiendo de la calidad de la respuesta, y otro para recargar la respuesta y que te la vuelva a generar desde cero basándose en tu mismo prompt.

Autor

Autor

Xataka

Publicación de noticias sobre gadgets y tecnología. Últimas tecnologías en electrónica de consumo y novedades tecnológicas en móviles, tablets, informática...

2022-06-21
Adaptación del mundo cibernético a los sistemas productivos

Revista Virtual Pro |Sin duda, la cuarta revolución industrial denominada revolución informática, ha modificado disruptivamente todos los ámbitos sociales. Cada desarro...

Diseño, modelado, automatización y simulación de procesos

Noticias relacionadas

2025-02-13
La técnica de validación podría ayudar a los científicos a realizar pronósticos más precisos

Los investigadores del MIT desarrollaron un nuevo enfoque para evaluar predicciones con una dimensión espacial, como la predicción del tiempo o el mapeo de la contaminación del aire.

2025-02-10
Limpieza de la producción de minerales y materiales críticos mediante plasma de microondas

Con tecnología desarrollada en el MIT, 6K está ayudando a traer de regreso a los EE. UU. la producción de materiales críticos sin subproductos tóxicos.

2025-01-28
Desarrollan una herramienta de neuroturismo que potencia el marketing de viajes

Un equipo de la Universidad de Málaga ha validado un sistema con el que las empresas turísticas pueden afinar sus técnicas comerciales para hacerlas más efectivas. Basada en la neurociencia y en la percepción de personalidad de marca, la propuesta de estudio logra conectar emocionalmente con los potenciales clientes en el diseño de logotipos y estrategias de venta.

2025-01-20
Este es el verdadero impacto de las nuevas herramientas de IA

Los costos ocultos del desarrollo de la inteligencia artificial generativa (en inglés, GenAI) van más allá de lo económico o lo medioambiental: también tienen un fuerte impacto social.

2025-01-16
Este insecto robótico rápido y ágil podría algún día ayudar en la polinización mecánica.

Con un nuevo diseño, el robot del tamaño de un insecto pudo volar 100 veces más tiempo que las versiones anteriores.

2025-01-13
GenCast, un nuevo modelo de IA para predecir el tiempo y las condiciones extremas con precisión

Esta nueva herramienta de inteligencia artificial, desarrollada por el equipo de investigadores de Google DeepMind, supone un avance en la predicción de incertidumbres y riesgos meteorológicos, al ofrecer información más rápida y precisa con hasta 15 días de antelación. Se trata de un modelo de código abierto.

Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Noticias

Diseńo, modelado, automatización y simulación de procesos

2025-01-28DeepSeek: qué es, cómo funciona y qué opciones tiene esta inteligencia artificial

2022-06-21
Adaptación del mundo cibernético a los sistemas productivos

Noticias relacionadas

2025-02-13
La técnica de validación podría ayudar a los científicos a realizar pronósticos más precisos

2025-02-10
Limpieza de la producción de minerales y materiales críticos mediante plasma de microondas

2025-01-28
Desarrollan una herramienta de neuroturismo que potencia el marketing de viajes

2025-01-20
Este es el verdadero impacto de las nuevas herramientas de IA

2025-01-16
Este insecto robótico rápido y ágil podría algún día ayudar en la polinización mecánica.

2025-01-13
GenCast, un nuevo modelo de IA para predecir el tiempo y las condiciones extremas con precisión

Noticias más leidas

2023-03-08
La importancia de la probabilidad y estadística en la vida diaria

2024-06-06
Un estudio encuentra microplásticos en las bebidas envasadas

2024-06-06
Reducir el desperdicio de alimentos en toda la cadena de suministro

2024-06-06
Separando la ciencia de la ficción en -El problema de los 3 cuerpos- de Netflix

2024-06-06
Los nuevos incendios causados por el cambio global reducen la abundancia y diversidad de las plantas leñosas

2024-06-06
Los físicos crean una autopista de cinco carriles para los electrones

2024-03-06
Oportunidades, retos, desafíos y peligros en la Inteligencia Artificial

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Noticias

Diseńo, modelado, automatización y simulación de procesos

2025-01-28DeepSeek: qué es, cómo funciona y qué opciones tiene esta inteligencia artificial

2022-06-21Adaptación del mundo cibernético a los sistemas productivos

Noticias relacionadas

2025-02-13La técnica de validación podría ayudar a los científicos a realizar pronósticos más precisos

2025-02-10Limpieza de la producción de minerales y materiales críticos mediante plasma de microondas

2025-01-28Desarrollan una herramienta de neuroturismo que potencia el marketing de viajes

2025-01-20Este es el verdadero impacto de las nuevas herramientas de IA

2025-01-16Este insecto robótico rápido y ágil podría algún día ayudar en la polinización mecánica.

2025-01-13GenCast, un nuevo modelo de IA para predecir el tiempo y las condiciones extremas con precisión

Noticias más leidas

2023-03-08La importancia de la probabilidad y estadística en la vida diaria

2024-06-06Un estudio encuentra microplásticos en las bebidas envasadas

2024-06-06Reducir el desperdicio de alimentos en toda la cadena de suministro

2024-06-06Separando la ciencia de la ficción en -El problema de los 3 cuerpos- de Netflix

2024-06-06Los nuevos incendios causados por el cambio global reducen la abundancia y diversidad de las plantas leñosas

2024-06-06Los físicos crean una autopista de cinco carriles para los electrones

2024-03-06Oportunidades, retos, desafíos y peligros en la Inteligencia Artificial

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2022-06-21
Adaptación del mundo cibernético a los sistemas productivos

2025-02-13
La técnica de validación podría ayudar a los científicos a realizar pronósticos más precisos

2025-02-10
Limpieza de la producción de minerales y materiales críticos mediante plasma de microondas

2025-01-28
Desarrollan una herramienta de neuroturismo que potencia el marketing de viajes

2025-01-20
Este es el verdadero impacto de las nuevas herramientas de IA

2025-01-16
Este insecto robótico rápido y ágil podría algún día ayudar en la polinización mecánica.

2025-01-13
GenCast, un nuevo modelo de IA para predecir el tiempo y las condiciones extremas con precisión

2023-03-08
La importancia de la probabilidad y estadística en la vida diaria

2024-06-06
Un estudio encuentra microplásticos en las bebidas envasadas

2024-06-06
Reducir el desperdicio de alimentos en toda la cadena de suministro

2024-06-06
Separando la ciencia de la ficción en -El problema de los 3 cuerpos- de Netflix

2024-06-06
Los nuevos incendios causados por el cambio global reducen la abundancia y diversidad de las plantas leñosas

2024-06-06
Los físicos crean una autopista de cinco carriles para los electrones

2024-03-06
Oportunidades, retos, desafíos y peligros en la Inteligencia Artificial