Inteligencia artificial

Transformación mortal: cómo Stack Overflow afronta el cambio y anticipa el destino de los datos online gratuitos en la era de la inteligencia artificial

La comunidad en línea de codificadores de software, Stack Overflow, ha experimentado un declive en su tráfico desde la llegada de GPT-4. Algunos competidores basados en IA han sido entrenados parcialmente utilizando datos de esta empresa. Prashanth Chandrasekar, CEO de Stack Overflow, está tomando medidas en respuesta a esta situación. OpenAI presentó su potente modelo de IA en marzo, y poco después, Chandrasekar observó una tendencia preocupante.

El flujo de tráfico hacia el sitio web de preguntas y respuestas para codificadores comenzó a disminuir. En abril, los datos de la compañía mostraron una reducción del tráfico del 13 % con respecto a 2022.

Durante 15 años, Stack Overflow ha sido el destino al que acuden los ingenieros de software para plantear preguntas y obtener consejos de otros programadores. Sin embargo, la disponibilidad de modelos como GPT-4, ChatGPT, Codex y GitHub Copilot de OpenAI ha disminuido la necesidad de recurrir a Stack Overflow.

Lo que resulta aún más notable es que muchos de estos nuevos modelos se nutrieron en parte de la información de Stack Overflow, que está disponible de manera gratuita y se ha utilizado como conjunto de datos de entrenamiento para la IA. «Algunos de ellos mencionan explícitamente a Stack Overflow como su principal fuente», comentó Chandrasekar en una reciente entrevista con Insider.

Este fenómeno refleja el futuro de Internet en un mundo dominado por la IA. Las comunidades en línea, como Stack Overflow y Wikipedia, prosperaron como centros en los que expertos y navegantes curiosos se unían para compartir información de forma libre. Sin embargo, estas plataformas digitales de interacción están siendo afectadas por las grandes empresas tecnológicas que se apropian de datos humanos para entrenar sus extensos modelos de lenguaje.

Los nuevos productos que surgen de la era de la IA generativa plantean interrogantes sobre el futuro de estos foros en línea. Los chatbots ofrecen respuestas claras, automáticas y a menudo amigables, eliminando la necesidad de la interacción entre seres humanos para obtener información.

La llamada «muerte por LLM»

Recientemente, Elon Musk denominó este fenómeno como «muerte por LLM». La respuesta y estrategia adoptada por Stack Overflow para sobrevivir tienen implicaciones significativas para numerosas empresas que generan ingresos al publicar y alojar información en línea de manera gratuita. Además, señala un problema inminente en el núcleo de la revolución de la IA: con menos incentivos para que las personas se conecten y respondan preguntas en línea, los datos valiosos y humanos que la IA requiere para su entrenamiento podrían deteriorarse, afectando la calidad de estos modelos.

Este «recurso comunitario fenomenal» era un salvavidas para los desarrolladores, como recordó Chandrasekar, quien solía escribir y depurar código hasta altas horas de la noche. La disponibilidad de Stack Overflow les ahorraba tiempo y esfuerzo al brindarles un recurso comunitario excepcional, una experiencia apreciada por quienes la vivieron.

Con más de 200 millones de visitas mensuales solo desde computadoras de escritorio, el servicio prosperó y obtuvo inversiones destacadas de Silicon Valley, como Andreessen Horowitz y Union Square Ventures. En 2021, Prosus, respaldada por el gigante tecnológico chino Tencent, adquirió Stack Overflow por 1.800 millones de dólares. La ascensión de los modelos GPT

En ese mismo período, surgía un nuevo tipo de modelo de IA que combinaba dos conceptos: los transformadores y el preentrenamiento no supervisado, resultando en un transformador generativo preentrenado, o GPT. OpenAI lanzó GPT-3 en 2020 y lo puso a disposición del público en noviembre de 2021.

Un año después, lanzaron ChatGPT, un chatbot increíblemente popular basado en el modelo GPT-3 subyacente. En marzo, llegó GPT-4, considerado el modelo de IA más avanzado hasta la fecha. Estos modelos resultaron ser herramientas sorprendentemente útiles para abordar preguntas relacionadas con la codificación de software.

Además, han surgido servicios específicos de codificación impulsados por la IA, como Codex de OpenAI y GitHub Copilot. La última versión de GitHub Copilot, impulsada por GPT-4, debutó en marzo y añadió funciones de chat potentes, permitiendo a los programadores solicitar explicaciones sobre el código, identificar errores y obtener correcciones sugeridas.

Esta nueva tecnología está contribuyendo a una mayor velocidad en la producción de software. No sorprende entonces que los programadores dependan menos de Stack Overflow. «Solía visitar Stack Overflow todos los días antes de la existencia de chatGPT», escribió recientemente Nasim Uddin, desarrollador, en Twitter. «Pero en la actualidad, rara vez lo necesito».

El plan de Stack Overflow: monetizar sus datos de entrenamiento

Ante este panorama, Stack Overflow está respondiendo de dos formas principales. En primer lugar, está considerando cobrar a las empresas de tecnología que han utilizado sus datos de manera gratuita para entrenar servicios de IA de la competencia.

«Estamos ingresando a una nueva era», señaló Chandrasekar. «Aquellas personas que aprovechan nuestros datos con fines de LLM, tomamos la posición hace varios meses de que deberían comprometerse con nosotros. A nuestro parecer, deberíamos ser retribuidos por esos datos», añadió. «Grandes empresas nos han contactado proactivamente, y actualmente estamos involucrados en esas conversaciones».


Descubre más desde TecnoAp21

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario