
La red social acusa a la startup de IA de raspar miles de millones de publicaciones sin permiso. El caso podría marcar un nuevo precedente en la disputa sobre los derechos de autor y el entrenamiento de modelos de IA.
Reddit presentó una demanda federal en Nueva York contra la empresa de inteligencia artificial Perplexity, acusándola de raspar de forma ilegal datos de la plataforma para entrenar su motor de búsqueda basado en IA, conocido como “motor de respuesta”.
Según la denuncia, Perplexity y otras tres empresas especializadas en extracción de datos —Oxylabs (Lituania), AWMProxy (Rusia) y SerpApi (Texas)— habrían eludido las medidas de protección de Reddit para recopilar masivamente publicaciones, comentarios y contenido generado por usuarios sin autorización.
“Perplexity necesita desesperadamente estos datos para alimentar su sistema”, señala la demanda, que acusa a la startup de aprovecharse del contenido gratuito creado por los usuarios de Reddit sin compensación ni licencia.
Reddit busca frenar el uso de su contenido en modelos de IA
La plataforma, conocida por albergar miles de comunidades temáticas llamadas subreddits, argumenta que es una de las fuentes más citadas por los sistemas de inteligencia artificial al responder preguntas o generar texto.
Reddit ha firmado acuerdos de licencia legítimos con Google y OpenAI, que pagan por acceder a su contenido para entrenamiento de modelos. Sin embargo, Perplexity —una startup en rápido crecimiento— no cuenta con ningún acuerdo de este tipo.
Reddit afirma que, tras enviar una carta de cese y desistimiento el año pasado, Perplexity aumentó cuarenta veces el número de citas a Reddit en sus resultados, lo que demostraría una acción intencionada de continuar con el uso de sus datos.
La compañía solicita una compensación económica no especificada y una orden judicial que impida a Perplexity seguir utilizando o beneficiándose del contenido extraído.
Reacciones y contexto
Un portavoz de SerpApi negó las acusaciones y afirmó que la empresa planea defenderse enérgicamente en los tribunales. Oxylabs y AWMProxy, por su parte, no respondieron a las solicitudes de comentarios.
La demanda llega en un momento de creciente tensión entre plataformas de contenido y empresas de IA, a medida que crece el debate sobre quién posee los derechos sobre los datos utilizados para entrenar modelos.
Reddit, que cotiza en bolsa desde marzo de 2024, ha reforzado su control sobre el acceso a su API y busca proteger su contenido como activo estratégico frente al auge de la inteligencia artificial generativa.
Descubre más desde TecnoAp21
Suscríbete y recibe las últimas entradas en tu correo electrónico.
Categorías:Inteligencia artificial, Noticias, Secciones temáticas



1 respuesta »