El cofundador de Wikipedia, Jimmy Wales, dijo que la organización sin fines de lucro detrás de la enciclopedia en línea está buscando más acuerdos de licencia con empresas de IA. Esta iniciativa se está llevando a cabo mientras una serie de bots de IA automatizados tensionan la infraestructura de Wikipedia.
Wales explicó que las empresas de IA utilizan el conocimiento disponible gratuitamente de la plataforma para entrenar modelos de lenguaje grandes (LLMs). Señaló que los bots de IA de alto volumen rastrean todo el sitio, imponiendo cargas técnicas y financieras significativas a la plataforma.
"Los bots de IA... están recorriendo la totalidad del sitio... así que tenemos que tener más servidores, más RAM y memoria para el almacenamiento en caché, y eso nos cuesta una cantidad desproporcionada", explicó.
Wales ha señalado que el uso intensivo por parte de los bots de IA obliga a Wikipedia a ampliar sus servidores, aumentar la RAM y mejorar el almacenamiento en caché, todo lo cual tiene un alto costo.
Aunque el sitio es gratuito para los usuarios individuales, señaló, el acceso automatizado de alto volumen por parte de empresas de IA con fines de lucro es otro problema. La organización sin fines de lucro firmó un acuerdo de licencia con Google en 2022 y está negociando acuerdos similares con otras empresas.
La organización sin fines de lucro que opera Wikipedia, la Fundación Wikimedia, depende de donaciones públicas relativamente pequeñas y editores voluntarios para funcionar, lo que no estaba destinado a financiar desarrollos de IA a gran escala con fines de lucro.
Wales dijo que es injusto que los contribuyentes y donantes asuman los costos de las empresas comerciales de IA que utilizan el contenido de Wikipedia.
Wikipedia afirma que advierte sobre la carga insostenible de los bots de IA. Esas demandas en los servidores de Wikipedia han aumentado considerablemente en los últimos meses. Los bots automatizados han incrementado el tráfico —particularmente a través de descargas multimedia— y han provocado que la organización sin fines de lucro necesite invertir fuertemente en infraestructura.
Gran parte de este tráfico se origina en empresas de IA que extraen contenido diseñado para entrenar sus modelos, en lugar de provenir de humanos. En 2022, la Fundación lanzó un producto comercial de pago, Wikimedia Enterprise, para proporcionar acceso a su contenido principal a escala y ofrecer a los usuarios de la plataforma las herramientas y recursos necesarios.
Este servicio está diseñado para aliviar la presión en el sitio en vivo de Wikipedia mientras proporciona a los desarrolladores de IA los datos necesarios para mejorar sus modelos. Wales instó a las empresas de IA a utilizar esta opción de pago en lugar de extraer datos del sitio público.
Si las empresas no cumplen con estas medidas técnicas, Wales afirmó, se podría implementar la restricción del acceso de bots a través de herramientas como AI Crawl Control. Existe cierto debate con las empresas sobre el papel de la IA pública (o comercial) en la gestión de datos personales que los usuarios ahora poseen en una escala que excede el derecho legal al conocimiento libre y transparente, y lo que necesitan los sectores público y privado.
Con una proporción cada vez mayor del procesamiento de IA que depende en gran medida de grandes conjuntos de datos disponibles públicamente, Wikipedia aboga por un enfoque justo que compense tanto a las entidades que mantienen estos datos como a las empresas. Wikipedia no es inmune a su compromiso de mantener la neutralidad.
El sitio web Wikipedia ha estado en funcionamiento durante más de 20 años como una entidad sin fines de lucro gestionada por la Fundación Wikimedia. Su modelo se basa en un ejército global de editores voluntarios, que dedican su tiempo a crear, editar y corregir contenido.
Las donaciones públicas son un ingrediente clave para garantizar que permanezca abierto a cualquier persona, en cualquier lugar, independientemente de la cantidad de dinero o el alcance geográfico que tengan disponible. Wikipedia, un sitio web y enciclopedia internacional bien conocido, también ha luchado por mantenerse neutral entre otras fuentes.
El problema se vuelve aún más agudo cuando se informa en detalle sobre cuestiones políticas de alto riesgo, movimientos sociales o conflictos armados en todo el mundo. Wales dijo que aunque la mayoría de los editores de Wikipedia no son activistas, las preferencias personales pueden influir en cómo se cubren los temas.
Sin embargo, agregó que confía en la comunidad, diciendo que los editores tienden a lograr de alguna manera los valores de Wikipedia de justicia y precisión, incluso bajo intensa presión. La neutralidad de la plataforma se evidencia aún más en su política comunitaria, métodos de revisión por pares y proceso de disputas, entre otros aspectos.
Al mismo tiempo, la dependencia constante de voluntarios y donaciones destaca la debilidad del sistema. Y a medida que la plataforma enfrenta nuevas presiones, incluido un aumento en el uso de su contenido por parte de las empresas de IA, garantizar que los valores fundamentales de la plataforma (neutralidad, precisión y acceso libre) continúen sin cambios se vuelve cada vez más importante.
¿Quieres que tu proyecto esté frente a las mentes más brillantes de las criptomonedas? Preséntalo en nuestro próximo informe de la industria, donde los datos se encuentran con el impacto.


