404 Media informó que Auttomatic, la empresa propietaria de WordPress y Tumblr

Un representante de Auttomatic me remitió a una publicación de blog pública después de que el artículo de 404 Media se publicara cuando pedí un comentario. La publicación del blog indica que los sitios de Auttomatic actualmente bloquean a los rastreadores de IA, pero cuando comiencen a compartir datos con las compañías de IA, ofrecerán una opción para optar por no hacerlo en el futuro.

“Estamos trabajando directamente con compañías de IA seleccionadas siempre que sus planes estén alineados con lo que le importa a nuestra comunidad: atribución, opciones de exclusión y control”, dice la publicación del blog. “Nuestras asociaciones respetarán todas las configuraciones de exclusión”.

El informe de 404 Media incluyó mensajes internos de empleados de Auttomatic que describían cómo los ingenieros tenían la tarea de compilar publicaciones desde 2014 hasta 2023, pero habían cometido algunos errores, según el reportaje de 404. Los empleados incluyeron publicaciones de blogs eliminados o suspendidos, publicaciones privadas en blogs públicos y respuestas privadas de la función “Preguntar”, según el informe.

Lo más notable es que también incluyeron contenido marcado como NSFW o “maduro”, aunque no se suponía que incluyeran esos. Tumblr prohibió la pornografía y la desnudez en 2018, pero en 2022 flexibilizó esas reglas para permitir la desnudez (pero aún no imágenes sexualmente explícitas). Vale la pena leer la historia de 404 sobre lo que Auttomatic está o no está haciendo acerca de estos aparentes errores.

ChatGPT será introducido a fanfics
Mientras tanto, cualquiera que haya pasado tiempo en Tumblr sabe que hay una cornucopia hermosa de cosas extrañas y de nicho, especialmente entre los fandoms. Así que ahora ChatGPT podrá escribir fanfics de Fawnlock aún mejores. (Sí, esa es una versión de fanfiction de Sherlock Holmes donde Sherlock y Watson son parte ciervos). ¿Progreso?

Tumblr no es la única plataforma social que está haciendo acuerdos como este. Reddit tiene un acuerdo de 60 millones de dólares al año para licenciar sus datos a Google para entrenar su IA. Facebook e Instagram, por supuesto, ya están usando datos para las propias herramientas de IA internas de Meta.

Esto puede ser controvertido para algunos usuarios, que se sienten incómodos con que su contenido, en Tumblr, esto es a menudo escritura personal o fotografía o arte, sea utilizado para entrenar IA.