Usenet

Muchos proveedores de servicios de Internet, y muchos otros sitios de Internet, operan servidores de noticias para que sus usuarios puedan acceder. Los proveedores de servicios de Internet que no operan sus propios servidores directamente, a menudo ofrecen a sus usuarios una cuenta de otro proveedor que opera específicamente las fuentes de noticias. En las primeras implementaciones de noticias, el servidor y el lector de noticias eran un único conjunto de programas, que se ejecutaban en el mismo sistema. Hoy en día, se utiliza un software cliente lector de noticias separado, un programa que se parece a un cliente de correo electrónico pero que accede a los servidores de Usenet en su lugar.

No todos los ISPs gestionan servidores de noticias. Un servidor de noticias es uno de los servicios de Internet más difíciles de administrar debido a la gran cantidad de datos implicados, la pequeña base de clientes (en comparación con el servicio de Internet principal) y un volumen desproporcionadamente alto de incidentes de atención al cliente (que se quejan con frecuencia de la falta de artículos de noticias). Algunos ISP subcontratan las operaciones de noticias a sitios especializados, que suelen parecer al usuario como si el propio ISP gestionara el servidor. Muchos de estos sitios tienen una fuente de noticias restringida, con un número limitado de grupos de noticias. Los grupos de noticias en lenguas extranjeras y la jerarquía alt.binaries, que contiene principalmente software, música, vídeos e imágenes, y que representa más del 99% de los datos de los artículos, suelen ser omitidos de este tipo de fuentes.

También hay proveedores de Usenet que ofrecen un servicio completo sin restricciones a los usuarios cuyos ISP no tienen noticias, o que tienen un feed restringido.

Lectores de noticiasEditar

Típicamente se accede a los grupos de noticias con lectores de noticias: aplicaciones que permiten a los usuarios leer y responder a las publicaciones en los grupos de noticias. Estas aplicaciones actúan como clientes de uno o más servidores de noticias. Históricamente, Usenet se asociaba con el sistema operativo Unix desarrollado en AT&T, pero ahora existen lectores de noticias para los principales sistemas operativos. Los modernos clientes de correo o «suites de comunicación» suelen tener también un lector de noticias integrado. Sin embargo, a menudo estos clientes integrados son de baja calidad, comparados con los lectores de noticias independientes, e implementan incorrectamente los protocolos, estándares y convenciones de Usenet. Muchos de estos clientes integrados, por ejemplo, el de Outlook Express de Microsoft, no gustan a los puristas por su mal comportamiento.

Con el auge de la World Wide Web (WWW), los front-ends web (web2news) se han hecho más comunes. Los frontales web han reducido los requisitos de la barrera de entrada técnica a la de una aplicación y ninguna cuenta de servidor NNTP de Usenet. Ahora hay numerosos sitios web que ofrecen pasarelas basadas en la web a grupos de Usenet, aunque algunas personas han empezado a filtrar los mensajes realizados por algunas de las interfaces web por una u otra razón. Google Groups es una de esas puertas de enlace basadas en la web y algunos navegadores web pueden acceder a Google Groups a través de enlaces de protocolo de noticias directamente.

Grupos de noticias moderados y no moderadosEditar

Una minoría de grupos de noticias están moderados, lo que significa que los mensajes enviados por los lectores no se distribuyen directamente a Usenet, sino que se envían por correo electrónico a los moderadores del grupo de noticias para su aprobación. El moderador debe recibir los artículos enviados, revisarlos e inyectar los artículos aprobados para que puedan propagarse adecuadamente por todo el mundo. Los artículos aprobados por un moderador deben llevar la línea de encabezamiento Aprobado:. Los moderadores se encargan de que los mensajes que los lectores ven en el grupo de noticias se ajusten a los estatutos del mismo, aunque no están obligados a seguir ninguna de sus normas o directrices. Normalmente, los moderadores se nombran en la propuesta del grupo de noticias, y los cambios de moderadores siguen un plan de sucesión.

Históricamente, antes de la reorganización de Usenet existía una jerarquía mod.*. Ahora, los grupos de noticias moderados pueden aparecer en cualquier jerarquía, normalmente con .moderado añadido al nombre del grupo.

Los grupos de noticias de Usenet en la jerarquía Big-8 se crean mediante propuestas llamadas Request for Discussion, o RFD. El RFD debe tener la siguiente información: nombre del grupo de noticias, entrada en el archivo checkgroups y estado moderado o no moderado. Si el grupo va a ser moderado, se debe proporcionar al menos un moderador con una dirección de correo electrónico válida. Otra información que es beneficiosa pero no obligatoria incluye: un estatuto, una justificación y una política de moderación si el grupo va a ser moderado. A continuación se discute la propuesta del nuevo grupo de noticias, y se termina con los miembros del Consejo de Administración de Big-8 tomando la decisión, por votación, de aprobar o desaprobar el nuevo grupo de noticias.

Los grupos de noticias no moderados forman la mayoría de los grupos de noticias de Usenet, y los mensajes enviados por los lectores para los grupos de noticias no moderados se propagan inmediatamente para que todos los vean. El filtrado mínimo del contenido editorial frente a la velocidad de propagación constituyen uno de los puntos clave de la comunidad de Usenet. Una defensa poco citada de la propagación es la cancelación de un mensaje propagado, pero pocos usuarios de Usenet utilizan este comando y algunos lectores de noticias no ofrecen comandos de cancelación, en parte porque el almacenamiento de artículos caduca en un plazo relativamente corto de todos modos. Casi todos los grupos de Usenet no moderados se han convertido en colecciones de spam.

Detalles técnicosEditar

Usenet es un conjunto de protocolos para generar, almacenar y recuperar «artículos» de noticias (que se asemejan a los mensajes de correo de Internet) y para intercambiarlos entre un público lector que está potencialmente muy distribuido. Estos protocolos suelen utilizar un algoritmo de inundación que propaga copias a través de una red de servidores participantes. Cada vez que un mensaje llega a un servidor, éste lo reenvía a todos sus vecinos de red que aún no hayan visto el artículo. Sólo se almacena una copia de un mensaje por servidor, y cada servidor lo pone a disposición de los lectores (normalmente locales) que pueden acceder a ese servidor. La colección de servidores de Usenet tiene, por tanto, un cierto carácter peer-to-peer en el sentido de que comparten recursos intercambiándolos, la granularidad del intercambio, sin embargo, está en una escala diferente a la de un sistema peer-to-peer moderno y esta característica excluye a los usuarios reales del sistema que se conectan a los servidores de noticias con una aplicación cliente-servidor típica, muy parecida a un lector de correo electrónico.

El RFC 850 fue la primera especificación formal de los mensajes intercambiados por los servidores de Usenet. Fue sustituido por el RFC 1036 y, posteriormente, por el RFC 5536 y el RFC 5537.

En los casos en los que se ha publicado contenido inadecuado, Usenet cuenta con soporte para la eliminación automática de una publicación de toda la red mediante la creación de un mensaje de cancelación, aunque debido a la falta de autenticación y al abuso resultante, esta capacidad se desactiva con frecuencia. Los titulares de derechos de autor aún pueden solicitar la eliminación manual de material infractor utilizando las disposiciones de las implementaciones de los tratados de la Organización Mundial de la Propiedad Intelectual, como la Ley de Limitación de la Responsabilidad por Infracción de Derechos de Autor en Línea de los Estados Unidos, pero esto requeriría dar aviso a cada administrador del servidor de noticias.

En Internet, Usenet se transporta a través del Protocolo de Transferencia de Noticias en Red (NNTP) en el puerto TCP 119 para las conexiones estándar, sin protección, y en el puerto TCP 563 para las conexiones cifradas SSL.

OrganizaciónEditar

Las «Nueve Grandes» jerarquías de Usenet

El mayor conjunto de grupos de noticias a nivel mundial está contenido en nueve jerarquías, ocho de las cuales son operadas bajo directrices consensuadas que rigen su administración y denominación. Los ocho grandes actuales son:

comp.* – discusiones relacionadas con la informática (comp.software, comp.sys.amiga)
humanidades.* – bellas artes, literatura y filosofía (humanidades.clásicos, humanidades.diseño.misc)
misc.* – temas diversos (misc.education, misc.forsale, misc.kids)
news.* – discusiones y anuncios sobre noticias (es decir, Usenet, no eventos actuales) (news.groups, news.admin)
rec.* – recreación y entretenimiento (rec.música, rec.arts.movies)
sci.* – discusiones relacionadas con la ciencia (sci.psychology, sci.research)
soc.* – discusiones sociales (soc.college.org, soc.culture.african)
talk.* – discusiones sobre varios temas controvertidos (talk.religión, talk.politics, talk.origins)

Ver también el Gran Renombramiento.

La jerarquía de alt.* no está sujeta a los procedimientos que controlan los grupos de los Ocho Grandes, y como resultado está menos organizada. Los grupos en la jerarquía alt.* tienden a ser más especializados o específicos-por ejemplo, puede haber un grupo de noticias bajo los Ocho Grandes que contenga discusiones sobre libros infantiles, pero un grupo en la jerarquía alt puede estar dedicado a un autor específico de libros infantiles. Los binarios se publican en alt.binaries.*, lo que la convierte en la mayor de todas las jerarquías.

Además de éstas, se distribuyen muchas otras jerarquías de grupos de noticias. Las jerarquías regionales y de idiomas específicos como japan.*, malta.* y ne.* sirven a países y regiones específicas como Japón, Malta y Nueva Inglaterra. Las empresas y los proyectos administran sus propias jerarquías para hablar de sus productos y ofrecer apoyo técnico a la comunidad, como la histórica jerarquía gnu.* de la Free Software Foundation. Microsoft cerró su servidor de noticias en junio de 2010, ofreciendo ahora soporte para sus productos a través de foros. Algunos usuarios prefieren utilizar el término «Usenet» para referirse únicamente a las ocho grandes jerarquías; otros incluyen también alt.*. El término más general «netnews» incorpora todo el medio, incluyendo los sistemas de noticias de organizaciones privadas.

También existen convenciones informales de subjerarquías. Los grupos *.answers suelen ser grupos moderados de publicación cruzada de preguntas frecuentes. Un FAQ se publicaría dentro de un grupo y un post cruzado al grupo *.answers en la cabeza de la jerarquía visto por algunos como un refinamiento de la información en ese grupo de noticias. Algunos subgrupos son recursivos -hasta el punto de cierta tontería en alt.*.

Contenido binarioEditar

Un ejemplo visual de los muchos y complejos pasos necesarios para preparar los datos que se subirán a los grupos de noticias de Usenet. Estos pasos deben realizarse de nuevo a la inversa para descargar datos de Usenet.

Usenet se creó originalmente para distribuir contenido de texto codificado en el conjunto de caracteres ASCII de 7 bits. Con la ayuda de programas que codifican valores de 8 bits en ASCII, resultó práctico distribuir archivos binarios como contenido. Los mensajes binarios, debido a su tamaño y a su a menudo dudoso estatus de derechos de autor, se restringieron con el tiempo a grupos de noticias específicos, facilitando a los administradores el permitir o no el tráfico.

El método de codificación más antiguo y ampliamente utilizado para el contenido binario es uuencode, del paquete Unix UUCP. A finales de la década de 1980, los artículos de Usenet solían estar limitados a 60.000 caracteres, y hoy en día existen límites más duros. Por lo tanto, los archivos suelen dividirse en secciones que requieren ser reensambladas por el lector.

Con las extensiones de cabecera y las codificaciones MIME Base64 y Quoted-Printable, hubo una nueva generación de transporte binario. En la práctica, MIME ha visto incrementada su adopción en los mensajes de texto, pero se evita para la mayoría de los adjuntos binarios. Algunos sistemas operativos con metadatos adjuntos a los archivos utilizan formatos de codificación especializados. En el caso de Mac OS, se utilizan tanto BinHex como tipos MIME especiales. Otros sistemas de codificación menos conocidos que pueden haberse utilizado en algún momento fueron BTOA, codificación XX, BOO y codificación USR.

En un intento de reducir los tiempos de transferencia de archivos, en 2001 se introdujo una codificación informal de archivos conocida como yEnc. Consigue una reducción de aproximadamente el 30% de los datos transferidos al suponer que la mayoría de los caracteres de 8 bits pueden transferirse con seguridad a través de la red sin codificarlos primero en el espacio ASCII de 7 bits. El método más común para subir grandes mensajes binarios a Usenet es convertir los archivos en archivos RAR y crear archivos de paridad para ellos. Los archivos de paridad se utilizan para recrear los datos que faltan cuando no todas las partes de los archivos llegan a un servidor.

Tiempo de retención de binariosEditar

Captura de pantalla de octubre de 2020 que muestra 60 PB de datos de grupos de Usenet.

Cada servidor de noticias asigna una determinada cantidad de espacio de almacenamiento para el contenido de cada grupo de noticias. Cuando este almacenamiento se ha llenado, cada vez que llega un nuevo mensaje, se borran los mensajes antiguos para dejar espacio al nuevo contenido. Si el ancho de banda de la red disponible para un servidor es alto pero la asignación de almacenamiento es pequeña, es posible que una enorme avalancha de contenidos entrantes desborde la asignación y expulse todo lo que había en el grupo antes. El tiempo medio que los mensajes pueden permanecer en el servidor antes de ser eliminados se denomina comúnmente tiempo de retención.

Los grupos de noticias binarios sólo pueden funcionar de forma fiable si hay suficiente almacenamiento asignado para manejar la cantidad de artículos que se añaden. Sin un tiempo de retención suficiente, un lector no podrá descargar todas las partes del binario antes de que se agote la asignación de almacenamiento del grupo. En un tiempo, esta era la forma de contrarrestar la publicación de contenidos no deseados; el grupo de noticias se inundaba con publicaciones aleatorias de datos basura, en cantidad suficiente para expulsar todo el contenido que debía suprimirse. Esto se ha compensado con la asignación por parte de los proveedores de servicios de un almacenamiento suficiente para retener todo lo que se publica cada día, incluidas las inundaciones de spam, sin borrar nada.

Los servidores de noticias de Usenet modernos tienen capacidad suficiente para archivar años de contenido binario incluso cuando se les inunda de nuevos datos a la máxima velocidad diaria disponible.

En parte debido a estos largos tiempos de retención, así como a las crecientes velocidades de carga de Internet, Usenet también es utilizado por los usuarios individuales para almacenar datos de respaldo. Mientras que los proveedores comerciales ofrecen servicios de copia de seguridad en línea más fáciles de usar, el almacenamiento de datos en Usenet es gratuito (aunque el acceso a Usenet en sí no lo sea). El método requiere que el cargador ceda el control sobre la distribución de los datos; los archivos se difunden automáticamente a todos los proveedores de Usenet que intercambian datos para el grupo de noticias en el que se publica. En general, el usuario debe seleccionar, preparar y cargar los datos manualmente. Los datos suelen estar encriptados porque cualquiera puede descargar los archivos de copia de seguridad. Una vez subidos los archivos, tener varias copias repartidas por distintas regiones geográficas del mundo en diferentes servidores de noticias disminuye las posibilidades de pérdida de datos.

Los principales proveedores de servicios de Usenet tienen un tiempo de retención de más de 12 años.Esto supone más de 60 petabytes (60000 terabytes) de almacenamiento (ver imagen). Cuando se utiliza Usenet para el almacenamiento de datos, se prefieren los proveedores que ofrecen un mayor tiempo de retención para garantizar que los datos sobrevivirán durante más tiempo en comparación con los servicios con un menor tiempo de retención.

Cuestiones legalesEditar

Mientras que los grupos de noticias de binarios pueden utilizarse para distribuir trabajos creados por usuarios completamente legales, software de código abierto y material de dominio público, algunos grupos de binarios se utilizan para distribuir ilegalmente software comercial, medios con derechos de autor y material pornográfico.

Los servidores de Usenet operados por los proveedores de servicios suelen bloquear el acceso a todos los grupos alt.binaries.* tanto para reducir el tráfico de la red como para evitar los problemas legales relacionados. Los proveedores de servicios comerciales de Usenet afirman que operan como un servicio de telecomunicaciones, y afirman que no son responsables del contenido binario publicado por el usuario y transferido a través de sus equipos. En Estados Unidos, los proveedores de Usenet pueden acogerse a la protección de la normativa DMCA Safe Harbor, siempre que establezcan un mecanismo para cumplir y responder a los avisos de retirada de los titulares de los derechos de autor.

La eliminación de los contenidos con derechos de autor de toda la red de Usenet es una tarea casi imposible, debido a la rápida propagación entre servidores y a la retención que realiza cada uno de ellos. Pedir la eliminación de un proveedor de Usenet sólo lo elimina de la caché de retención de ese servidor, pero no de los demás. Es posible que se distribuya un mensaje especial de cancelación del post para eliminarlo de todos los servidores, pero muchos proveedores ignoran los mensajes de cancelación por política estándar, porque pueden ser fácilmente falsificados y enviados por cualquiera. Para que una petición de cancelación sea más efectiva en toda la red, tendría que ser emitida al servidor de origen en el que se ha publicado el contenido, antes de que se haya propagado a otros servidores. La eliminación del contenido en esta primera fase impediría su propagación posterior, pero con los modernos enlaces de alta velocidad, el contenido puede propagarse tan rápido como llega, sin dar tiempo a que los titulares de los derechos de autor revisen el contenido y lo retiren.

Establecer la identidad de la persona que publica el contenido ilegal es igualmente difícil debido al diseño de la red basado en la confianza. Al igual que el correo electrónico SMTP, los servidores suelen asumir que la información de cabecera y de origen de un mensaje es verdadera y precisa. Sin embargo, al igual que en el correo electrónico SMTP, las cabeceras de los mensajes de Usenet se falsifican fácilmente para ocultar la verdadera identidad y ubicación del origen del mensaje. En este sentido, Usenet es significativamente diferente de los servicios P2P modernos; la mayoría de los usuarios de P2P que distribuyen contenido suelen ser inmediatamente identificables para todos los demás usuarios por su dirección de red, pero la información de origen de un mensaje de Usenet puede estar completamente oculta y no se puede obtener una vez que se ha propagado más allá del servidor original.

También, a diferencia de los servicios P2P modernos, la identidad de los descargadores está oculta. En los servicios P2P, un descargador es identificable para todos los demás por su dirección de red. En Usenet, el descargador se conecta directamente a un servidor, y sólo el servidor conoce la dirección de quien se conecta a él. Algunos proveedores de Usenet guardan registros de uso, pero no todos ponen esta información registrada a disposición de terceros, como la Recording Industry Association of America. La existencia de puertas de enlace anónimas a USENET también complica el rastreo del verdadero origen de los mensajes.