Cómo no implementar un filtro de correo
Habida cuenta de la gran cantidad de correo basura (spam) que hoy en día circula por Internet, hoy practicamente todo el mundo utiliza algún filtro de correo para separar los mensajes legítimos de entre todos los demás que llegan al buzón. Hay tanto spam en Internet que aunque tú no utilices expresamente un filtro, seguramente tu proveedor de correo lo estará usando por ti. Son grandes filtros anti-spam Spamassassin, ahora como proyecto en el seno de laFundación Apache, el Bogofilter o el excelente Dspam, que es mi preferido y uno de los más robustos. Todas estas son alternativas libremente copiables, modificables y distribuibles, en unos grados de libertad iguales o parecidos a las libertades GPL, una licencia de software similar al Copyleft.
Desde luego, la gracia de un buen sistema de correo es filtrar los mensajes en el lado del servidor. Una vez recibido el mensaje se comprueba contra una lista de palabras o reglas “malditas”, en función de las cuales se determinará su inocuidad -entregándose en la bandeja de entrada-, o su estatus de correo basura -en cuyo caso se enviará a la papelera, en el mejor de los casos-.
Hoy, navegando por Internet a raíz del cierre de la satírica “Frikipedia” como consecuencia de una demanda judicial de la SGAE, llegué al sitio de esta entidad sin ánimo de lucro y estuve, como hago muchas veces, echando un vistazo al código del sitio web. Esto es muy interesante ya que a veces aparecen, naufragados en la Red, comentarios perdidos que un programador dejó a otro y que luego olvidó borrar, o directamente “grandes chapuzas temporales” que llegaron para quedarse y nunca nadie corrigió después.
El caso es que en la web de la SGAE hay ambas cosas, y también una de las peores implementaciones posibles para un sistema de filtrado de mensajes, como es filtrar en el lado del cliente con Javascript, desde el navegador web del usuario. El funcionamiento es tal que cada usuario que accede al sitio web de la SGAE descarga -sin saberlo- una ristra de palabras malsonantes. Si utilizas el formulario de contacto de este sitio web (en la sección “Contacto”) para enviar un mensaje a esta entidad de gestión, tu propio navegador comparará el texto escrito con cada una de las palabras prohibidas, a través de una curiosa función Javascript con el divertido nombre de pasapalabra(). Esta función será la encargada de “censurar” -en su caso- el mensaje enviado al aplicar al mensaje un código identificativo especial (257).

Al margen de los motivos que puedan llevar a una Sociedad como la SGAE -sin ánimo de lucro- a tener que filtrar los mensajes con insultos de los internautas, y al margen también del tremendo error que supone implementar el filtro en Javascript y en el lado del cliente (con lo que queda visible para todo el mundo, amén de resultar muy sencillo reconocer y saltar la protección), hay una cosa adicional que llama mucho la atención en la lista de “palabras malditas”, de insultos, y de vocablos malsonantes que son censurados en el formulario de contacto:

El caso es que incluyen al sistema operativo del pingüino, GNU/Linux, como palabra prohibida a evitar en los comentarios enviados, más o menos entre jodienda y marica, y al mismo nivel que cretino, puta, imbécil, truño y cabrones, por citar sólo los más suaves.
Lo que la SGAE no sabe es que GNU/Linux es un sistema operativo libre, de código abierto, independiente de cualquier empresa o iniciativa comercial, tecnológicamente neutral, multiplataforma y multiusuario, desarrollado de manera solidaria y colaborativa por miles de programadores distribuidos por Internet y que cualquiera puede copiar y utilizar. O quizás sí lo saben y por eso lo censuran en su formulario de contacto, aunque -por otra parte- lo estén usando con profusión en algunos de los sitios web que ellos mismos gestionan y promocionan.
Actualización [07/02/06 17:25]. Varios medios de comunicación como elmundo.es, 20minutos.es, santanderciudadviva.com, todo-linux.com, bandaancha.st se han hecho eco de este artículo, que también está circulando por muchos sitios de la blogosfera, como barrapunto.com, microsiervos.com, escolar.net (y II) o javimoya.com. Hace unas horas, la SGAE cerraba de manera provisional el formulario de contacto motivo de la polémica y retiraba los scripts aquí señalados, de los que -no obstante- existen todavías copias.
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 01:34
Qué bueno. Ahora mismo lo enlazo. (gracias por avisar).
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 07:07
eres un jodido linux, eso es lo que eres
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 08:51
[…] l, MiniBlog por Javi Moya el 7 de Febrero de 2006
Que bueno lo que han descubierto en Iteisa (me avisaba su autor). La web de la SGAE t […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 09:50
Viejo hack para joderles la función y que se mande el form sin problema:
en la barra de navegación (donde se pone http://….) teneis que poner lo siguiente y pulsar intro:
javascript:pasapalabra=function(){return true;};void(0);
y ya con eso se quita la función en sus morros y se les puede mandar un bonito correo con toda las palabras que uno quiera, insultos incluidos.
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 09:58
Jajaja, que de términos. Sangrantes, sangrais, sangráis.
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 11:53
La única razón por la que se me ocurre que tienen que poner el filtro en el lado del cliente es porque reciben demasiados msges con esas palabras y se les petaría el servidor tanto filtrar
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 12:01
Muy bueno!
Además, si cargas el form de envio en inglés, no llama al pal.js y no hace revisión de palabras…
Visteis el comentario… “Para tirar de la manta añadir…” jejejej Buenisimo
WilkY
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 13:11
[…] centenares de consultas ofensivas que reciben. Hasta ahí todo puede parece normal. Cuando una persona se da cuenta de que esas palabras están a la vista de cualquiera, ya se puede empezar a pensar […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 13:27
Mmmmm… podríamos montar un concurso. A ver quién encuentra más palabras del estilo que no estén en el filtro…
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 13:40
por cierto, que gracioso como lee el mundo la noticia, se pasa 5 minutos diciendo hijoputa hijo puta,etc…
http://www.elmundo.es/tts/rosa_noticia.html?r=%2Fnavegante%2F2006%2F02%2F07%2Fsoftlibre%2F1139311044.html
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 14:55
Sencillamente genial. Gracias, me he reido de lo lindo
Un abrazo
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 15:23
[…] contiene un curioso filtro de palabras en su formulario de contactos. Según publican en Iteisa weblog, la SGAE cuenta en su página web con un formulario de contacto al que aplican un filtro de t […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 15:28
[…] uta’, ‘mariconazo’ o ‘zurullo’ según descrubrió Jaime Gomez, de la empresa de desarrollo cántabra Iteisa.» Se trata de una función JavaScript llamada pasapalabra q […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 15:42
[…] podria decir que son unos hijos de puta (y tengo mis motivos : I, II, III, IV, V, VI, VII, VIII…). Primero cierran la Frikipedia y poco despues nos enteramos de que en su formu […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 15:44
Es curioso, me pregunto si habran pagado los chicos de http://www.copianos.com/
a MGM por utilizar imagenes de la pelicula HACKERS ( http://www.imdb.com/title/tt0113243/ ), que descaradamente usan en portada.
enlace
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 16:04
[…] o reciban correos que sean ofensivos para ellos. Pues bien, tal y como narra 20minutos.es, un blog, http://www.iteisa.com/wordpress/?p=35, se hace eco, tras investigar, que la SGAE filtra también la palabra Linux.
Es decir, en los correos en los que […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 16:07
SGAE quiere tener su monopolio sin que nadie les pise, que hace la UE respecto ala politica antimonopoloio solo lo aplican para los que ellos quieren, el gobierno apolla al monopolio y da lo mismo quienes gobierne y sus ideales, estos señores corrompe a los que quieren con tal de decir que “lo gratis es malo y lo que se paga es bueno” no me estraña que el Tribunal Costitucional obligara al MECD a retirar esos anuncios que daba ese mensaje……. ….. …..
Dentro nada SGAE nos obligara a compara un PC de su marca y TV o una Radio de SGAE permite yya que se lleva dinerito……..
Vamos que los de Microsoft se queda atras antes estos siverguenzas………..
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 16:31
A la SGAE no le mola nada el Linux
Jaime nos escribió anoche para comentarnos que tras leer nuestra anotación acerca del cierre de la Frikipedia a causa de una demanda de la SGAE se dio una vuelta por la web de la Sociedad y que allí descubrió una…
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 16:42
Es una verguenza… y por mas que denunciamos esto, nadie hace nada… puede mas la pasta
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 17:06
Deben de estar rectificando (lo cual no significa que hayan aprendido…).
La sección de contacto “está temporalmente deshabilitada” y tampoco se puede acceder a la función javascript del filtro.
Estaría bien que se explicasen en algún sitio… ¿o como ya no se puede ver es algo que no existe y ya no importa? ¿Tendría sentido en ese caso la denuncia (ridícula, por cierto) contra la Frikipedia?
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 17:29
Qué raro… ¿Y nunca nadie les ha llamado “bastardos malnacidos”? Todo esto es raro, raro, raro…
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 17:29
[…] o de atención al cliente está temporalmente deshabilitado.
Lo descubrieron en la web de Iteisa weblog, cuando, ‘merodeando’ por el código de la página web de la SGAE, como si de u […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 18:12
[…] ncias en Internet: Google Noticias : SGAE y Linux Escolar.net : A mí no me llamas linux Iteisa : Cómo no implementar un filtro de correo ElMundo.es : Entre ‘jodienda’ […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 19:06
[…] formación extraida de… ufff… veamos: Informativos Telecinco El mundo Escolar Iteisa
This entry was posted
on Tuesday, February 7th, 2006 a […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 19:22
[…] es un pedazo de Linux!
Ayer conocimos a través de un blogger -cada vez ocurre más esto- que la SGAE utilizaba un script en su formulario de contacto para ev […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 20:58
Estarán cansados de que les preguntemos porqué tenemos que pagar canon por los CD en los que grabamos Linux (es mejor hacerse el sordo verdad?) …
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 21:32
Je je. Basta con cmunicarles su condicion de hijo_s de pu_ta, (aunque estas lo niegan) chu_pa sangr_es u sangrador_es de lo ajeno, marico_nazos, etc. Esto no lo filtra el filtrador ese
Juan S.
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 23:15
[…] en correos ofensivos a la SGAE incluyendo una gran variedad de insultos. Un autor del blog Iteisa consiguió obtener la lista completa de las palabras tabú que el filtro de la SGAE ev […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 23:18
Bueno, lo de la SGAE hace tiempo que no tiene nombre y paso de hacer comentarios sobre ellos.
Pero lo del programador también es de escándalo, ¿es que no sabe que en Javascript puedes usar expresiones regulares?, me causa dolor a la vista ese código.
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 02:41
Ellos denuncian a la Frikipedia por llamarlos Ganster cnd son ellos mismos los q ponen al SO Linux al nivel de “mierda”, “mamon”…etc?? Q yo sepa la frikipedia era una web wiki dnd cualquiera puede escribir, pero el código de su web no creo yo q fuese wiki… ¡¡ Ánimo Krusher!!
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 11:33
[…] Gómez descubrió que también se incluía la palabra Linux según informa Elmundo.es a raíz de otras fuentes.
Ahora ya tenemos más variedad en el diccionario de insultos:
Eres un hij […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 18:28
[…] HA!), vai vai denunciar a todas as webs que a difamen.
Se é que son todos unha panda de linux!
Escrito por IaRRoVaWo
(0) Comentarios •
(0) Referencias  […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 21:13
[…] ucro y que utilizan incluso en la propia entidad en servidores. Tenemos todos los detalles en un artículo de Iteisa Weblog. Al parecer, la SGAE ha cerrado su formulario de contacto por la gran cant […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 21:47
[…] ueño vasco Febrero 8, 2006 La SGAE y el Linux Off-Topic mode > ON http://www.iteisa.com/wordpress/?p=35 Off-Topic mode > OFF […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 00:24
Teddy “Canario” Flautista eres el puto amo de la pista
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 22:29
[…] nbsp; Nos han pillado Los de Iteisa nos han pillado infragantis. This entry was posted on Wednesday, Fe […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 13:23
[…] centenares de consultas ofensivas que reciben. Hasta ahí todo puede parece normal. Cuando una persona se da cuenta de que esas palabras están a la vista de cualquiera, ya se puede empezar a pensar […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 19:20
los de la esgae son unos emeaefeioeseoese y unos hacheijotaoesedeepeuteaese
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 12:43
[…] tes de la SGAE. Toda la información sobre esta noticia la encontrarás en Iteisa Weblog. Deja tu comentario Nombre (requerido) Mail […]
Tuesday 7 dEurope/Berlin February dEurope/Berlin 2006 at 15:14
Pues un bucle infinito para ellos:
while (siempre)
{
printf (”Que le den por el **** a la SGAE”);
}