Problema de Scunthorpe

From Wikipedia, the free encyclopedia

Un ejemplo del problema de Scunthorpe en Wikipedia debido a una expresión regular que identifica "cunt" en el nombre de usuario

El problema de Scunthorpe es el bloqueo involuntario de sitios web, correos electrónicos, publicaciones en foros o resultados de búsqueda por parte de un filtro de spam o un motor de búsqueda porque su texto contiene una cadena (o subcadena) de letras que parecen tener un significado obsceno o inaceptable. Los nombres, las abreviaturas y los términos técnicos se citan con mayor frecuencia como afectados por el problema.

El problema surge porque las computadoras pueden identificar fácilmente cadenas de texto dentro de un documento, pero interpretar palabras de este tipo requiere una habilidad considerable para interpretar una amplia gama de contextos, lo cual es una tarea extremadamente difícil. Como resultado, las amplias reglas de bloqueo pueden generar falsos positivos que afecten a frases inocentes.

El problema recibió su nombre de un incidente en 1996 en el que el filtro de blasfemias de AOL impidió que los residentes de la ciudad de Scunthorpe, North Lincolnshire, Inglaterra, crearan cuentas con AOL, porque el nombre de la ciudad contiene la subcadena "cunt" (una manera vulgar en inglés de referirse a la vagina y que además se utiliza como insulto).[1] A principios de la década de los 2000, los filtros SafeSearch opcionales de Google cometieron el mismo error, y los servicios y empresas locales que incluían a Scunthorpe en sus nombres o URL se encontraban entre los excluidos por error de aparecer en los resultados de búsqueda.[2]

Soluciones alternativas

El problema de Scunthorpe es difícil de resolver por completo debido a la dificultad de crear un filtro capaz de comprender palabras en contexto.[3][4] Una solución consiste en crear una lista de permitidos de falsos positivos conocidos. El filtro puede ignorar cualquier palabra que aparezca en la lista de permitidos, aunque contenga texto que de otro modo no estaría permitido.[5]

Otros ejemplos

Véase también

Referencias

Related Articles

Wikiwand AI