Spam dans les blogs

Le Spam de dans les blogs (également appelé simplement Spam de blog de ou le Spam de commentaire de ) est une forme de Spamdexing . Il est fait en signalant automatiquement des commentaires aléatoires ou en favorisant des services commerciaux aux blogs , aux Guestbooks de Wikis ou à d'autres conseils en ligne publiquement accessibles de discussion. N'importe quelle application Web qui accepte et liens hypertextes d'affichages soumis par des visiteurs peuvent être une cible.

Ajouter les liens qui indiquent le site Web de l'inondateur artificiellement augmente le rang du Search Engine de l'emplacement. Un rang accru a souvent comme conséquence l'emplacement commercial de l'inondateur étant énuméré en avant d'autres emplacements pour certaines recherches, augmentant le nombre de visiteurs potentiels et payant des clients.

Histoire

Ce type de Spam est à l'origine apparu dans les Guestbooks d'Internet où les inondateurs remplissent à plusieurs reprises guestbook de liens à leur propre emplacement et d'aucun commentaire approprié aux rangs de Search Engine d'augmentation. Si un commentaire réel est donné c'est souvent juste " ; page" frais ; , " ; website" gentil ; , ou mots-clés du lien spammed.

Dans le 2003 , les inondateurs ont commencé à tirer profit de la nature ouverte des commentaires dans le blogging le logiciel de comme le type mobile en plaçant à plusieurs reprises des commentaires aux divers poteaux de blog qui n'ont fourni rien davantage qu'un lien au site Web commercial de l'inondateur. Jay Allen a créé un embrochable libre, appelé MT-Mettent sur la liste noire, pour le type mobile l'outil de weblog (versions avant 3.2) qui a essayé d'alléger ce problème. Beaucoup de paquets blogging courants ont maintenant des méthodes d'empêcher ou de réduire l'effet du Spam de blog, mais les inondateurs sont devenus plus futés aussi bien. Bon nombre d'entre eux les outils spéciaux de Spamming de blog d'utilisation comme le présentateur de Trackback de pour dévier la protection de Spam de commentaire sur les systèmes blogging populaires aiment le type mobile, le Wordpress et d'autres.

Solutions possibles

Blocage par mot-clé

C'est la forme la plus simple de blocage, qui donne des résultats très bons, parce que le Spam de commentaire est visé aux bots, ainsi il doit être lisible par le logiciel simple. Beaucoup de Spam peut être bloqué en interdisant des noms des pharmaceutiques et des jeux populaires de casino.

Le problème principal avec cette approche est que les inondateurs trouvent constamment de nouveaux moyens d'orthographier ou colporter leurs marchandises, ainsi ceci exige la mise à jour constante. Par exemple, bloquant le " ; viagra" ; réduirait le Spam près beaucoup, mais les inondateurs commenceront le " de Spamming ; vi@gra" ; , " ; v1agr@" ; , " ; vigra" ;. Il y a également un nombre incomptable de marchandises que les inondateurs essayent de vendre, rendant ce système difficile à maintenir mis à jour.

rel" ; nofollow" ; < ! -- Cette section est liée du PageRank -->

voient également : Nofollow

Début 2005, Google a annoncé que des liens hypertextes avec le rel=" ; nofollow" ; l'attribut de n'influencerait pas le rang de la cible de lien dans l'index du Search Engine. Les moteurs de recherche de Yahoo et de MSN respectent également cette étiquette.

Le Nofollow est un terme mal approprié dans ce cas-ci puisqu'il indique réellement un " de Search Engine ; Ne pas marquer ce link" ; plutôt que le " ; Ne pas suivre ce link." ; Ceci diffère de la signification de nofollow comme utilisée dans une étiquette de méta de robots de , que does indiquent à un Search Engine : " ; Ne pas suivre les liens hypertextes l'uns des dans le corps de ce document." ;

Using le rel=" ; nofollow" ; est une solution beaucoup plus facile qui fait les techniques improvisées au-dessus de non pertinent. La plupart de logiciel de weblog marque maintenant lecteur-a soumis des liens de cette façon par défaut (sans l'option pour le désactiver sans modification de code). Un logiciel de serveur plus sophistiqué a pu épargner le nofollow pour des liens soumis par le a fait confiance aux utilisateurs comme ceux enregistrés pendant longtemps, sur un Whitelist , ou avec un karma élevé . Du logiciel de serveur ajoute le rel=" ; nofollow" ; aux pages qui ont été récemment éditées mais les omettent des pages stables, sous la théorie que les pages stables auront eu des liens offensants enlevées par les rédacteurs humains.

Un certain weblog écrit l'objet à l'utilisation du rel=" ; nofollow" ; , discutant, par exemple, ce
Les inondateurs de lien continueront à spam chacun pour atteindre les emplacements qui n'emploient pas le rel=" ; nofollow" ;
Les inondateurs de lien continueront à placer des liens pour cliquer (par des surfers), même si ces liens sont ignorés par des moteurs de recherche.
Google préconise l'utilisation du rel=" ; nofollow" ; afin de réduire l'effet du l'inter-blog lourd liant sur le rang de page.
Google préconise l'utilisation du rel=" ; nofollow" ; pour réduire au minimum seulement ses propres efforts de filtrage, et à guider que ceci réellement mieux s'était appelé le rel=" ; nopagerank" ; .
Nofollow peut réduire la valeur des commentaires légitimes

D'autres sites Web aiment le Slashdot , avec la participation élevée d'utilisateur, des réalisations improvisées par utilisation de nofollow comme ajouter le rel=" ; nofollow" ; seulement pour les utilisateurs potentiellement de conduite. Inondateurs potentiels posant comme les utilisateurs peuvent être déterminés par la diverse heuristique comme l'âge du compte enregistré et d'autres facteurs. Slashdot emploie également le karma de l'affiche comme cause déterminante en attachant une étiquette de nofollow aux liens soumis par utilisateur.

rel=" ; nofollow" ; est venu pour être considéré comme un Microformat .

Validation (essai renversé de Turing)

Une méthode à bloquer a automatisé des commentaires de Spam exige une validation avant d'éditer le contenu de la forme de réponse. Le but est de vérifier que la forme est soumise par un vrai être humain et pas par un outil de Spam, et a été donc décrite comme essai de Turing d'inverse de . L'essai devrait être d'une telle nature qu'un être humain peut facilement passer, tandis qu'un outil automatisé échouerait très probablement.

Beaucoup de formes sur des sites Web tirent profit de la technique du CAPTCHA , montrant une combinaison des nombres et des lettres inclus dans une image, qui doit être écrite littéralement dans la forme de réponse pour passer l'essai. Afin de maintenir dehors des outils de Spam avec l'identification intégrée des textes de , les caractères dans les images sont d'habitude mauvais, tordu et bruyant. Un inconvénient des beaucoup CAPTCHAs plus ancien est que les mots de passe sont habituellement le distinguant majuscules et minuscules, alors que les images correspondantes souvent ne permettent pas une distinction des minuscules capitales et. Ceci devrait être tenu compte en concevant une liste de CAPTCHAs.

Une alternative simple à CAPTCHAs est la validation sous forme de question du mot de passe , fournissant un conseil aux visiteurs humains que le mot de passe est la réponse à une question simple comme le " ; La terre tourne autour… du " ;.

Un inconvénient à prendre en compte est que n'importe quelle validation exigée sous forme de champ additionnel de forme peut devenir un ennui particulièrement aux affiches régulières. Bloggers et propriétaires de guestbook peuvent noter une diminution significative du nombre de commentaires une fois qu'une telle validation est in place.

Rejet des liens dans des poteaux

Il y a gain négligeable du Spam qui ne contient pas des liens, tellement actuellement tous les poteaux de Spam contiennent (nombre excessif de) des liens. Il est sûr d'exiger passer des essais de Turing seulement si le poteau contient des liens et laisser tous autres poteaux à travers. Tandis que c'est fortement - efficace, les inondateurs envoient fréquemment des poteaux de baragouin (tels que le " ; aeriqoj" de ljibia d'ajliabisadf ;) pour examiner le filtre de Spam. Ces poteaux de baragouin ne seront pas marqués comme Spam. Ils font l'inondateur aucun bon, mais ils obstruent toujours des sections commentaires.

Les soumissions d'ordures pourraient cependant également résulter des spambots du niveau 0, qui n'analysent pas les champs attaqués de forme de HTML d'abord, mais envoient des demandes génériques de POTEAU contre des pages. Ainsi il se produit qu'un " ; content" ; ou " ; forum_post" ; La variable de POTEAU est placée et reçue par le logiciel de blog ou de forum, mais le " ; uri" ; ou l'autre nom de champ faux d'URL n'est pas accepté et n'est pas ainsi sauvé comme spamlink.

Réoriente

Au lieu de montrer un lien hypertexte direct soumis par un visiteur, une application Web pourrait montrer un lien à un manuscrit sur son propre site Web qui réoriente à l'URL correct . Ceci n'empêchera pas tout le Spam puisque les inondateurs ne vérifient pas toujours la redirection de lien, mais empêche effectivement contre augmenter leur PageRank , juste comme rel=nofollow. Un avantage supplémentaire est que le manuscrit de redirection peut compter combien de personnes visitent les URL externes, bien qu'il augmente la charge sur l'emplacement.

Réoriente devrait être le Serveur-côté pour éviter des issues d'accessibilité liées au client-côté réoriente. Ceci peut être fait par l'intermédiaire du dossier du .htaccess dans le Apache .

Une autre manière d'empêcher la fuite de PageRank est de se servir de la redirection publique ou des services dereferral du tels que le TinyURL . Par exemple,

href=" de Link

là où le « alias_of_target » est le nom d'emprunt de l'adresse de cible.

Approches distribuées

Cette approche est très nouvelle à adresser le Spam de lien. Un des points faibles des filtres de Spam de lien est que la plupart des emplacements reçoivent seulement un lien de chaque domaine qui court une campagne de Spam. Si l'inondateur varie des IP address, il y a peu à aucun modèle distinguable laissé sur l'emplacement vandalized. Le modèle, cependant, est laissé à travers les milliers d'emplacements qui ont été frappés rapidement avec les mêmes liens.

Une approche distribuée, comme le libre LinkSleeve emploie le XML-RPC pour communiquer entre les diverses applications de serveur (telles que des blogs, des guestbooks, des forum, et des wikis) et le serveur de filtre, dans ce cas-ci LinkSleeve. Les données signalées sont dépouillées des URL et chaque URL est vérifié contre les URL récemment soumis à travers le Web. Si un seuil est dépassé, un " ; reject" ; la réponse est retournée, de ce fait supprimant le commentaire, le message, ou la signalisation. Autrement, un " ; accept" ; le message est envoyé.

Une approche distribuée plus robuste est un Akismet , qui emploie une approche semblable à LinkSleeve mais à clefs des utilisations api pour assigner la confiance aux noeuds et a également une distribution plus large en raison de l'empaquetement avec le dégagement 2. Ils réclament plus de 140.000 blogs contribuant à leur système. Des bibliothèques d'Akismet ont été mises en application pour Java, python, rubis, et PHP, mais son adoption peut être gênée par la condition d'une clef d'api et de ses restrictions commerciales d'utilisation. Aucune telle restriction n'est in place pour LinkSleeve.

Le pot de miel de projet de a également commencé à dépister des inondateurs de commentaire. Le projet emploie son vaste réseau des milliers de pièges installés dans sur cent pays autour du monde afin d'observer quels robots de Web de Spamming de commentaire sont signalisation aux blogs et forum. Des données sont alors éditées sur les pays supérieurs pour le Spamming de commentaire, comme les mots-clés et les URL supérieurs étant favorisés. Les données du projet sont alors rendues disponibles aux inondateurs de commentaire connus par bloc par le HTTP de : BL . De diverses connexions ont été développées pour tirer profit du HTTP de : BL API.

Méthodes spécifiques à l'application d'anti-Spam

En particulier les logiciels populaires tels que le type mobile et le MediaWiki ont développé leurs propres mesures faites sur commande d'anti-Spam, car les inondateurs concentrent plus d'attention sur viser ces plates-formes. Whitelists et listes noires qui empêchent certains IPS de la signalisation, ou qui empêchent des personnes du contenu de signalisation qui assortit certains filtres, sont les défenses communes. Des listes de contrôle d'accès plus avancées exigent de diverses formes de validation avant que les utilisateurs puissent contribuer n'importe quoi comme le linkspam.

Le but est dans tous les cas de permettre à de bons utilisateurs de continuer à ajouter des liens à leurs commentaires, comme c'est considéré comme étant par certains un aspect valable de n'importe quelle section commentaires.

Surveillance d'alimentation de RSS

Quelques wikis te permettent d'accéder à une alimentation de RSS des changements ou des commentaires récents. Si vous ajoutez qu'à votre lecteur Usenet et installé une recherche futée des limites communes de Spam (habituellement Viagra et d'autres noms de drogue) vous pouvez rapidement identifier et enlever le Spam offensant.

Marques de réponse

Des autres filtrent disponible aux webmasters sont d'ajouter une marque cachée de session de ou la fonction de gâchis à leur carte réponse. Quand les commentaires sont soumis, des données stockées dans la signalisation telle que l'IP address et la période de la signalisation peuvent être comparées aux données stockées à la marque ou au gâchis de session produit quand l'utilisateur a chargé la carte réponse. Des signalisations qui emploient différents IP address pour charger la carte réponse et signaler la carte réponse, ou les signalisations qui ont pris des périodes exceptionnellement courtes ou longues de composer peuvent être filtrées dehors. Cette méthode est particulièrement efficace contre les inondateurs qui charrient leur IP address afin d'essayer de cacher leurs identités.

Ajax

Certain logiciel de blog tel que le typo permettent à l'administrateur de blog de permettre seulement des commentaires soumis par l'intermédiaire du Ajax XMLHttpRequests, et jettent des demandes régulières de POTEAU de forme. Ceci pose des problèmes d'accessibilité typiques aux applications d'Ajax-only.

Bien que cette technique empêche le Spam jusqu'ici, c'est une forme de sécurité de par l'obscurité et sera probablement défait s'il devient assez populaire.

Changement outre des commentaires

Un nombre croissant de bloggers ont choisi de s'éteindre commente entièrement en raison du volume de commentaires de Spam.

Voir également

Adversarial de recherche documentaire
Spam social de gestion de réseau de

.

Random links:Andrew Mitchell | Élection partielle de Romsey, 2000 | James Cleland Richardson | Aéroport de Hamilton | Lamentations (vivre à l'empire 2003 de Bush du berger) | Spam_en_blogs