Il peut s'avérer nécessaire de devoir supprimer une URL de l'index de Google. C'est le cas par exemple de vieilles URL qui datent de quand
les URL de notre annuaire n'étaient pas encore réécrites. Avec des caches datant d'il y a 9 ou 10 mois pour certains, plus d'un an pour d'autres, on les retrouve dans
Google si l'on tape l'adresse exacte dans la boîte de recherche. Cela ne signifie pas qu'elles ressortent dans les résultats (ouf !)
Bref voici la
page qui permet de supprimer des URL. Il faut préalablement s'inscrire à Google Services.
Il faut entrer manuellement les URL à supprimer dans le fichier robots.txt (à mettre en place de préférence à la racine du site). Ensuite accéder à la page de Google Services mentionnée plus haut et cliquer sur
Supprimer des pages, des sous-répertoires ou des images à l'aide d'un fichier robots.txt
Il reste à entrer l'adresse du fichier robots.txt et patienter pendant 24h. Les URL à supprimer ont le statut "
en attente" pendant ce délai, puis le statut "
terminée".
Au delà de six mois, elles acquièrent le statut "
arrivée à expiration" ce qui signifie qu'elles sont indexables à nouveau... mais seulement si vous faites en sorte que ce soit possible (basiquement, en faisant des liens rentrants vers elles).
Megachercheur 2006-04-11 12:42:06, Général - 1 commentaire(s)
Je reviens sur la question des liens contextuels suite à une discussion avec quelqu'un du marketing chez Viapresse.com qui est notre partenaire (voir la rubrique
Actualités et médias).
Effectivement, l'intérêt des page où s'entassent des liens réciproques relevant de thématiques complètement différentes est de plus en plus limité. Les pages de ce type sont de moins en moins prises en compte par Google. Il s'agit d'un référencement considéré comme "non naturel". Attention, ce n'est pas du tout négatif, simplement les liens de ce type n'ont plus le même poids qu'avant.
L'idéal pour améliorer son propre référencement est d'
obtenir des liens contextuels. Dans le cas de Viapresse.com, trouver des sites qui parlent de presse/actualités/média et qui rédigent trois lignes avec au milieu des trois lignes un lien, avec une ancre ("anchor text" comme on dit en anglais) qui ne soit pas "Viapresse" mais par exemple "magazines de la presse française".
Exemple : On ne saurait trop souligner l'importance de la lecture, notamment de
magazines de la presse française pour se tenir au courant de l'actualité dans le monde.
Cet exemple est idéal car il y a ce qu'on appelle un contexte sémantique : votre lien figure au milieu d'un texte où on trouve les mots "lecture", "tenir au courant", "actualité", "monde". De plus, l'ancre "magazines de la presse française" ne comporte pas un seul mot (ce qui serait considéré par Google comme de la sur-optimisation) mais comporte une phrase entière qui restitue le contexte (on peut aller jusqu'à 8 mots dans l'ancre).
Je viens de le faire sur
ce blog consacré au positionnement mais l'intérêt est limité par le fait que la thématique de Megachercheur n'est pas la presse magazine. Par contre si Viapresse.com trouve 50 partenaires qui acceptent ce type de
lien contextuel, ils devraient grimper dans Google (cela dépend certes aussi d'autres facteurs...)
Concernant les annuaires, il ne faut s'inscrire que dans ceux qui sont
comme le nôtre : regardez ma page http://www.megachercheur.com/annuaire/cat2-21.php
Elle ne parle que de presse, d'actualité, de télévision, de spectacle. Donc un contexte sémantique intéressant car correspondant à la thématique actu/média au sens large.
Inutile (voir éventuellement pénalisant) de s'inscrire dans 2000 annuaires s'ils sont fourre-tout et n'ont pas de rubrique spécifique pour votre site. Attention donc à tous les nouveaux annuaires en marque blanche qui n'ont pas de base suffisamment ample pour permettre des thématiques précises : ils sont de véritables liens d'élevage (sans intérêt, donc).
Megachercheur 2006-04-10 10:34:39, Général - 1 commentaire(s)
Google n'est pas le seul à aimer ce
blog sur le positionnement. MSN Search, le troisième des principaux moteurs de recherche utilisés par les internautes, nous classe en seconde position sur la requête
blog référencement. Bien sûr il n'y a que 221,401 résultats sur cette requête contre près de 9 millions et demi sur Google France, mais ne boudons pas notre plaisir.
Autre surprise amusante, Megachercheur sort en première position sur les plus de 45 millions de résultats de la requête
links exchange. Il s'agit en fait de notre répertoire d'échange de liens avec des sites anglo-saxons (ou en tout cas rédigés en anglais).
Bref Megachercheur est en ce moment une véritable bombe sur les moteurs de recherche, on ne s'en plaindra pas.
Megachercheur 2006-04-09 08:25:41, Général - 1 commentaire(s)
Une petite erreur s'était glissée lors de la réecriture d'URL de ce
blog sur le référencement. En bas de page sur la lecture des billets, figure un lien vers le billet suivant, et un vers le billet précédent. J'avais simplement oublié d'ajouter la terminaison .php sur ces liens. Comme je ne les utilise pas, c'était passé inaperçu. Ils sont pourtant bien utile pour une lecture chronologique, sans avoir à taper la date dans le calendrier.
Correction faite aujourd'hui, donc. Heureusement, Google (qui pourtant adore ce blog et l'a propulsé dans le top10 sur la requête
blog référencement) n'a indexé aucun des liens erronés. Ouf !
Megachercheur 2006-04-08 10:17:50, Général - 109 commentaire(s)
On sait qu'aujourd'hui Google accorde une importance sans cesse plus grande au contexte sémantique dans lequel sont insérés les liens. Si votre site a trait aux
voyages et que votre lien figure au côté de sites sur
la voyance,
l'immobilier ou les
sonneries gratuites l'intérêt sera quasiment nul.
C'est pour cela que notre
annuaire comporte un grand nombre de catégories qui se veulent les plus précises possibles. D'ailleurs si vous estimez que votre lien figure sur une page insuffisament pertinente, il faut alors nous
contacter et nous en créerons une nouvelle pour vous.
Nous recommandons d'ailleurs la plus grande prudence concernant les nouveaux annuaires qui se créent et qui ont une base de sites insuffisante, ce qui débouche sur des catégories trop larges et donc trop "fourre-tout". Evitez d'y faire figurer votre site, au mieux cela ne servira à rien, au pire vous risquez la pénalité si vous faites de même sur des centaines d'annuaires.
Concernant la question du contexte sémantique, depuis aujourd'hui notre annuaire compte maintenant 15 sites affichés par page. En effet, il nous a paru important de renforcer la densité de texte pertinent sur chaque page d'annuaire.
Prenons un exemple au hasard. Sur la page consacrée aux
animaux, le terme
animaux apparait bien plus souvent si 15 sites sont visibles plutôt que s'il n'y en avait que 10. En sachant que ce mot-clé est bel et bien inséré dans un contexte sémantique pertinent (les sites vers lesquels il renvoie). En sachant aussi que 15 reste un nombre suffisamment mesuré pour ne pas risquer de pénalité pour "bourrage de mots-clé".
En effet l'annuaire est complètement inséré à l'intérieur du site Megachercheur.com dont les rubriques de la colonne (à gauche) n'ont rien à voir avec les thèmes de l'annuaire. Il était donc essentiel de renforcer le poids des thématiques de l'annuaire dans le contexte global de la page dans laquelle elle s'insère.
Megachercheur 2006-04-07 08:19:48, Général - 3 commentaire(s)
Ces jours-ci a eu lieu une mise-à-jour par Google du nombre de BL de chaque site, ainsi que du PR Toolbar. Megachercheur a maintenant
527 back links selon la commande link: à entrer dans
Google.
Au niveau du PR dans la barre d'outil, la page d'accueil reste à PR5, le
blog référencement sur lequel vous êtes passe à PR5, par contre notre page consacrée aux ressources en référencement reste à PR0 (probablement car elle n'a pas de liens externes rentrants). La page
marketing est à PR4, tout comme l'
annuaire, la section des
links exchange (en anglais), et la page d'accueil des
articles sur le référencement. Parmi ces articles,les trois plus anciens ont un petit PR qu'ils avaient déjà, mais aucun des nouveaux n'en acquiert.
Au niveau des pages intérieurs de l'
annuaire, celles des catégories ont un PR3 (par exemple les
sites marchands), et celles des sous-catégories ont un PR2 (par exemple la
voyance). Les pages intérieures de chaque catégorie ont un PR2, celles des sous-catégories ont un PR0 ou PR1 parfois (comme les
petites annonces).
Megachercheur 2006-04-06 10:53:49, Général - 0 commentaire(s)
C'est officiel depuis le 27 mars dernier, c'en est fini du
Page Rank Réel ou Live PR. Rappelons qu'il existait jusqu'à maintenant
deux calculs du Page Rank : celui de la Toolbar mis à jour à intervalles assez irréguliers, généralement entre un et trois mois, et le PR en continu que des sites comme
Raketorskning.com (site suédois en anglais) permettaient de calculer en permanence.
L'annonce a été faite par
Matt Cutts il y a quelques jours. Extrait :
Q: Is the RK parameter turned off, or should we expect to see it again?
A: I wouldn’t expect to see the RK parameter have a non-zero value again.
"Je ne m'attendrais pas à voir le RK revenir à une valeur non nulle" dit-il, et de fait aujourd'hui le PR live de tous les sites est égal à zéro et le restera, semble-t-il.
Dommage, car c'était un instrument intéressant pour les échanges de liens.
Megachercheur 2006-04-05 09:07:01, Général - 0 commentaire(s)
Maintenu (si on peut dire, parfois on se demande) par plus de 70,000 éditeurs, le répertoire Open Source DMOZ est extrêmement critiqué par la communauté des webmasters du fait de la longeur des files d'attente pour avoir la "chance" de voir enfin son site visité par un éditeur (et peut-être retenu pour figurer dans la catégorie adéquate de l'index) L'arrogance en particulier de certains éditeurs est souvent citée lorsqu'il s'agit de répondre aux demandes des webmasters qui veulent savoir si "les choses avancent". C'est sans doute difficilement supportable.
Pendant longtemps (si ce mot a un sens en SEO) avoir un site répertorié dans DMOZ était pourtant considéré comme un plus. L'une des raisons est qu'il existe des scripts gratuits qui permettent à n'importe quel site en mal de contenu de "reproduire" virtuellement le répertoire DMOZ (600,000 pages quand même) sur son nom de domaine. Avis aux webmasters fainéants...
De leur côté, les sites inscrits dans DMOZ gagnaient automatiquement des BL chaque fois qu'un nouveau site mettait en place un nouveau clone de DMOZ sur son nom de domaine. D'où l'intérêt pendant longtemps d'être dans DMOZ.
C'est précisément ce qui parait être en train de prendre fin, car selon une étude qui vient d'être publiée, les moteurs semblent aujourd'hui considérer ces sites clones de DMOZ comme ce qu'ils sont : du spam.
Cette étude montre qu'environ la moitié de ces sites miroirs sont bannis par l'un au moins des trois principaux moteurs de recherche (Google, Yahoo! et MSN). Le plus enclin à bannir est Google (on pouvait s'y attendre) avec 37% des sites clones bannis par lui (Yahoo! en aurait banni 11%, MSN 9%).
Il semble que ce ne soit pas seulement les pages qui reproduisent DMOZ qui sont bannis, mais le site en entier. Le problème est donc sérieux pour les webmasters encore épargnés et qui vont devoir réagir très vite.
La discussion originale et quelques données de l'étude sont disponibles sur
WebmasterWorld
Megachercheur 2006-04-04 18:53:24, Général - 0 commentaire(s)
Dans un fil de
debriefing sur la
Sphère, plusieurs participants du concours tiger ont parlé de "sites plombés" quasi-impossibles à placer sur Google. Cela parait être le cas de sites filtrés sur certaines requêtes, peut-être aussi de sites ayant souffert de pénalisations antérieures ? (je ne pense pas forcément à un
blacklistage mais à des déclassements pour diverses raisons pas toujours faciles à identifier).
En tout cas, malgré de gros efforts en terme de
référencement ces sites sont restés confinés en page 2 et 3, au désespoir de leurs webmaitres.
A l'inverse pour Megachercheur, en ce moment c'est le survoltage sur
Google, la preuve ce blog ouvert il y a trois semaines et déjà propulsé dans le top10 au côté des plus grand sur la requête
blog référencement (actuellement 9,320,000 résultats) comme je le signalais hier.
L'intéressant est que je n'ai quasiment pas fait d'inscription du blog dans les annuaires. Peut-être le concours
moctodnv7 m'a-t-il dopé car étant dans le top 10 sur la requête il y a quelques jours, j'ai bénéficié d'un magnifique lien en page d'accueil de
l'organisateur, dont la thématique du site est également tournée vers le référencement (en particulier sur Google).
Megachercheur 2006-04-03 14:19:47, Général - 0 commentaire(s)
Les liens sortants
pénalisants, ce serait une nouveauté sur Google. C'est l'hypothèse qu'a voulu tester en décembre dernier
Graywolf (du site www.wolf-howl.com consacré entre autre au SEO).
Les conclusions de son test sont intéressantes et ont déjà été pas mal commentées au cours des 3 derniers mois. Selon lui, il vaut mieux éviter de faire des liens sortants en utilisant comme ancre une requête sur laquelle vous voulez vous positionner.
Exemple, l'on veut se positionner sur la requête
blog référencement (pour laquelle
Megachercheur est 9ème sur 9,240,000 résultats), il faut éviter de faire un lien externe (vers un autre site donc) en utilisant cette même ancre "blog référencement".
Si je dois absolument faire ce lien externe (dans le cas d'un partenariat par exemple), il vaudrait mieux faire
comme ceci (WRI est 10ème sur cette requête) puisque la requête "comme ceci" ne m'intéresse pas.
Si cela s'avère exact, voilà qui va pas mal compliquer les partenariats entre sites de même
thématique (donc cherchant à se positionner sur les mêmes mots-clé).
Megachercheur 2006-04-02 11:11:13, Général - 1 commentaire(s)

Une étude de Nielsen/NetRatings qui vient de paraître montre que
Google est utilisé pour 48,5% des recherches aux Etats-Unis, contre 22,5% pour
Yahoo! et 10,7% pour
MSN Search. Le nombre de recherches réalisées par les internautes américains aurait augmenté de 38% en un an, particulièrement les recherches d'images qui ont explosé.
Sur ces 38% d'augmentation, la quasi-totalité a bénéficié à
Google et
Yahoo! (
MSN ne bénéficiant que d'une toute petite partie de cette croissance, 4%).
Les chiffres concernant la France auraient besoin d'être mis à jour, mais on sait qu'ici
Google est beaucoup plus utilisé qu'aux USA.
Megachercheur 2006-03-30 10:40:02, Général - 0 commentaire(s)
Il est maintenant possible de déposer une offre d'
échange de liens sur le
forum référencement du site. C'est le moyen de gagner un lien supplémentaire vers vos pages web, avec un retour possible de la part d'autres webmasters s'ils sont intéressés.
Certains liens (les liens thématiques) sont plus efficaces que d'autres, mais cela n'empêche pas de faire des liens généralistes vers des sites différents du vôtre. Le pire est d'avoir un site isolé sur la Toile
Avec leurs limites, les
concours de référencement montrent bien l'intérêt de faire des liens, y compris tous azimuts, même si l'effet est globalement moindre qu'il y a quelques années.
Megachercheur 2006-03-29 16:38:01, Général - 5 commentaire(s)

Pas mal d'annuaires sur lesquels nous faisons des soumissions utilisent la technologie AscreeN, développée par le site
ApocalX.
Il s'agit d'une petite image de taille 120x90 et au format .jpg qu'il faut uploader à la racine du site. Les
annuaires qui utilisent AscreeN affichent alors l'image à côté de la description du site. Lorsqu'il n'y en a pas, ils vont alors chercher la copie d'écran de Dmoz ou d'Alexa.
La différence avec
AscreeN est que l'éditeur du site décide exactement de ce que verront les visiteurs des annuaires (ce n'est pas une simple copie d'écran à l'aveugle).
Megachercheur 2006-03-27 16:23:33, Général - 105 commentaire(s)
Flux RSS de Megachercheur
Consultez les derniers billets en ajoutant ce
lien RSS dans votre lecteur de flux RSS.
Qu'est ce qu'un fil RSS ?
Les fils RSS (de l'anglais "Really Simple Syndication") sont des fils de contenus gratuits en provenance de sites web. Ils contiennent des titres de billets et des liens hypertexte vers les billets intégraux.
A quoi sert un fil RSS ?
Il s'agit d'un moyen simple et pratique d'être alerté en permanence sur un domaine d'actualité qui vous intéresse. Les fils s'actualisent automatiquement et en permanence, sans que vous soyez obligé de vous connecter sur vos sites d'informations préférés.
Comment lire un fil RSS ?
Il existe différents logiciels. Parmi les plus connus, citons: Alert Info, Sharp Reader, Newsgator ou encore Tekinews, Thunderbird. Vous pouvez également insérer directement le contenu d'un fil RSS sur votre site en ajoutant dans le code source un script en Javascript.
Liste des flux RSS
Voici le lien RSS au format 2.0 que vous devez ajouter dans votre lecteur de fil RSS afin d'avoir accès aux derniers billets sur Megachercheur
Megachercheur 2006-03-26 15:43:49, Général - 96 commentaire(s)
Le
blog est maintenant référencé sur
Technorati, il s'agit du plus gros moteur de recherche de blogs. Autant
Google ré-indexe le web à l'aveuglette et de façon systématique, autant
Technorati se contente de mettre en avant en continu les nouveaux billets publiées dans les blogs.
Incroyablement efficace !
Pour surveiller les liens provenant d'autres blogs, il suffit de
faire une recherche (pour l'instant il n'y en a pas encore).
Cliquez sur le lien pour connaître les blogs qui parlent de
tiger l'osmose sur Technorati.
Megachercheur 2006-03-25 14:21:59, Général - 0 commentaire(s)
Un
outil de référencement supplémentaire est maintenant en place sur le site, il permet de mesurer le
positionnement d'un site sur un ou plusieurs mots-clé dans les moteurs de recherche.
Il renvoie les résultats en français de
Google, Yahoo! et MSN Search. Très pratique !
Megachercheur 2006-03-24 14:00:22, Général - 3 commentaire(s)
Vendredi dernier le site KinderStart spécialisé dans les conseils aux parents a porté plainte contre
Google car son site parait avoir nettement chuté dans les résultats de recherche du moteur. Ils veulent monter une action collective en justice (comme c'est possible aux USA) en regroupant tous les sites qui ont été backlistés par
Google depuis janvier 2001
Ils estiment que leurs droits constitutionnels à la libre expression ont été bafoués par le moteur, qui leur aurait en quelque sorte coupé la parole avec cette
désindexation.
Megachercheur 2006-03-21 12:48:29, Général - 2 commentaire(s)
Décidément, ils sont plus forts comme moteur de recherche et sur le web que dans le monde de la finance.
Google - la société cotée en bourse - vient encore de se prendre un rateau, en publiant sur son site des chiffres sur ses recettes publicitaires qui n'étaient pas destinés à être rendus public. C'est la deuxième bourde en matière de communication financière. Le monde des affaires apprécie modérément l'amateurisme.
Google est également sur la brêche dans la question de la fraude au clic. Rappelons que depuis février dernier des annonceurs poursuivent en justice le n°1 mondial de la recherche sur l'Internet. Ils estiment qu'ils paient pour de faux clics (ce seraient leurs concurrents qui cliquent pour faire augmenter les dépenses marketing). Par contre
Google fait de l'argent au passage, ce qu'apprécie moyennement les annonceurs.
Pour mettre un terme aux poursuites,
Google vient de proposer un total de 90 millions de dollars aux annonceurs mécontents.
Rappelons que
Google ne vit que de recettes publicitaires
Megachercheur 2006-03-20 19:01:12, Général - 95 commentaire(s)
Le site
Proxymouse permet de surfer de façon (relativement) anonyme sur l'Internet. Il ouvre une petite frame dans la partie supérieure de la fenêtre de votre navigateur, il vous reste alors à y entrer l'Url du site que vous voulez visiter anonymement. Celui-ci apparait alors dans une seconde frame, qui occupe cette fois l'essentiel de votre écran et vous permet de surfer de façon relativement confortable.
Le problème est que Google indexe les pages visitées à l'aide de Proxymouse ! Donc entre la page originale du site et la page qui apparait dans la frame Proxymouse, la similitude est presque totale. Or Google considère que ce sont deux pages différentes et les indexent comme telles.
Le risque de
duplicat content est donc élevé, avec à la clé la disparition de votre page de l'index de Google.
Pour empêcher cela, il faut empêcher Proxymouse d'accéder à votre site. On peut le repérer à l'aide de son IP (67.19.211.250) à qui il suffit d'interdire l'accès de votre site. C'est facile avec un fichier .htaccess à mettre en place à la racine de votre site :
RewriteEngine on
RewriteCond %{REMOTE_ADDR} 67\.19\.211\.250
RewriteRule .* - [F]
Dorénavant, votre site renvoit une erreur 403 aux sollicatations intempestives de Proxymouse. Pour vérifier, lancez le site
Proxymouse et entrez votre Url.
Megachercheur 2006-03-19 19:02:53, Général - 2 commentaire(s)
Il suffit de consulter le site
Archive.org. Le design parait vraiment vieux jeu, mais finalement il n'a pas tant changé que cela ! Allez, encore quelques
vieux logos de Google (pour la route).
Megachercheur 2006-03-17 13:39:41, Général - 0 commentaire(s)
Une façon intéressante pour un site web de générer du trafic consiste à rédiger des articles sur des sujets divers, puis à les publier sur d'autres sites. Les lecteurs de ces articles, s'ils sont intéressés, ne manqueront pas de venir voir le site de leur auteur.
Voici une liste de sites en anglais qui permettent de publier vos textes.
Ezine articles -
ezinearticles.com/?id=139422
Upromote.com -
www.upromote.com
Submit your Articles now -
www.submityourarticlesnow.com
The Warrior Forum -
www.warriorforum.com/forum
Web Host Industry Review -
www.thewhir.com/find/articlecentral
Digital Women.com -
www.digital-women.com/submitarticle.htm
Ezine Articles -
www.ezinearticles.com
Family-Content.com -
www.family-content.com/articles
GoArticles.com -
www.goarticles.com -
Home-Business-Directory.com -
www.home-business-directory.com
isnare.com -
www.isnare.com
Jogena's -
www.jogena.com
Organic-Rankings.com -
www.organic-rankings.com
Soyez inspiré et n'oubliez pas votre lien en signature
Megachercheur 2006-03-13 14:43:15, Général - 104 commentaire(s)

Un flux RSS du blog est maintenant disponible
Il est
parsé c'est-à-dire directement lisible par n'importe quel navigateur. Ce sont les titres des 20 derniers billets du blog qui apparaissent. Il suffit de cliquer pour ouvrir la page correspondante du
blog.
Si vous recherchez du contenu pour votre site web et qu'il tourne en Php, il est très facile d'afficher ce flux (ou n'importe quel autre) en le
parsant vous aussi. Pour cela il y a quelques lignes de code en Php à insérer à l'intérieur du fichier où vous voulez que le
flux RSS s'affiche.
Megachercheur 2006-03-12 19:28:27, Général - 88 commentaire(s)

Le site
Megachercheur.com qui a fêté le mois dernier ses deux ans d'existence compte déjà un
annuaire généraliste, un
répertoire de liens orientés moteurs de recherche, un
forum consacré au référencement, une série d'
articles sur le référencement de sites, et une page destinée à parler de
marketing Internet.
Il manquait quelque chose sur ce portail
Il existait une rubrique
Actualités avec un fil RSS mais qui n'était jamais mise à jour. Aujourd'hui je lance donc le blog
référencement de Megachercheur. Tout comme le reste du site, il sera consacré au référencement et au positionnement sur les moteurs de recherche. Pour ce blog, j'ai décidé d'utiliser un script OpenSource peu connu mais très léger et efficace, il s'appelle
Plugged Out.
Souhaitons à ce blog des mises-à-jour nombreuses.
Megachercheur 2006-03-12 13:06:51, Général - 3 commentaire(s)