Le travail des moteurs de recherche

Beaucoup de webmasters débutants et amateurs seulement de surfer sur Internet concernés par la question: comment les moteurs de recherche fonctionnent? Principes de base des moteurs de recherche aujourd'hui considérera le Pays des Conseils.




Le moteur de recherche moderne est un ensemble complet constitué des programmes les plus compliqués et des algorithmes travaillant à une vitesse étonnante. Imaginez, le nouveau algorithme de recherche La caféine de Google est capable de traiter des informations équivalentes à 3 km de feuilles A4 en seulement 1 seconde!



Dans tous les moteurs de recherche, les composants logiciels peuvent être divisés en cinq groupes principaux:



  • "Araignées"

  • "Les araignées qui voyagent"

  • indexeurs

  • des bases

  • systèmes de résultats



Araignées - araignées (araignées) - par l'algorithme de leur travail ressemblent à des navigateurs, mais n'ont pas de composants visuels. L'araignée charge le code html de la page en utilisant des protocoles http.



Une requête de robot au serveur inclut une commande"Get / path / document" et quelques autres commandes de requête http. Pour cette requête, l'araignée reçoit une réponse du serveur sous la forme d'un flux de texte contenant les informations de service concernant le document et le document lui-même. L'araignée fait partie du module d'indexation pour les moteurs de recherche.



"L'araignée de voyage" - Crawler - est un autre composantmodule d'indexation. Crawler navigue automatiquement à travers tous les hyperliens qui ont été trouvés par l'araignée sur la page et ainsi rechercher des documents qui ne sont pas encore connus du moteur de recherche.



Robot-Indexer (indexeur) travaille directement avec le contenu des pages chargées par des robots spider. L'indexeur effectue une analyse morphologique et lexicale des pages, les divisant en parties séparées.



Bases de données (Base de données) sont des logiciels spéciaux pour le stockage des documents collectés et pronalizovannyh composants du module d'indexation.



Moteur de recherche de moteur de recherche - le système de publication des résultats est l'un des plus importantscomposants du moteur de recherche. C'est avec le système de sortie que l'utilisateur final traite, qui entre la requête dans la chaîne de recherche. Le système de sortie des résultats sur la base de plus de deux cents critères différents effectue la sélection des résultats les plus satisfaisants des objectifs de recherche.



L'algorithme de cette sélection est généralement appelé un algorithme ou mécanisme de classement. Pour éviter la fraude de la part des webmasters afin d'influencer les résultats d'émission, les moteurs de recherche de l'algorithme de classement exact sont gardés dans le plus strict secret.



Néanmoins, il existe un certain nombre de critères connus qui sont pris en compte dans le travail des moteurs de recherche, optimisant le fait que le webmaster peut "légalement" influencer les résultats de la recherche. Par exemple, Le moteur de recherche lors de l'analyse de la page prend en compte:




  • s'il y a un mot-clé dans le titre de la page (Titre)

  • Le mot-clé apparaît-il dans l'URL de la page?

  • s'il y a un mot-clé dans les en-têtes H1-H6, tags STRONG, B, EM, I

  • quelle est la densité des mots-clés sur la page (Densité)

  • Est-ce que le mot-clé existe dans les balises meta: mots-clés, description

  • Y a-t-il des liens internes et externes sur la page?



L'utilisateur interagit avec le moteur de recherche via le serveur de recherche. Requête de recherche reçue de l'utilisateurLe serveur traite et transmet le module de classement en entrée du paramètre. A son tour, le module effectue le traitement des documents, dont les informations sont stockées dans la base de données du système de recherche, et effectue une évaluation des pages correspondant à la demande de l'utilisateur.



Ensuite, le système génère des informations sous forme de snippet qui sont affichées à l'utilisateur sous la forme de SERP (Search Engine Result Page) - pages de résultats de recherche.



Ainsi, même une brève description de la principaleprincipes du travail des systèmes de recherche montre à quel point tous les composants logiciels du système sont interconnectés entre eux et comment le moteur de recherche devrait fonctionner et fonctionner clairement afin de fournir à l'utilisateur l'information la plus rapide et la plus fiable sur sa requête de recherche.



Le travail des moteurs de recherche
Commentaires 0