Δημιουργία ευρετηρίου του ιστότοπου στις μηχανές αναζήτησης. Πώς ευρετηριάζεται ο ιστότοπος στο "Yandex" και το "Google"

Πίνακας περιεχομένων:

Δημιουργία ευρετηρίου του ιστότοπου στις μηχανές αναζήτησης. Πώς ευρετηριάζεται ο ιστότοπος στο "Yandex" και το "Google"
Δημιουργία ευρετηρίου του ιστότοπου στις μηχανές αναζήτησης. Πώς ευρετηριάζεται ο ιστότοπος στο "Yandex" και το "Google"
Anonim

Τι είναι η ευρετηρίαση ιστότοπου; Πώς συμβαίνει; Μπορείτε να βρείτε απαντήσεις σε αυτές και σε άλλες ερωτήσεις στο άρθρο. Η ευρετηρίαση Ιστού (ευρετηρίαση στις μηχανές αναζήτησης) είναι η διαδικασία προσθήκης πληροφοριών σχετικά με έναν ιστότοπο στη βάση δεδομένων από ένα ρομπότ μηχανής αναζήτησης, το οποίο στη συνέχεια χρησιμοποιείται για την αναζήτηση πληροφοριών σχετικά με έργα ιστού που έχουν υποβληθεί σε μια τέτοια διαδικασία.

Τα δεδομένα σχετικά με τους πόρους Ιστού αποτελούνται συνήθως από λέξεις-κλειδιά, άρθρα, συνδέσμους, έγγραφα. Ο ήχος, οι εικόνες και ούτω καθεξής μπορούν επίσης να ευρετηριαστούν. Είναι γνωστό ότι ο αλγόριθμος ανίχνευσης λέξεων-κλειδιών εξαρτάται από τη μηχανή αναζήτησης.

Υπάρχει κάποιος περιορισμός στους τύπους των πληροφοριών με ευρετήριο (αρχεία flash, javascript).

Διαχείριση έναρξης

Η δημιουργία ευρετηρίου ενός ιστότοπου είναι μια πολύπλοκη διαδικασία. Για να το διαχειριστείτε (για παράδειγμα, για να απαγορεύσετε την επισύναψη μιας συγκεκριμένης σελίδας), πρέπει να χρησιμοποιήσετε το αρχείο robots.txt και οδηγίες όπως Allow, Disallow, Crawl-delay, User-agent και άλλα.

ευρετηρίασηιστοσελίδα
ευρετηρίασηιστοσελίδα

Επίσης, οι ετικέτες και τα στηρίγματα χρησιμοποιούνται για την ευρετηρίαση, αποκρύπτοντας το περιεχόμενο του πόρου από τα ρομπότ Google και Yandex (το Yahoo χρησιμοποιεί την ετικέτα).

Στη μηχανή αναζήτησης Goglle, οι νέοι ιστότοποι ευρετηριάζονται από μερικές ημέρες έως μία εβδομάδα και στο Yandex - από μία έως τέσσερις εβδομάδες.

Θέλετε ο ιστότοπός σας να εμφανίζεται στα ερωτήματα των αποτελεσμάτων της μηχανής αναζήτησης; Στη συνέχεια, πρέπει να υποβληθεί σε επεξεργασία από τους Rambler, Yandex, Google, Yahoo και ούτω καθεξής. Πρέπει να ενημερώσετε τις μηχανές αναζήτησης (αράχνες, συστήματα) για την ύπαρξη του ιστότοπού σας και στη συνέχεια θα τον ανιχνεύσουν εν όλω ή εν μέρει.

Πολλοί ιστότοποι δεν έχουν ευρετηριαστεί εδώ και χρόνια. Οι πληροφορίες που υπάρχουν σε αυτά δεν είναι ορατές από κανέναν εκτός από τους κατόχους τους.

Μέθοδοι επεξεργασίας

Η ευρετηρίαση ενός ιστότοπου μπορεί να γίνει με διάφορους τρόπους:

  1. Η πρώτη επιλογή είναι η μη αυτόματη προσθήκη. Πρέπει να εισαγάγετε τα δεδομένα του ιστότοπού σας μέσω ειδικών φορμών που προσφέρονται από τις μηχανές αναζήτησης.
  2. Στη δεύτερη περίπτωση, το ίδιο το ρομπότ της μηχανής αναζήτησης βρίσκει τον ιστότοπό σας μέσω συνδέσμων και τον ευρετηριάζει. Μπορεί να βρει τον ιστότοπό σας μέσω συνδέσμων από άλλους πόρους που οδηγούν στο έργο σας. Αυτή η μέθοδος είναι η πιο αποτελεσματική. Εάν μια μηχανή αναζήτησης βρει έναν ιστότοπο με αυτόν τον τρόπο, τον θεωρεί σημαντικό.

Timing

Η ευρετηρίαση του ιστότοπου δεν είναι πολύ γρήγορη. Οι όροι ποικίλλουν, από 1-2 εβδομάδες. Σύνδεσμοι από έγκυρους πόρους (με άριστα PR και Titz) επιταχύνουν σημαντικά την τοποθέτηση του ιστότοπου στη βάση δεδομένων των μηχανών αναζήτησης. Σήμερα, η Google θεωρείται η πιο αργή, αν και μέχρι το 2012 μπορούσε να κάνει αυτή τη δουλειά σε μια εβδομάδα. Προς τηνΔυστυχώς τα πράγματα αλλάζουν πολύ γρήγορα. Είναι γνωστό ότι το Mail.ru εργάζεται με ιστότοπους σε αυτόν τον τομέα για περίπου έξι μήνες.

ευρετηρίαση ιστότοπου στο yandex
ευρετηρίαση ιστότοπου στο yandex

Η ευρετηρίαση ενός ιστότοπου στις μηχανές αναζήτησης δεν είναι δυνατή για κάθε ειδικό. Ο χρόνος προσθήκης νέων σελίδων στη βάση δεδομένων ενός ιστότοπου που έχει ήδη υποβληθεί σε επεξεργασία από τις μηχανές αναζήτησης επηρεάζεται από τη συχνότητα ενημέρωσης του περιεχομένου του. Εάν οι νέες πληροφορίες εμφανίζονται συνεχώς σε έναν πόρο, το σύστημα θεωρεί ότι ενημερώνεται συχνά και είναι χρήσιμο για τους ανθρώπους. Σε αυτή την περίπτωση, το έργο της επιταχύνεται.

Μπορείτε να παρακολουθείτε την πρόοδο της ευρετηρίασης ενός ιστότοπου σε ειδικές ενότητες για webmasters ή σε μηχανές αναζήτησης.

Αλλαγές

Λοιπόν, έχουμε ήδη καταλάβει πώς ευρετηριάζεται ο ιστότοπος. Θα πρέπει να σημειωθεί ότι οι βάσεις δεδομένων των μηχανών αναζήτησης ενημερώνονται συχνά. Επομένως, ο αριθμός των σελίδων του έργου σας που προστέθηκαν σε αυτές μπορεί να αλλάξει (και να μειωθεί και να αυξηθεί) για τους ακόλουθους λόγους:

  • κυρώσεις μηχανών αναζήτησης κατά του ιστότοπου;
  • η παρουσία σφαλμάτων στον ιστότοπο;
  • αλλαγή αλγορίθμων μηχανών αναζήτησης;
  • αηδιαστική φιλοξενία (αδυναμία πρόσβασης του διακομιστή όπου βρίσκεται το έργο) και ούτω καθεξής.

Yandex απαντήσεις σε συνήθεις ερωτήσεις

"Yandex" είναι μια μηχανή αναζήτησης που χρησιμοποιείται από πολλούς χρήστες. Κατατάσσεται στην πέμπτη θέση μεταξύ των παγκόσμιων συστημάτων αναζήτησης ως προς τον αριθμό των διεκπεραιωμένων ερευνητικών αιτημάτων. Εάν προσθέσατε έναν ιστότοπο σε αυτόν, μπορεί να χρειαστεί πολύς χρόνος για να προστεθεί στη βάση δεδομένων.

Η προσθήκη μιας διεύθυνσης URL δεν εγγυάται την ευρετηρίασή της. Αυτή είναι μόνο μία από τις μεθόδους με τις οποίες ενημερώνεται το ρομπότ συστήματοςσχετικά με έναν νέο πόρο. Εάν υπάρχουν λίγοι ή καθόλου σύνδεσμοι προς έναν ιστότοπο από άλλους ιστότοπους, η προσθήκη του θα σας βοηθήσει να τον βρείτε πιο γρήγορα.

ευρετηρίαση ιστότοπου στο google
ευρετηρίαση ιστότοπου στο google

Εάν δεν έγινε ευρετηρίαση, πρέπει να ελέγξετε εάν υπήρχαν αποτυχίες στον διακομιστή τη στιγμή της δημιουργίας μιας εφαρμογής για αυτόν από το ρομπότ Yandex. Εάν ο διακομιστής αναφέρει ένα σφάλμα, το ρομπότ θα τερματίσει την εργασία του και θα προσπαθήσει να το ολοκληρώσει με μια παραγγελία μετ' επιστροφής. Οι υπάλληλοι της Yandex δεν μπορούν να αυξήσουν την ταχύτητα προσθήκης σελίδων στη βάση δεδομένων της μηχανής αναζήτησης.

Η δημιουργία ευρετηρίου ενός ιστότοπου στο Yandex είναι μια αρκετά δύσκολη εργασία. Δεν ξέρετε πώς να προσθέσετε έναν πόρο σε μια μηχανή αναζήτησης; Εάν υπάρχουν σύνδεσμοι προς αυτόν από άλλους ιστότοπους, τότε δεν χρειάζεται να προσθέσετε έναν ειδικό ιστότοπο - το ρομπότ θα τον βρει αυτόματα και θα τον ευρετηριάσει. Εάν δεν έχετε τέτοιους συνδέσμους, μπορείτε να χρησιμοποιήσετε τη φόρμα "Προσθήκη URL" για να πείτε στη μηχανή αναζήτησης ότι ο ιστότοπος υπάρχει.

Λάβετε υπόψη ότι η προσθήκη μιας διεύθυνσης URL δεν εγγυάται ότι η δημιουργία σας θα ευρετηριαστεί (ή θα ευρετηριαστεί).

Πολλοί άνθρωποι αναρωτιούνται πόσος χρόνος χρειάζεται για την ευρετηρίαση ενός ιστότοπου στο Yandex. Οι εργαζόμενοι αυτής της εταιρείας δεν παρέχουν εγγυήσεις και δεν προβλέπουν όρους. Κατά κανόνα, από τη στιγμή που το ρομπότ έμαθε για τον ιστότοπο, οι σελίδες του στην αναζήτηση εμφανίζονται σε δύο ημέρες, μερικές φορές σε μερικές εβδομάδες.

Διαδικασία

Μηχανή αναζήτησης Yandex
Μηχανή αναζήτησης Yandex

"Yandex" είναι μια μηχανή αναζήτησης που απαιτεί ακρίβεια και προσοχή. Η ευρετηρίαση ιστότοπου αποτελείται από τρία μέρη:

  1. Ρομπότ αναζήτησης ανιχνεύει σελίδες πόρων.
  2. Περιεχόμενο(περιεχόμενο) του ιστότοπου καταγράφεται στη βάση δεδομένων (ευρετήριο) του συστήματος αναζήτησης.
  3. Σε 2-4 εβδομάδες, μετά την ενημέρωση της βάσης δεδομένων, μπορείτε να δείτε τα αποτελέσματα. Ο ιστότοπός σας θα εμφανίζεται (ή δεν θα) στα αποτελέσματα αναζήτησης.

Έλεγχος ευρετηρίασης

Πώς να ελέγξετε την ευρετηρίαση ιστότοπου; Υπάρχουν τρεις τρόποι για να το κάνετε αυτό:

  1. Εισαγάγετε το όνομα της επιχείρησής σας στη γραμμή αναζήτησης (για παράδειγμα, "Yandex") και ελέγξτε κάθε σύνδεσμο στην πρώτη και τη δεύτερη σελίδα. Αν βρείτε τη διεύθυνση URL του πνευματικού σας τέκνου εκεί, τότε το ρομπότ έχει ολοκληρώσει την εργασία του.
  2. Μπορείτε να εισαγάγετε τη διεύθυνση URL του ιστότοπού σας στη γραμμή αναζήτησης. Θα μπορείτε να δείτε πόσα φύλλα Διαδικτύου εμφανίζονται, π.χ. ευρετηριασμένα.
  3. Εγγραφείτε στις σελίδες των webmasters στο Mail.ru, Google, Yandex. Αφού περάσετε την επαλήθευση του ιστότοπου, θα μπορείτε να δείτε τα αποτελέσματα ευρετηρίασης και άλλες υπηρεσίες μηχανών αναζήτησης που έχουν δημιουργηθεί για τη βελτίωση της απόδοσης του πόρου σας.

Γιατί αποτυγχάνει το Yandex;

Η ευρετηρίαση ενός ιστότοπου στο Google πραγματοποιείται ως εξής: το ρομπότ εισάγει στη βάση δεδομένων όλες τις σελίδες του ιστότοπου, χαμηλής ποιότητας και υψηλής ποιότητας, χωρίς να επιλέξει. Αλλά μόνο χρήσιμα έγγραφα περιλαμβάνονται στην κατάταξη. Και το "Yandex" αποκλείει αμέσως όλα τα σκουπίδια ιστού. Μπορεί να ευρετηριάσει οποιαδήποτε σελίδα, αλλά η μηχανή αναζήτησης θα εξαλείψει τελικά όλα τα σκουπίδια.

ευρετηρίαση ιστότοπου στις μηχανές αναζήτησης
ευρετηρίαση ιστότοπου στις μηχανές αναζήτησης

Και τα δύο συστήματα έχουν αυξητικό δείκτη. Και οι δύο σελίδες χαμηλής ποιότητας επηρεάζουν την κατάταξη του ιστότοπου στο σύνολό του. Εδώ λειτουργεί μια απλή φιλοσοφία. Αγαπημένοι πόροι ενός συγκεκριμένουο χρήστης θα καταλαμβάνει υψηλότερες θέσεις στην έκδοσή του. Αλλά αυτό το ίδιο άτομο θα δυσκολευτεί να βρει έναν ιστότοπο που δεν του άρεσε την τελευταία φορά.

Γι' αυτό, πρώτα, είναι απαραίτητο να καλύψετε αντίγραφα των εγγράφων Ιστού από την ευρετηρίαση, να ελέγξετε για κενές σελίδες και να αποτρέψετε την ευρετηρίαση περιεχομένου χαμηλής ποιότητας.

Επιτάχυνση Yandex

Πώς μπορώ να επιταχύνω την ευρετηρίαση ιστότοπου στο Yandex; Ακολουθήστε αυτά τα βήματα:

  • Εγκαταστήστε το πρόγραμμα περιήγησης Yandex στον υπολογιστή σας και χρησιμοποιήστε το για να περιηγηθείτε στις σελίδες του ιστότοπου.
  • Επιβεβαιώστε τα δικαιώματα διαχείρισης του πόρου στο Yandex. Webmaster.
  • Δημοσιεύστε έναν σύνδεσμο προς το άρθρο στο Twitter. Είναι γνωστό ότι η Yandex συνεργάζεται με αυτήν την εταιρεία από το 2012.
  • Προσθήκη αναζήτησης από το Yandex για τον ιστότοπο. Στην ενότητα "Ευρετηρίαση", μπορείτε να εισαγάγετε τις δικές σας διευθύνσεις URL.
  • Εισαγάγετε τον κωδικό "Yandex. Metrica" χωρίς να σημειώσετε "Απαγορεύεται η υποβολή σελίδων για ευρετηρίαση".
  • Δημιουργήστε έναν χάρτη ιστότοπου που υπάρχει μόνο για το ρομπότ και δεν είναι ορατός στο κοινό. Η επαλήθευση θα ξεκινήσει μαζί του. Η διεύθυνση του χάρτη ιστότοπου εισάγεται στο robots.txt ή στην κατάλληλη μορφή στο "Webmaster" - "Indexing Settings" - "Sitemap Files".

Ενδιάμεσες ενέργειες

επιτάχυνση της ευρετηρίασης ιστοτόπων
επιτάχυνση της ευρετηρίασης ιστοτόπων

Τι πρέπει να γίνει μέχρι να ευρετηριαστεί η ιστοσελίδα από το Yandex; Η εγχώρια μηχανή αναζήτησης θα πρέπει να θεωρεί τον ιστότοπο ως την κύρια πηγή. Γι’ αυτό και πριν από τη δημοσίευση του άρθρου επιβάλλεται να προστεθεί το περιεχόμενό του στη μορφή των «Συγκεκριμένων κειμένων». Σε διαφορετική περίπτωσηοι λογοκλοπές θα αντιγράψουν την εγγραφή στον πόρο τους και θα είναι οι πρώτοι στη βάση δεδομένων. Ως αποτέλεσμα, θα αναγνωρίζονται ως συγγραφείς.

Βάση δεδομένων Google

Για την Google, οι ίδιες προτάσεις που περιγράψαμε παραπάνω είναι κατάλληλες, μόνο οι υπηρεσίες θα είναι διαφορετικές:

  • Google+ (αντικαθιστά το Twitter);
  • Google Chrome;
  • Εργαλεία Google για Προγραμματιστές - "Σάρωση" - "Μοιάζουν με το Googlebot" - Επιλογή "Σάρωση" - Επιλογή "Ευρετήριο";
  • αναζήτηση σε έναν πόρο από την Google;
  • Google Analytics (αντί για Yandex. Metrics).

Απαγόρευση

Τι είναι η απαγόρευση δημιουργίας ευρετηρίου ιστότοπου; Μπορείτε να το επικαλύψετε τόσο σε ολόκληρη τη σελίδα όσο και σε ξεχωριστό μέρος της (σύνδεσμος ή κομμάτι κειμένου). Στην πραγματικότητα, υπάρχει και μια παγκόσμια απαγόρευση ευρετηρίασης και μια τοπική. Πώς εφαρμόζεται;

Ας εξετάσουμε την απαγόρευση της προσθήκης ιστότοπου στη βάση δεδομένων της μηχανής αναζήτησης στο Robots.txt. Χρησιμοποιώντας το αρχείο robots.txt, μπορείτε να εξαιρέσετε την ευρετηρίαση μιας σελίδας ή μιας ολόκληρης επικεφαλίδας πόρου ως εξής:

  1. User-agent:
  2. Disallow: /kolobok.html
  3. Disallow: /foto/

Το πρώτο σημείο λέει ότι οι οδηγίες ορίζονται για όλα τα PS, το δεύτερο υποδεικνύει ότι απαγορεύεται η δημιουργία ευρετηρίου του αρχείου kolobok.html και το τρίτο δεν επιτρέπει την προσθήκη ολόκληρης της γέμισης του φακέλου foto στο βάση δεδομένων. Εάν χρειάζεται να εξαιρέσετε πολλές σελίδες ή φακέλους, προσδιορίστε τα όλα στο Robots.

Πώς ευρετηριάζεται ο ιστότοπος
Πώς ευρετηριάζεται ο ιστότοπος

Για να αποτρέψετε την ευρετηρίαση ενός συγκεκριμένου φύλλου Διαδικτύου, μπορείτε να χρησιμοποιήσετε τη μετα-ετικέτα robots. Είναι διαφορετικό από το robots.txtτο γεγονός ότι δίνει οδηγίες σε όλα τα PS ταυτόχρονα. Αυτή η μετα-ετικέτα ακολουθεί τις γενικές αρχές της μορφής html. Θα πρέπει να τοποθετηθεί στον τίτλο της σελίδας μεταξύ των ετικετών. Μια καταχώριση για απαγόρευση, για παράδειγμα, μπορεί να γραφτεί ως εξής:.

Ajax

Πώς ευρετηριάζει το Yandex τους ιστότοπους του Ajax; Σήμερα, η τεχνολογία Ajax χρησιμοποιείται από πολλούς προγραμματιστές ιστοσελίδων. Φυσικά, έχει μεγάλες δυνατότητες. Με αυτό, μπορείτε να δημιουργήσετε γρήγορες και παραγωγικές διαδραστικές ιστοσελίδες.

Ωστόσο, το ρομπότ της μηχανής αναζήτησης «βλέπει» τη λίστα ιστού διαφορετικά από τον χρήστη και το πρόγραμμα περιήγησης. Για παράδειγμα, ένα άτομο κοιτάζει μια άνετη διεπαφή με φύλλα Διαδικτύου που είναι φορτωμένα με δυνατότητα κίνησης. Για έναν ανιχνευτή, το περιεχόμενο της ίδιας σελίδας μπορεί να είναι κενό ή να παρουσιαστεί ως το υπόλοιπο στατικό περιεχόμενο HTML, για το οποίο τα σενάρια δεν λειτουργούν.

Μπορείτε να χρησιμοποιήσετε μια διεύθυνση URL μεγια να δημιουργήσετε ιστότοπους Ajax, αλλά η μηχανή αναζήτησης δεν τη χρησιμοποιεί. Συνήθως το τμήμα της διεύθυνσης URL μετά τοδιαχωρίζεται. Αυτό πρέπει να ληφθεί υπόψη. Επομένως, αντί για μια διεύθυνση URL όπως https://site.ru/example, κάνει μια εφαρμογή στην κύρια σελίδα του πόρου που βρίσκεται στη διεύθυνση https://site.ru. Αυτό σημαίνει ότι το περιεχόμενο του φύλλου Internet ενδέχεται να μην εισέλθει στη βάση δεδομένων. Ως αποτέλεσμα, δεν θα εμφανίζεται στα αποτελέσματα αναζήτησης.

Για τη βελτίωση της ευρετηρίασης των τοποθεσιών Ajax, η Yandex υποστήριξε αλλαγές στο ρομπότ αναζήτησης και τους κανόνες για την επεξεργασία των διευθύνσεων URL τέτοιων ιστότοπων. Σήμερα, οι webmasters μπορούν να υποδείξουν στη μηχανή αναζήτησης Yandex την ανάγκη για ευρετηρίαση δημιουργώντας ένα κατάλληλο σχήμα στη δομή των πόρων. Για αυτό χρειάζεστε:

  1. Αντικαταστήστε το σύμβολοστη διεύθυνση URL των σελίδωνστο !. Τώρα το ρομπότ θα καταλάβει ότι μπορεί να υποβάλει αίτηση για την έκδοση HTML του περιεχομένου αυτού του φύλλου Διαδικτύου.
  2. Η έκδοση HTML του περιεχομένου μιας τέτοιας σελίδας θα πρέπει να τοποθετηθεί σε μια διεύθυνση URL όπου ! αντικαταστάθηκε με ?_escaped_fragment_=.

Συνιστάται: