Αρχές των μηχανών αναζήτησης. Μηχανές αναζήτησης στο Διαδίκτυο

Πίνακας περιεχομένων:

Αρχές των μηχανών αναζήτησης. Μηχανές αναζήτησης στο Διαδίκτυο
Αρχές των μηχανών αναζήτησης. Μηχανές αναζήτησης στο Διαδίκτυο
Anonim

Στο Διαδίκτυο, σε διάφορους ιστότοπους, προσφέρεται στον χρήστη ένας μεγάλος όγκος διαφορετικών πληροφοριών. Οι μηχανές αναζήτησης έχουν δημιουργηθεί για να λάβουν τις απαραίτητες πληροφορίες, να αναζητήσουν απαντήσεις σε ερωτήσεις. Ακούγοντας αυτή τη φράση, πολλοί άνθρωποι σκέφτονται το Google, το Yandex. Ωστόσο, υπάρχουν πολλές περισσότερες μηχανές αναζήτησης στο Διαδίκτυο.

Τι είναι η μηχανή αναζήτησης

Μηχανή αναζήτησης θεωρείται λογισμικό που αποτελείται από μια βάση δεδομένων εγγράφων. Στους χρήστες παρέχεται ειδική διεπαφή που τους επιτρέπει να εισάγουν τα απαραίτητα ερωτήματα και να λαμβάνουν συνδέσμους με σχετικές πληροφορίες. Τα έγγραφα που ταιριάζουν περισσότερο με αυτό που αναζητά ένα συγκεκριμένο άτομο βρίσκονται πάντα στην κορυφή των αποτελεσμάτων αναζήτησης.

Τα αποτελέσματα αναζήτησης, τα οποία δημιουργούνται σύμφωνα με το ερώτημα που έχετε εισαγάγει, συνήθως περιέχουν διαφορετικούς τύπους αποτελεσμάτων. Μπορεί να περιέχει ιστοσελίδες, αρχεία βίντεο και ήχου, εικόνες, αρχεία pdf, συγκεκριμένα προϊόντα (εάν η αναζήτηση πραγματοποιείται σε ηλεκτρονικό κατάστημα).

Κατάταξη μηχανών αναζήτησης στον κόσμο
Κατάταξη μηχανών αναζήτησης στον κόσμο

Ταξινόμηση μηχανών αναζήτησης

Οι υπάρχουσες μηχανές αναζήτησης ταξινομούνται σε διάφορους τύπους. Πρώτα απ 'όλα, αξίζει να αναφέρουμε τις παραδοσιακές μηχανές αναζήτησης. Για τέτοιες μηχανές αναζήτησης, οι αρχές της εργασίας επικεντρώνονται στην εύρεση πληροφοριών σε έναν τεράστιο αριθμό υπαρχόντων τοποθεσιών. Οι μηχανές αναζήτησης εξακολουθούν να είναι διαθέσιμες σε ξεχωριστούς πόρους του Διαδικτύου:

  • σε ηλεκτρονικά καταστήματα (για αναζήτηση των σωστών προϊόντων);
  • σε φόρουμ και ιστολόγια (για αναζήτηση αναρτήσεων);
  • σε ενημερωτικούς ιστότοπους (για αναζήτηση άρθρων σχετικά με το επιθυμητό θέμα ή ειδήσεις) κ.λπ.

Οι μηχανές αναζήτησης υποδιαιρούνται επίσης με βάση γεωγραφικά χαρακτηριστικά. Σε αυτήν την ταξινόμηση, υπάρχουν 3 ομάδες μηχανών αναζήτησης:

  1. Παγκόσμια. Η έρευνα διεξάγεται σε όλο τον κόσμο. Ο ηγέτης σε αυτήν την ομάδα είναι η μηχανή αναζήτησης Google. Παλαιότερα υπήρχαν μηχανές αναζήτησης όπως Inktomi, AltaVista κ.λπ.
  2. Περιφερειακό. Η αναζήτηση πραγματοποιείται ανά χώρα ή ομάδα χωρών, οι οποίες ενώνονται με μία γλώσσα. Οι περιφερειακές μηχανές αναζήτησης είναι ευρέως διαδεδομένες. Το παράδειγμά τους στη Ρωσία είναι το Yandex, το Rambler.
  3. Τοπική. Η έρευνα διεξάγεται σε συγκεκριμένη πόλη. Ένα παράδειγμα τέτοιας μηχανής αναζήτησης είναι η Tomsk.ru.

Στοιχεία μηχανών αναζήτησης

Σε οποιαδήποτε μηχανή αναζήτησης, υπάρχουν 3 συστατικά στοιχεία που καθορίζουν τις αρχές της μηχανής αναζήτησης:

  • ρομπότ (indexer, spider, crawler);
  • βάση δεδομένων;
  • διαχειριστής αιτημάτων.

Το Robot είναι ένα ειδικό πρόγραμμα του οποίου ο σκοπός είναι να σχηματίσει μια βάση δεδομένων. Η βάση δεδομένων αποθηκεύει και ταξινομείόλες οι πληροφορίες που συλλέγονται. Ο χειριστής αιτημάτων, που ονομάζεται επίσης πελάτης, λειτουργεί με αιτήματα χρηστών. Έχει πρόσβαση στη βάση δεδομένων. Ο πελάτης δεν βρίσκεται πάντα στον ίδιο υπολογιστή. Το πρόγραμμα χειρισμού αιτημάτων μπορεί να κατανεμηθεί σε πολλούς ηλεκτρονικούς υπολογιστές που δεν σχετίζονται φυσικά.

Εργασία μηχανών αναζήτησης
Εργασία μηχανών αναζήτησης

Αρχές των μηχανών αναζήτησης

Όλα τα υπάρχοντα συστήματα λειτουργούν με την ίδια αρχή. Σκεφτείτε, για παράδειγμα, τη λειτουργία των παραδοσιακών μηχανών αναζήτησης που έχουν σχεδιαστεί για το Διαδίκτυο. Η λειτουργία του ρομπότ είναι παρόμοια με τις ενέργειες ενός κανονικού χρήστη. Αυτό το πρόγραμμα παρακάμπτει περιοδικά όλους τους ιστότοπους, προσθέτει νέες σελίδες και πόρους Διαδικτύου στη βάση δεδομένων. Αυτή η διαδικασία ονομάζεται ευρετηρίαση.

Όταν ένας χρήστης στο Διαδίκτυο εισάγει ένα συγκεκριμένο ερώτημα στο πλαίσιο αναζήτησης, ο πελάτης αρχίζει να λειτουργεί. Το πρόγραμμα έχει πρόσβαση στην υπάρχουσα βάση δεδομένων και παράγει αποτελέσματα με βάση λέξεις-κλειδιά. Η μηχανή αναζήτησης παρέχει συνδέσμους στο χρήστη με μια συγκεκριμένη σειρά. Ταξινομούνται όπως ταιριάζουν με το ερώτημα, δηλ. λαμβάνεται υπόψη η συνάφεια.

Κάθε μηχανή αναζήτησης έχει τον δικό της τρόπο να προσδιορίζει τη συνάφεια. Εάν ο χρήστης στείλει ένα συγκεκριμένο αίτημα σε διαφορετικά συστήματα, τότε δεν θα λάβει ακριβώς τα ίδια αποτελέσματα. Ο αλγόριθμος για τον προσδιορισμό της συνάφειας παραμένει μυστικός.

Δημοφιλείς μηχανές αναζήτησης στη Ρωσία
Δημοφιλείς μηχανές αναζήτησης στη Ρωσία

Λεπτομέρειες συνάφειας

Με απλά λόγια, συνάφεια είναι η αντιστοιχία της λέξης ή του συνδυασμού λέξεων που εισάγονται στην αναζήτησησυγκεκριμένους συνδέσμους στο SERP. Αρκετές αποχρώσεις επηρεάζουν τη θέση των εγγράφων στη λίστα:

  1. Παρουσία λέξεων αναζήτησης σε έγγραφα. Αυτή η απόχρωση είναι προφανής. Εάν το έγγραφο περιέχει λέξεις από το ερώτημα που εισήγαγε ο χρήστης, τότε αυτό σημαίνει ότι αυτό το έγγραφο ταιριάζει με τις συνθήκες αναζήτησης.
  2. Συχνότητα εμφάνισης λέξεων. Όσο πιο συχνά χρησιμοποιούνται λέξεις-κλειδιά σε ένα έγγραφο, τόσο υψηλότερο θα είναι στη λίστα SERP. Ωστόσο, δεν είναι όλα τόσο απλά. Η υπερβολική χρήση λέξεων μπορεί να είναι ένδειξη περιεχομένου χαμηλής ποιότητας για τη μηχανή αναζήτησης.

Ο αλγόριθμος για τον προσδιορισμό της συνάφειας είναι μάλλον περίπλοκος. Πριν από μερικά χρόνια, σύνδεσμοι που περιέχουν τις απαραίτητες λέξεις-κλειδιά, αλλά δεν αντιστοιχούν σε αυτές σε περιεχόμενο, μπορούσαν να μπουν στα αποτελέσματα αναζήτησης. Επί του παρόντος, οι αρχές λειτουργίας των μηχανών αναζήτησης είναι περίπλοκες. Τώρα τα ρομπότ μπορούν να αναλύσουν ολόκληρο το κείμενο. Οι μηχανές αναζήτησης λαμβάνουν υπόψη έναν τεράστιο αριθμό διαφορετικών παραγόντων. Χάρη σε αυτό, το τεύχος διαμορφώνεται από υψηλής ποιότητας, σχετικούς συνδέσμους.

Πώς να διατυπώνετε σωστά αιτήματα

Ακόμη και στο σχολείο, μας έμαθαν να κάνουμε σωστά ερωτήσεις. Εξαρτάται από το τι είδους απαντήσεις θα λάβουμε. Ωστόσο, αυτός ο κανόνας δεν χρειάζεται να τηρείται όταν χρησιμοποιείτε μηχανές αναζήτησης. Για τις σύγχρονες μηχανές αναζήτησης, δεν έχει σημασία σε ποιον αριθμό ή περίπτωση ένα άτομο γράφει το αίτημά του. Είτε έτσι είτε αλλιώς, η έξοδος θα περιλαμβάνει τα ίδια αποτελέσματα.

Οι μηχανές αναζήτησης δεν χρειάζονται σαφή διατύπωση της ερώτησης. Ο χρήστης χρειάζεται μόνο να επιλέξει τις σωστές λέξεις-κλειδιά. Εξετάστε ένα παράδειγμα. Πρέπει να βρούμετο κείμενο του τραγουδιού "A Day Without You", το οποίο ερμηνεύει το διάσημο γυναικείο ποπ συγκρότημα "Via-Gra". Όταν επικοινωνείτε με μια μηχανή αναζήτησης, δεν είναι απαραίτητο να ονομάσετε την ομάδα, υποδείξτε ότι πρόκειται για τραγούδι. Αρκεί να γράψεις «μια μέρα χωρίς εσένα μήνυμα». Κρατήστε πεζά, δεν απαιτούνται σημεία στίξης. Αυτές οι αποχρώσεις δεν λαμβάνονται υπόψη από τις μηχανές αναζήτησης.

Σωστή διατύπωση ερωτημάτων
Σωστή διατύπωση ερωτημάτων

Κατάταξη των μηχανών αναζήτησης στον κόσμο

Η κορυφαία μηχανή αναζήτησης στον κόσμο είναι η Google. Ιδρύθηκε το 1998. Το σύστημα είναι πολύ δημοφιλές, κάτι που επιβεβαιώνεται από αναλυτικές πληροφορίες. Περίπου το 70% των αιτημάτων που έρχονται στο Διαδίκτυο διεκπεραιώνονται από την Google. Η βάση δεδομένων της μηχανής αναζήτησης είναι τεράστια. Περισσότερα από 60 τρισεκατομμύρια διαφορετικά έγγραφα έχουν ευρετηριαστεί. Η Google προσελκύει χρήστες με μια απλή διεπαφή. Η κύρια σελίδα έχει ένα λογότυπο και μια γραμμή αναζήτησης. Αυτή η δυνατότητα μάς επιτρέπει να αποκαλούμε το Google μια από τις πιο μινιμαλιστικές μηχανές αναζήτησης.

Το Bing είναι η δεύτερη πιο δημοφιλής μηχανή αναζήτησης. Εμφανίστηκε την ίδια χρονιά με την Google. Δημιουργός αυτής της μηχανής αναζήτησης είναι η γνωστή διεθνής εταιρεία Microsoft. Χαμηλότερες θέσεις στην κατάταξη καταλαμβάνονται από Baidu, Yahoo!, AOL, Excite, Ask.

Αρχές μηχανών αναζήτησης
Αρχές μηχανών αναζήτησης

Τι είναι δημοφιλές στη Ρωσία

Η Yandex είναι η πιο δημοφιλής μηχανή αναζήτησης στη Ρωσία. Αυτή η υπηρεσία εμφανίστηκε το 1997. Αρχικά, η ρωσική εταιρεία CompTek International ασχολήθηκε με αυτό. Λίγο αργότερα, εμφανίστηκε η εταιρεία Yandex, η οποία συνέχισε να ασχολείται με μια μηχανή αναζήτησης. Μηχανή αναζήτησης γιαχρόνια ύπαρξης έχει αποκτήσει τεράστια δημοτικότητα. Μπορεί να αναζητηθεί σε πολλές γλώσσες - Ρωσικά, Λευκορωσικά, Ουκρανικά, Ταταρικά, Καζακικά, Αγγλικά, Γερμανικά, Γαλλικά, Τουρκικά.

Από στατιστικά δεδομένα είναι γνωστό ότι το "Yandex" ενδιαφέρει περισσότερο από το 50% των χρηστών του Runet. Πάνω από το 40% των ανθρώπων προτιμούν το Google. Περίπου το 3% των χρηστών επέλεξαν τη Mail.ru, μια ρωσική διαδικτυακή πύλη.

μηχανή αναζήτησης Google
μηχανή αναζήτησης Google

Προστατευμένες μηχανές αναζήτησης

Οι συνήθεις μηχανές αναζήτησης που μας είναι γνωστές δεν είναι ακριβώς κατάλληλες για παιδιά. Οι νεαροί χρήστες του Διαδικτύου μπορεί να βρουν κατά λάθος κάποιο υλικό για ενήλικες, πληροφορίες που μπορεί να βλάψουν τον ψυχισμό. Για το λόγο αυτό έχουν δημιουργηθεί ειδικές ασφαλείς μηχανές αναζήτησης. Οι βάσεις δεδομένων τους περιέχουν μόνο ασφαλές περιεχόμενο για παιδιά.

Ένα παράδειγμα μιας τέτοιας μηχανής αναζήτησης είναι το Sputnik. Children. Αυτή η υπηρεσία είναι αρκετά νέα. Δημιουργήθηκε από τη Rostelecom το 2014. Η κύρια σελίδα της μηχανής αναζήτησης είναι φωτεινή και ενδιαφέρουσα. Παρουσιάζει μια μεγάλη γκάμα εγχώριων και ξένων κινουμένων σχεδίων για παιδιά διαφορετικών ηλικιών. Επιπλέον, στην κεντρική σελίδα υπάρχουν ενημερωτικοί σύνδεσμοι που σχετίζονται με διάφορες επικεφαλίδες - "Αθλητισμός", "Θέλω να μάθω τα πάντα", "Κάν' το μόνος σου", "Παιχνίδια", "Τεχνολογία", "Σχολείο", "Φύση".

Ένα άλλο παράδειγμα ασφαλούς μηχανής αναζήτησης για παιδιά είναι το Agakids.ru. Αυτός είναι ένας απολύτως ασφαλής πόρος. Πώς λειτουργεί μια μηχανή αναζήτησης; Το ρομπότ είναι διαμορφωμένο με τέτοιο τρόπο ώστε να παρακάμπτει μόνο εκείνους τους ιστότοπους που σχετίζονται με θέματα παιδιών ήείναι χρήσιμα για τους γονείς. Η βάση δεδομένων της μηχανής αναζήτησης περιλαμβάνει πόρους με κινούμενα σχέδια, βιβλία, εκπαιδευτική βιβλιογραφία, παιχνίδια, βιβλία ζωγραφικής. Οι γονείς, χρησιμοποιώντας το Agakids.ru, μπορούν να βρουν μόνοι τους ιστότοπους για την ανατροφή και την υγεία των παιδιών.

Προστατευμένες μηχανές αναζήτησης για παιδιά
Προστατευμένες μηχανές αναζήτησης για παιδιά

Συμπερασματικά, αξίζει να σημειωθεί ότι οι μηχανές αναζήτησης είναι πολύπλοκα συστήματα. Αντιμετωπίζουν πολλά προβλήματα - τα προβλήματα ανεπιθύμητης αλληλογραφίας, ο προσδιορισμός της συνάφειας των εγγράφων, ο έλεγχος περιεχομένου χαμηλής ποιότητας, η ανάλυση εγγράφων που δεν περιέχουν πληροφορίες κειμένου. Για αυτόν τον λόγο, οι προγραμματιστές εισάγουν νέες προσεγγίσεις και αλγόριθμους που αποτελούν εμπορικά μυστικά στο έργο των μηχανών αναζήτησης στο Διαδίκτυο.

Συνιστάται: