Μηχανές Αναζήτησης

Βασικές έννοιες Μηχανών Αναζήτησης

Οι αράχνες των μηχανών αναζήτησης, οι επονομαζόμενες web crawlers ή web robots, είναι ειδικές εφαρμογές υπολογιστών που έχουν σαν σκοπό τη συγκέντρωση πληροφοριών από το διαδίκτυο και συσχετίζονται άμεσα με το Search Engine Optimization.

Πλοηγούνται στο Internet όπως πλοηγούμαστε με ένα πρόγραμμα περιήγησης (π.χ. με τον Internet Explorer, ή τον Firefox) αλλά πολλές φορές πιο γρήγορα και πλήρως αυτοματοποιημένα.

Οι αράχνες οδηγούνται ακολουθώντας συνδέσμους και συγκεντρώνουν όλες τις αναγνώσιμες πληροφορίες στους καταλόγους τους. Βέβαια χρειάζεται να τονίσουμε ότι μολονότι το τελευταίο διάστημα έχουν υπάρξει αξιόλογες προσπάθειες βελτίωσης, υπάρχουν περιορισμοί στο τι μπορούν να επεξεργαστούν και τι όχι.

Συγκεκριμένα, ενώ επεξεργάζονται ταχύτατα και με επιτυχία το περιεχόμενο των ιστοσελίδων που είναι σε μορφή κειμένου, αδυνατούν να αναγνωρίσουν απόλυτα το υλικό που είναι σε μορφή εικόνων (jpeg,gif,png κτλ). Βέβαια η χρησιμοποίηση στην προκειμένη περίπτωση alt tags (ετικετών) και γενικότερα title tags (τίτλων σελίδας), και meta tags (μέτα ετικέτες δεδομένων) βοηθούν αισθητά στην σωστή αντίληψη των περιεχομένων μιας σελίδας.

Ακόμα είναι δυνατόν να μάθουμε εάν οι crawlers των μηχανών αναζήτησης επισκέφτηκαν τον ιστοχώρο μας αλλά και με ποια σειρά ανίχνευσαν τις σελίδες του, ρίχνοντας απλά μια ματιά στα log αρχεία του http server που φιλοξενείται το site μας. Εκεί καταγράφονται όλες οι επισκέψεις με λεπτομέρεια περιλαμβάνοντας την ip των επισκεπτών καθώς και άλλα χρήσιμα στοιχεία.

Σε αυτό το σημείο χρειάζεται να τονίσουμε άλλο ένα πολύ σημαντικό θέμα που δεν είναι άλλο από τη διατήρηση των ιστοσελίδων μας online. Είναι σχεδόν επιτακτική η ανάγκη διατήρησης του site μας προσβάσιμου 24 ώρες το 24ωρο, 7 ημέρες την εβδομάδα, 365 ημέρες τον χρόνο.

Οι search engines για να εξασφαλίσουν το ότι τα ευρετήριά τους θα είναι ενημερωμένα, επισκέπτονται δισεκατομμύρια σελίδες κάθε μήνα για να μαζέψουν νέο υλικό. Λόγω του φόρτου εργασίας τους συνήθως έχουν χρόνο μόνο για μία επίσκεψη κάθε φορά για κάθε ιστοσελίδα. Εάν κατά την επίσκεψή τους ο διακομιστής του ιστού δεν είναι προσβάσιμος, τότε η ιστοσελίδα αυτή δε θα συμπεριληφθεί στη βάση δεδομένων ή δεν θα ενημερωθεί με τις καινούργιες πληροφορίες. Έτσι δεν θα υπάρξει αναπροσαρμογή του ιστού για τις search engines με αποτέλεσμα να μην «βλέπουν» το νέο περιεχόμενο που τυχόν να έχει προστεθεί.

Σε περίπτωση που σας έχει τύχει, μην πανικοβάλλεστε αφού τα περισσότερα web robots ανιχνεύουν τον ιστό ανά τακτά χρονικά διαστήματα. Κάνοντας μια αναζήτηση στο internet θα ανακαλύψετε και πολλά προγράμματα που βοηθούν ακριβώς σε αυτή τη διαδικασία, να επιβλέπουν δηλαδή το εάν βρίσκεται ή βρέθηκε εκτός δικτύου το site σας και εάν λειτουργούν όλοι οι σύνδεσμοι της ιστοσελίδας σας (broken link checker).

Scroll to top