6/07/2005

Googlebot

Googlebot Googleren web aztarnaria da. Web guneko dokumentuetan informazioa biltzen du bilatzaileko aurkibidean aurkezteko moduka izan dadin. Web orri honetan, Googlebot robota zure web web gunean nola aritzen den ikusiko duzu:

1. Zenbatero sartzen da Googlebot nire web orrietan?

Web gune gehienetan, Googlebotek egunean behin baino gehiagotan sartu daiteke,baina segundu batzutako tartearekin. Dena den, sareko atzerapenen ondorioz tarte hori handiagoa izan daiteke aldi batzuetan.

2. Nola eskatzen diot Googleri nire web guneko zati batzuen aztarna ez jarratitzeko?


Robots.txt Googleri web gunetik informazio zati bat ez hartzea esateko erabiltzen den dokumentu standard bat. Robots.txt artxiboaren formatua Robot Exclusión Standard -ean azaltzen da. Zure web gune osoa edo zati bat Googlebotgatik arakatua ez izateko. Detaile gehiagoko azalpenak lortzeko Googleko Removal page web orrira joan behar duzu. Gogoratu, zure zerbitzariko robots.txt artxiboaren aldaketak ez dira bat batean Googlegatik ikusiak izango, baizik eta Googlebot zure web gunetik pasatzen denean eguneratuko da.

3. Googlebot nire webgunea azkarregi aztertzen ari da. Zer egin dezaket?

Kontaktatu Googlekoekin zure web gunearen URL adieraziz eta zure arazoaren deskribapen bat emanez. Bidali ezazu baita ere web guneko “log” zati bat Googleboten sarrerak ikusi ahal izateko eta arazoa arinago konpondu ahal izateko.

4. Zergatik dago Googlebot robots.txt artxibo baten bila, nire zerbitzarian horrelakorik ez badago?

Robots.txt standard dokumentu bat da, honek Googleboti esaten dio zure zerbitzariko web gune batetik informazio guztia edo zati bat ez arakatzeko. Robots.txt artxiboari buruzko informazio gehiago The Robot Exclusion Standard web orrian aurkituko duzu. Zure zerbitzariko sarreretan “file not found” mezua agertzea nahi ez baduzu, nahikoa da utzik dagoen robots.txt artxibo bat sortzea.

5. Zergatik ari da Googlebot nire zerbitzari “sekretutik” informatzioa ateratzen?

Ia ezinezkoa da beste web gune batzuetatik loturak dituen zerbitzari bat sekretuan mantentzea. Edonork lotura bat jartzen duenean zerbitzari sekretutik beste zerbitzari batera, URL hori gordeta geratzen da beste zerbitzarian eta lotura hori web gunean agertzen bada zihurrenik Googlebotek jarraitu egingo du lotura hori zerbitzari sekretua aurkitu arte.

6. Zegatik Googlebot ez dio kasurik egiten nire robots.txt artxiboari?

Banda zabalera aurrezteko Googlebotek bakarrik irakurtzen dut robots.txt artxiboa egunean behin. Gainera, informazioa makina ezberdinetan gordetzen da eta beraz, batzutan informazioa beste makina batetik atera dezake.

Sintaxia ondo dagoela aztertu ezazu eta http://www.robotstxt.org/wc/exclusion.html#robotstxt standarra betetzen duela egiaztatu. Ohiko arazo jatorri bat robots.txt subdirektorio baten jartzeagatik izaten da, egiaztatu maila goreneko direktorioan dagoela (e.g., www.myhost.com/robots.txt);

robots.txt artxiboaren konfigurazio posible bat hau izan daiteke::

User-Agent: *
Allow: /
Disallow: /cgi-bin

Honekin webmasterraren intentzioa Googlebot cgi-bin direktorioa izan ezik, beste guztia arakatzea da, eta hori da Googlek egiten duena.

7. Nolako loturak segitzen ditu Googlebot?

Googlebot HREF loturak eta SRC loturak segitzen ditu.

8. Zer egin dezaket Googlbotek nire orrietako loturak ez segitzeko?

Googlebot zure web orrietako loturak ez jarraitzeko, META etiketa hau erabili behar duzu web orriko “head” aldean:
...META NAME="Googlebot" CONTENT="nofollow"

Gogoratu, aldaketak ez dira bat batean Googlegatik ikusiak izango, baizik eta Googlebot zure web gunetik pasatzen denean eguneratuko da.

9. Nola esan diezaioket Googleboteri lotura zehatz bat ez segitzeko?

Lotura bakar bat Googlebotengatik babeztu nahi duguenean rel=”nofollow” berezitasuna erabiliko dugu. Adibidez:

... href=http://www.example.com/

jarri ordez, hau jarriko genuke:

... href=http://www.example.com/ rel="nofollow"
10. Googlebot buruzko galdera gehiago ditut, zer egin dezaket?

Jarri zaitez Googlekoekin kontaktuan.

No comments:

Bilatu