PranasLu's Blog

2011-08-22

Tinklapio pašalinimas iš google paieškos rezultatų, kai tu nesi tinklapio savininkas

Filed under: Kita — Tags: , , — pranaslu @ 12:26

Priešistorė

Anksčiau rašiau, kaip atnaujinti tinklapio kopiją google paieškoje  (“google cache”), kai tu nesi to tinklapio savininkas: https://pranaslu.wordpress.com/2010/04/22/greitas-google-cache-ivalymasatnaujinimas-kai-tu-nesi-svetaines-savininkas/

Gavau nevieną pasiteiravimą, iš kurių matyti kad žmonės maišo google paieškos rezultatą ir tinklapio kopiją google paieškoje (ang. google cache).

Skirtumą paaiškina sekantis pavyzdys:
Google paieškoje galiu susirasti tinklapį su konfidencialia informacija. Bet paspaudus surastą nuorodą atsidarys tuščias puslapis su užrašu “404 Page not found”. Tai reiškia kad tinklapis jau ištrintas, bet google paieška vistiek jį randa, remiantis senesne informacija. Negana to google dar saugo pas save to tinklapio kopiją ir ją galima peržiųrėti paspaudus “Cached” nuorodą:

image

Kaip pašalinti tinklapį iš google paieškos rezultatų

Gavau nevieną užklausimą, kaip visiškai pašalinti tinklapį iš google.

Atminkite: Visiškai pašalinti tinklapį iš google paieškos, kai nesate to tinklapio savininkas, galite tik dviem būdais:

1) Nusiųsti google’ui įrodymus apie pažeistas jūsų teises.

2) Su tinklapio administratoriaus pagalba (juk būtų nelogiška, jei bet kuris žmogus galėtų paprašyti ištrinti pvz. Delfi portalą iš google paieškos Smile)

Čia rašysiu tik apie antrajį variantą, t.y. su tinklapio administratoriaus pagalba.

Tinklapio administratorius turi atlikti vieną iš sekančių veiksmų.

  • Visiškai pašalinti tinklapį. If the page no longer exists, make sure that the server returns a 404 (Not Found) or 410 (Gone) HTTP status code. This will tell Google that the page is gone and that it should no longer appear in search results.
  • Palikti puslapį, bet pakeisti robots.txt failą, kad google paieškoje jo neberodytų. If the page still exists but you don’t want it to appear in search results, use robots.txt to prevent Google from crawling it. Note that in general, even if a URL is disallowed by robots.txt we may still index the page if we find its URL on another site. However, Google won’t index the page if it’s blocked in robots.txt and there’s an active removal request for the page.
  • Palikti puslapį, naudoti “noindex” žymę. Alternatively, you can use a noindex meta tag. When we see this tag on a page, Google will completely drop the page from our search results, even if other pages link to it. This is a good solution if you don’t have direct access to the site server. (You will need to be able to edit the HTML source of the page).

In addition, if you want a non-HTML file (for example, a downloadable PDF) to be removed from search results, you or the webmaster should ensure that the file is removed from the server. Once it’s gone, use the process below to request that the page is completely removed from search results.

Po šių administratoriaus veiksmų jūs turite atlikti sekančius veiksmus:

  1. Go to http://www.google.com/webmasters/tools/removals.
  2. If you’re not immediately taken to the ‘Create a new request’ page, click New Removal Request.
  3. Type the URL of the webpage you want removed (not the Google search results URL or cached page URL). Note that the URL is case-sensitive—you will need to submit the URL using exactly the same characters and the same capitalization that the site uses. How to find the right URL. Click Continue.
  4. Click Webmaster has already blocked the page.
  5. Select the checkbox to confirm the requirements listed in this article have been completed, and then click Submit Request.

Dabar belieka laukti, kol automatinis google procesas atsinaujins savo duomenis.

Nuorodos

https://www.google.com/webmasters/tools/removals

http://www.google.com/support/webmasters/bin/answer.py?answer=164734&hl=en – Remove a page or site from Google’s search results

Leave a Comment »

No comments yet.

RSS feed for comments on this post. TrackBack URI

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Blog at WordPress.com.

%d bloggers like this: