PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : سوال در مورد گوگل و ایندکس



wordpress
August 8th, 2011, 02:26
تا 3 ماه پیش یک سایت وبلاگدهی داشتم با حدود 5000 تا صفحه ایندکس در گوگل که به دلایلی تمام اطلاعات از بین رفت و مجبور شدم دوباره با همون دومین از صفر شروع و البته از یک سیستم دیگه استفاده کردم الان 3 ماه گذشته ولی هنوز گوگل میاد و به لینک های سیستم قبلی سر میزنه که البته با خطای 404 مواجه میشه ولی دست بردار نیست
چجوری باید به گوگل فهموند سیستم قبل دیگه وجود نداره و صفحات قبلی همش از بین رفته.

lahijsoft
August 8th, 2011, 02:33
سلام
یک جایی خونده بودم باید توی htaccess از کد 301 برای ریدارکت و از فایل robot.txt برای صفحات جدید استفاده کنید.
سریع درست می شه

wordpress
August 8th, 2011, 03:02
سلام
یک جایی خونده بودم باید توی htaccess از کد 301 برای ریدارکت و از فایل robot.txt برای صفحات جدید استفاده کنید.
سریع درست می شه
ریدایرکت به کجا؟

REXNET
August 8th, 2011, 04:04
احتمالا منظورشون اینه که بجای 404 خطای 301 یا همون عدم دسترسی به گوگل بدهید... در مورد robot.txt هم باید URL هایی که نمیخواید گوگل یا هر ربات و اسپایدر دیگری index کند را مشخص کنید.

مورد اول ممکنه جواب بده، ولی مورد دوم اینجا کاربر نداره (شما نمیتونید هر چی URL بوده رو لیست کنید)

بهتره این کار رو توسط Webmaster Tools گوگل انجام بدهید. در سیستم ثبت نام کنید سپس امکانات زیادی من جمله همین حذف صفحات سایت به شما ارایه میشه. (با IP ایران وارد نشوید.)

wordpress
August 11th, 2011, 15:10
احتمالا منظورشون اینه که بجای 404 خطای 301 یا همون عدم دسترسی به گوگل بدهید... در مورد robot.txt هم باید URL هایی که نمیخواید گوگل یا هر ربات و اسپایدر دیگری index کند را مشخص کنید.

مورد اول ممکنه جواب بده، ولی مورد دوم اینجا کاربر نداره (شما نمیتونید هر چی URL بوده رو لیست کنید)

بهتره این کار رو توسط Webmaster Tools گوگل انجام بدهید. در سیستم ثبت نام کنید سپس امکانات زیادی من جمله همین حذف صفحات سایت به شما ارایه میشه. (با IP ایران وارد نشوید.)

میشه بگین چجوری میشه با گوگل وبمستر این صفحات قدیمی که الان وجود نداره رو پاک کنم؟
همچنین تمام لینک های قدیمی به این صورت هستن:


http://mysite.com/2010/...
http://mysite.com/2011/...

توی فایل robots.txt کد زیر را قرار دادم:


User-agent:*
Disallow:/2010/
Disallow:/2011/


ولی با هم گوگل میاد به این لینکها سر میزنه!

REXNET
August 11th, 2011, 17:20
شما فایل robot.txt رو کا آماده کردی، برای اطمینان بیشتر یک فولدر های آرشیو های قدیمی ات رو هم بسیاز و کد زیر رو در یک فایل index.php داخلشون قرار بده:



<?php
header('HTTP/1.1 404 Not Found');
echo "<!DOCTYPE HTML PUBLIC \"-//IETF//DTD HTML 2.0//EN\">\n<html><head>\n<title>404 Not Found</title>\n</head>";
echo "<body>\n<h1>404 Not Found</h1>\n<p>The requested URL ".$_SERVER['REQUEST_URI']." was not found on this server.</p>\n";
echo "<hr>\n".$_SERVER['SERVER_SIGNATURE']."\n</body></html>\n";
exit;
?>


ضمن اینکه ظاهرا حدود یکی دو هفته باید صبر کنی تا گوگل دوباره بررسی کنه صفحات رو...

---------- Post added at 04:20 PM ---------- Previous post was at 04:11 PM ----------

راستی، ممکنه روش زیر هم جواب بده:



<?php
header( "HTTP/1.1 301 Moved Permanently" );
header( "Location: http://www.main-domain.com" );
?>


من قبلا تست نکردم این روش های 404 و 301 رو ، در تئوری ظاهرا باید جواب بدهند، ولی در عمل باید تست بشه...