-
August 8th, 2011, 02:26
#1
عضو انجمن
سوال در مورد گوگل و ایندکس
تا 3 ماه پیش یک سایت وبلاگدهی داشتم با حدود 5000 تا صفحه ایندکس در گوگل که به دلایلی تمام اطلاعات از بین رفت و مجبور شدم دوباره با همون دومین از صفر شروع و البته از یک سیستم دیگه استفاده کردم الان 3 ماه گذشته ولی هنوز گوگل میاد و به لینک های سیستم قبلی سر میزنه که البته با خطای 404 مواجه میشه ولی دست بردار نیست
چجوری باید به گوگل فهموند سیستم قبل دیگه وجود نداره و صفحات قبلی همش از بین رفته.
-
-
August 8th, 2011 02:26
# ADS
-
August 8th, 2011, 02:33
#2
عضو انجمن
پاسخ : سوال در مورد گوگل و ایندکس
سلام
یک جایی خونده بودم باید توی htaccess از کد 301 برای ریدارکت و از فایل robot.txt برای صفحات جدید استفاده کنید.
سریع درست می شه
-
-
August 8th, 2011, 03:02
#3
عضو انجمن
پاسخ : سوال در مورد گوگل و ایندکس

نوشته اصلی توسط
lahijsoft
سلام
یک جایی خونده بودم باید توی htaccess از کد 301 برای ریدارکت و از فایل robot.txt برای صفحات جدید استفاده کنید.
سریع درست می شه
ریدایرکت به کجا؟
-
-
August 8th, 2011, 04:04
#4
عضو انجمن
پاسخ : سوال در مورد گوگل و ایندکس
احتمالا منظورشون اینه که بجای 404 خطای 301 یا همون عدم دسترسی به گوگل بدهید... در مورد robot.txt هم باید URL هایی که نمیخواید گوگل یا هر ربات و اسپایدر دیگری index کند را مشخص کنید.
مورد اول ممکنه جواب بده، ولی مورد دوم اینجا کاربر نداره (شما نمیتونید هر چی URL بوده رو لیست کنید)
بهتره این کار رو توسط Webmaster Tools گوگل انجام بدهید. در سیستم ثبت نام کنید سپس امکانات زیادی من جمله همین حذف صفحات سایت به شما ارایه میشه. (با IP ایران وارد نشوید.)
How terrible is wisdom when it holds no benefit for the wise?" - Louis Cypher"
-
-
August 11th, 2011, 15:10
#5
عضو انجمن
پاسخ : سوال در مورد گوگل و ایندکس

نوشته اصلی توسط
REXNET
احتمالا منظورشون اینه که بجای 404 خطای 301 یا همون عدم دسترسی به گوگل بدهید... در مورد robot.txt هم باید URL هایی که نمیخواید گوگل یا هر ربات و اسپایدر دیگری index کند را مشخص کنید.
مورد اول ممکنه جواب بده، ولی مورد دوم اینجا کاربر نداره (شما نمیتونید هر چی URL بوده رو لیست کنید)
بهتره این کار رو توسط Webmaster Tools گوگل انجام بدهید. در سیستم ثبت نام کنید سپس امکانات زیادی من جمله همین حذف صفحات سایت به شما ارایه میشه. (با IP ایران وارد نشوید.)
میشه بگین چجوری میشه با گوگل وبمستر این صفحات قدیمی که الان وجود نداره رو پاک کنم؟
همچنین تمام لینک های قدیمی به این صورت هستن:
کد:
http://mysite.com/2010/...
http://mysite.com/2011/...
توی فایل robots.txt کد زیر را قرار دادم:
کد:
User-agent:*
Disallow:/2010/
Disallow:/2011/
ولی با هم گوگل میاد به این لینکها سر میزنه!
-
-
August 11th, 2011, 17:20
#6
عضو انجمن
پاسخ : سوال در مورد گوگل و ایندکس
شما فایل robot.txt رو کا آماده کردی، برای اطمینان بیشتر یک فولدر های آرشیو های قدیمی ات رو هم بسیاز و کد زیر رو در یک فایل index.php داخلشون قرار بده:
کد PHP:
<?php
header('HTTP/1.1 404 Not Found');
echo "<!DOCTYPE HTML PUBLIC \"-//IETF//DTD HTML 2.0//EN\">\n<html><head>\n<title>404 Not Found</title>\n</head>";
echo "<body>\n<h1>404 Not Found</h1>\n<p>The requested URL ".$_SERVER['REQUEST_URI']." was not found on this server.</p>\n";
echo "<hr>\n".$_SERVER['SERVER_SIGNATURE']."\n</body></html>\n";
exit;
?>
ضمن اینکه ظاهرا حدود یکی دو هفته باید صبر کنی تا گوگل دوباره بررسی کنه صفحات رو...
---------- Post added at 04:20 PM ---------- Previous post was at 04:11 PM ----------
راستی، ممکنه روش زیر هم جواب بده:
کد PHP:
<?php
header( "HTTP/1.1 301 Moved Permanently" );
header( "Location: http://www.main-domain.com" );
?>
من قبلا تست نکردم این روش های 404 و 301 رو ، در تئوری ظاهرا باید جواب بدهند، ولی در عمل باید تست بشه...
ویرایش توسط REXNET : August 11th, 2011 در ساعت 17:13
How terrible is wisdom when it holds no benefit for the wise?" - Louis Cypher"
-