ورود

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : مشکل در Vmware



tehvps
November 15th, 2011, 14:13
سلام، یکی از سرور های ما که در هتزنر هست چند روزی هست یه مشکلی براش پیش اومده، چند ساعت یک بار vps ها پینگشون از دست میره و down میشه،وقتی از طریق VMware vSphere وارد کنسول میشم و مثلا میخوام یه سرور و ریست بزنم هنگ میکنه و در Progress هنگ میکنه و باید حتما سرور و ریست کنیم،بعد از ریست کردن سرور و روشن کردن vps ها پینگ سرور ها برای چند ساعت برطرف میشه ولی دوباره همین مشکل براش پیش میاد، البته تو همون چند ساعت که سرور ها پینگ دارن نمیشه از vps استفاده کرد، مثلا به ویندوز ریموت نمیشه و یا وارد ssh نمیشه، در ضمن در تمام مراحل بالا سرور خودش پینگ داره و ssh هم فعال هست،ما درخواست تست سخت افزاری به دیتاسنتر دادیم و بعد از چک کردن اعلام کردن که مشکلی نداره از نظر سخت افراری

the_coder
November 15th, 2011, 14:17
سلام
چک کنید ببینید زمانی که سرور این حالت براش پیش میاد چه میزان از رم و سی پی یو استفاده میشه

TOOBA IT
November 15th, 2011, 14:20
چند تا وي پي اس رو سرور هست ؟ پورت سرور 100 مگابايت ؟

tehvps
November 15th, 2011, 14:27
سلام
چک کنید ببینید زمانی که سرور این حالت براش پیش میاد چه میزان از رم و سی پی یو استفاده میشه

اتفاقا این موضوع و چک کردم،مصرف رم و سی پی یو معمولی بود،من روی این سرور کلا 19 تا vps دارم، پورت هم 1 هست

the_coder
November 15th, 2011, 14:39
محتویات این2 تا فایل رو قرار بدید :

/var/log/messages

/var/log/vmware/hostd.log

tehvps
November 15th, 2011, 15:06
فایل messages


Nov 15 01:51:16 Hostd: [2011-11-15 01:51:16.422 60D07B90 verbose 'Locale' opID=853B44DC-000003E4] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.summary' expected in module 'enum'.
Nov 15 01:51:16 Hostd: [2011-11-15 01:51:16.422 60D07B90 verbose 'Locale' opID=853B44DC-000003E4] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.label' expected in module 'enum'.
Nov 15 01:51:16 Hostd: [2011-11-15 01:51:16.422 60D07B90 verbose 'Locale' opID=853B44DC-000003E4] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.summary' expected in module 'enum'.
Nov 15 01:51:18 vmkernel: 0:15:47:38.277 cpu2:99264)<6>ahci_scsi_abort: cmd 0x2a (0x41000c01c1c0), entering...
Nov 15 01:51:18 vmkernel: 0:15:47:38.277 cpu2:99264)<7>ata1: ahci_port_reset, entering...
Nov 15 01:51:20 vmkernel: 0:15:47:40.263 cpu2:99264)<6>ata1: ahci_port_reset: SUCCEEDED
Nov 15 01:51:20 vmkernel: 0:15:47:40.263 cpu2:99264)<6>ahci_scsi_abort: cmd 0x2a (0x41000c01c1c0), SUCCEEDED
Nov 15 01:51:20 Hostd: [2011-11-15 01:51:20.702 60DCAB90 verbose 'vm:/vmfs/volumes/4e5c00cc-e635d954-289e-001b21b8805f/Win2003_8/Win2003_8.vmx'] Running status of tools changed to: notRunning
Nov 15 01:51:23 Hostd: [2011-11-15 01:51:23.854 60BC2B90 verbose 'vm:/vmfs/volumes/4e5c00cc-e635d954-289e-001b21b8805f/Win2003_10/Win2003_10.vmx'] Updating current heartbeatStatus: yellow
Nov 15 01:51:25 Hostd: [2011-11-15 01:51:25.299 60E0BB90 verbose 'vm:/vmfs/volumes/4e5c00cc-e635d954-289e-001b21b8805f/Win2003_1/Win2003_1.vmx'] Updating current heartbeatStatus: yellow



فایل hostd.log


[2011-11-15 19:35:04.943 60C85B90 verbose '*****svc Req01117'] New ***** client SSL(TCP(local=78.47.191.90:2883, peer=176.9.28.106:443))
[2011-11-15 19:35:06.245 602F3B90 verbose 'Locale' opID=853B44DC-00001381] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.label' expected in module 'enum'.
[2011-11-15 19:35:06.245 602F3B90 verbose 'Locale' opID=853B44DC-00001381] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.summary' expected in module 'enum'.
[2011-11-15 19:35:06.246 602F3B90 verbose 'Locale' opID=853B44DC-00001381] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.label' expected in module 'enum'.
[2011-11-15 19:35:06.246 602F3B90 verbose 'Locale' opID=853B44DC-00001381] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.summary' expected in module 'enum'.
[2011-11-15 19:35:20.011 60E4CB90 error 'Statssvc'] HostCtl Exception during stats collection: Unable to complete Sysinfo operation. Please see the VMkernel log file for more details.
[2011-11-15 19:35:26.245 60841B90 verbose 'Locale' opID=853B44DC-00001382] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.label' expected in module 'enum'.
[2011-11-15 19:35:26.246 60841B90 verbose 'Locale' opID=853B44DC-00001382] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.summary' expected in module 'enum'.
[2011-11-15 19:35:26.246 60841B90 verbose 'Locale' opID=853B44DC-00001382] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.label' expected in module 'enum'.
[2011-11-15 19:35:26.246 60841B90 verbose 'Locale' opID=853B44DC-00001382] Default resource used for 'host.SystemIdentificationInfo.IdentifierType.Asse tTag.summary' expected in module 'enum'.

the_coder
November 15th, 2011, 15:21
باید زمانی که مشکل پیش میاد log بدید تا متوجه بشیم مشکل از چیه
وقتی این مشکل پیش اومد توی ssh بزنید :

/sbin/services.sh restart
وقتی زدید اگر مشکلتون حل شد
ببینید میتونید متوجه شید موقع ری استارت سرویس ها کدوم سرویس استارت نبوده؟
بعد سرویس رو اینجا اعلام کنید

tehvps
November 15th, 2011, 15:30
باید زمانی که مشکل پیش میاد log بدید تا متوجه بشیم مشکل از چیه
وقتی این مشکل پیش اومد توی ssh بزنید :

/sbin/services.sh restart
وقتی زدید اگر مشکلتون حل شد
ببینید میتونید متوجه شید موقع ری استارت سرویس ها کدوم سرویس استارت نبوده؟
بعد سرویس رو اینجا اعلام کنید

همین الان این مشکل وجود داره و سرورها پینگ ندارن و دو دستوری هم که داخل VMware vSphere زدم کامل انجام نشده و گیر کرده،الان این دستور و اجرا کردم و نتیجه اش :


~ # /sbin/services.sh restart
Running sfcbd-watchdog stop
Running usbarbitrator stop
watchdog-usbarbitrator: Terminating watchdog with PID 5339
usbarbitrator stopped.
Running wsman stop
Stopping openwsmand
Running slpd stop
Stopping slpd
Running hostd stop
watchdog-hostd: Terminating watchdog with PID 5098
Running lbtd stop
watchdog-net-lbt: Terminating watchdog with PID 5083
net-lbt stopped.
Running sensord stop
sensord is not running.
Running storageRM stop
watchdog-storageRM: Terminating watchdog with PID 5024
storageRM module stopped.
Running vobd stop
watchdog-vobd: Terminating watchdog with PID 4997
Vobd stopped.
Running vprobed stop
watchdog-vprobed: Terminating watchdog with PID 4975
vprobed stopped.
Running TSM-SSH stop
Stopping tech support mode ssh server
Running DCUI stop
Disabling DCUI logins
Running ntpd stop
Stopping ntpd
Running ntpd restart
Starting ntpd
Running DCUI restart
Enabling DCUI login: runlevel =
Running TSM-SSH restart
Starting tech support mode ssh server
Running vprobed restart
vprobed started.
Running vobd restart
Vobd started.
Running storageRM restart
storageRM module started.
Running sensord restart
sensord started.
Running lbtd restart
net-lbt started.
Running hostd restart
Running slpd restart
[211723] Begin 'hostd ++min=0,swap,group=hostd /etc/vmware/hostd/config.xml', min-uptime = 60, max-quick-failures = 1, max-total-failures = 1000000
Starting slpd
Running wsman restart
Starting openwsmand
Running usbarbitrator restart

the_coder
November 15th, 2011, 15:34
اگر امکانش براتون هست مشخصات سرور رو پ خ کنید تا خودم بررسی کنم
اگر وی پی اس لینوکسم روی سرور دارید مشخصات او رو هم بفرستید

hamid.jafary
November 16th, 2011, 07:39
شبیه این مورد: http://www.webhostingtalk.ir/f65/33435/