Sponsor-Board.de

Normale Version: IBM Server abgeraucht
Du siehst gerade eine vereinfachte Darstellung unserer Inhalte. Normale Ansicht mit richtiger Formatierung.
Moin Leute,

mir ist gestern so aus dem Nichts leider meine schöne IBM Kiste abgeraucht.

Ich wollte mich - nichts böses ahnend - in aller Seelenruhe auf das Ding einloggen, aber es antwortet nicht. Ich denke mir so: "Okay, vielleicht Netzwerk down."
Gut, Netzwerk gecheckt - alles in Ordnung. Bin ich zum Server hingerannt und merke er ist aus. Da das Ding ja eine schöne Enterprise Kiste ist, sagt die einem ja wenn was nicht stimmt.
Zieh ich also das Light Path Diagnostics Ding raus und schau mir die Lämpchen an. Da leuchtet "TEMP". Gut, ist also überhitzt. Ich schraub das Ding auf, machs an und schau ob alle Lüfter gehen. Tun sie. Kiste ist auch komplett kühl gewesen.

Ich hab den guten dann trotzdem ne Weile liegen gelassen (genau gesagt über Nacht, so ca. 10 Stunden insgesamt komplett außer Betrieb) um sicher zu sein, dass er sich wieder wohl fühlt. Naja, dann komm ich am Morgen wieder in den Raum, schau mir das Teil an und .............. RICHTIG! Die Lampe "TEMP" leuchtet immer noch. Da hab ich mal das Netzteil abgestöpselt und wieder angestöpselt, da war die Lampe aus. Hab ich mich schon gefreut, dass es nur irgendwie eine kurze Macke war aber die Kiste hat mich verarscht.

Ich starte das Ding, der ruhige Ton von 8 Lüftern erklingt - ich fühle mich jedes Mal wie am Flughafen - und was passiert? Naja, der Bildschirm bleibt dunkel. Frei nach dem Motto "es raucht und zischt, zu seh'n ist nüscht" Biggrin
Es kam also nicht einmal ein BIOS Screen oder dergleichen. Einfach gar nichts.

Dann hab ich das Ding per Hard Reset (lange auf den Schalter gedrückt) wieder ausgemacht und kaum ist es aus fängt "TEMP" wieder an zu leuchten.
Auch interessant: wenn er "in Betrieb" - also an - ist, dann leuchtet auch dauerhaft die Festplatten-Leuchte.

Es handelt sich um einen IBM xSeries 346 Type 8840 mit 2x Intel Xeon, 4 GB RAM und 2x 70 GB SCSI Platten. Redundante Netzteile und Netzwerkkarten natürlich auch eingebaut.

Hat jemand eine Idee, was ich ihm flüstern muss, dass er wieder läuft? Er ist zwar schon ein wenig alt aber es war ein Geschenk und an sich hat er bisher gute Dienste geleistet (ja, der RAM und die HDDs reichen, ich brauch nur CPU Leistung).

Würde mich echt freuen, wenn die Kiste bald wieder laufen würde.
Zu jedem Server der von einem Markenhersteller ist, gibt es auch eine Specs und Maintenance Guide. Leider meist nur auf englisch, dafür aber ausführlich.

Für dein Modell: [Link: Registrierung erforderlich]

Leider kann ich mehr dazu nicht sagen, weil ich Dell Server im Einsatz habe. Aber wenn wirklich nicht mal das BIOS erscheint, also der Bootvorgang nicht anläuft, dann wird vermutlich der Prozessor nicht richtig gekühlt. Moderne Systeme schalten den Prozessor sofort ab, wenn er heiß läuft. Manchmal kommt es vor, dass während des Zusammenbauprozesses die Wärmeleitpaste nicht korrekt oder gar nicht aufgetragen wurde.

Grüße
Shadowsilk
Moin,

danke für deine Antwort. Das PDF habe ich mir natürlich schon angesehen, allerdings konnte ich dem keine weiterführenden Informationen entnehmen. Ich habe gerade gesehen, dass auch wenn die Lüfter an sind und damit der Server ja eigentlich "läuft" die Power-on LED blinkt - die Dokumentation sagt dazu "When this LED is flashing, it indicates that the server is turned off and still connected to an ac power source". Hilft das vielleicht weiter?

Wärmeleitpaste ist auf beiden CPUs, sieht aber schon ein wenig ausgetrocknet aus (keine Ahnung, ob das normal ist). Allerdings glaube ich wie oben bereits beschrieben nicht wirklich an eine Überhitzung, da ich ihn ja eine Ewigkeit ausgeschaltet gelassen habe und er trotzdem nicht starten wollte.

Wenn sonst niemand mehr eine Idee hat, würde ich wahrscheinlich morgen mal beim IBM Support anrufen, ich weiß nur nicht, ob die bei so alten Kisten noch helfen wollen oder können. Vielleicht hat ja noch jemand eine zündende Idee.

Danke für eure Hilfe!
Ich denke, die Meldung muss man dir nun nicht übersetzen oder?

Alles ausbauen / abziehen / rausziehen, nach und nach wieder anschließen.

Wenn eine KVM Karte vorhanden ist, auf das Webinterface einloggen und mal das Log checken.

Ich denke nicht, dass dir IBM da weiterhelfen wird, denn ohne Service Vertrag meist auch kein Support Wink
Danke für deinen Post. Warum alles aus- und wieder einbauen? Meinst du, er sagt er wäre nicht an, weil ein Teil nicht korrekt eingebaut ist?
Wäre eine Möglichkeit, fände ich aber sehr seltsam, da die Konfiguration an sich ja schon lief und eigentlich nichts geändert wurde. Die "TEMP" Anzeige erklärt das auch nicht. Aber ich versuch's mal.

Eine KVM Karte habe ich leider nicht.

Dream-Code schrieb:
Warum alles aus- und wieder einbauen? Meinst du, er sagt er wäre nicht an, weil ein Teil nicht korrekt eingebaut ist?


Nein, aber weil evtl. ein Teil defekt sein könnte....

Die Wärmeleitpaste würde ich erneuern. Sollte es daran liegen, dass die CPU's überhitzen, passiert dies innerhalb von Sekunden.
Da ist es egal ob das Gerät 10 Stunden vom Netz war.

Ich denke aber nicht, dass es an einer Überhitzung liegt.

Wenn du Pech hast, ist auch das MainBoard im Dot.

Peter

-
Hi,

wie bereits beschrieben, kann das ausbauen aller Teile Wunder wirken.
Auch solltest du alle Teile gründlich reinigen vor dem erneuten Einbau.
Die Wärmeleitpaste sollte man regelmäßig erneuern. Die kostet auch nicht viel.

Wenn allerdings alle Lüfter laufen und nur die Wärmeleitpaste eingetrocknet ist glaube ich nicht dass es am Überhitzen der Prozessoren liegt.
Auch die eingetrocknete Wärmeleitpaste leitet wäre, auch wenn der leitende Effekt nicht optimal ist.

Bei alter Rechner wollte mal nicht starten als einer der beiden Ram Riegel defekt war. Ob dein System darauf auch so sensibel wirkt weiß ich nicht, aber ein versuch wäre es wert wenn du zufällig noch andere Ram Riegel rumliegen hast.


Lg eret12

Atchu schrieb:
Wenn du Pech hast, ist auch das MainBoard im Dot.


Letztlich ist es genau das, worauf ich hinaus wollte. Wenn schon kein Bild mehr kommt, könnte das am wahrscheinlichsten sein.

Peter schrieb:
Ich weiß was verbaut ist, was die Hardware kann und komme an alles heran. Bei solchen IBM / Dell / HP Endprodukt Servern regt es mich immer wieder auf, wie eingeschränkt ein Admin sein kann - wie er auch im Dunkeln tappt um das Problem zu finden.


Dem kann ich so nicht zustimmen. Wir setzen ausschließlich auf DELL Server - diese sind Modular und Übersichtlich aufgebaut. Viele Komponenten sind Redundant oder so ausgelegt, dass Teile im laufenden Betrieb ausfallen können und ausgetauscht werden können ohne dass der Live Betrieb beeinflusst wird.

Peter schrieb:
Hinzu: teure Supportverträge (< Schwachsinn, wenn man nicht genau für Irgendwelche Applikations diese Server benötigt)

Also für ~2000€ 4h Critical bekommst du keinen neuen Server binnen 4h Nachts um 3 Uhr - von daher hängt das nicht von der Anwendung ab sondern ehr davon, wie viel Ausfall du dir erlauben kannst. Weiterhin hast du dann einen, bei welchem du Schadensersatz einklagen kannst.

Peter schrieb:
Zudem ist die Hardware besser, zum billigeren Preis. Und nein, die Hardware ist kein Schrott Wink

Ich finde nicht, dass die günstiger sind sondern ehr teurer. Ein Gehäuse kostet ja schon 300 - 600€.

Z.b. gibt es gebrauchte DELL Server schon für ~400€, ausgestattet mit 6 HDD Einschüben, einer SAS Backplane einem LSI RAID Controller mit BBU, einem 2 Socket Mainboard, ECC RAM, TOE, redundanten Netzteilen.

Weiterhin sind die meisten Komponenten Steckbar eingebaut. I.d.R. brauchst du keinen Schraubenzieher um einen Lüfter zu tauschen oder ein Netzteil etc.

Referenz-URLs