X570 Unify - Ryzen 5900x crasht/startet neu WHEA-Logger ID 18 / Kernel-Power 41
Wir veröffentlichen neue Datenschutzrichtlinien um der europäischen DS-GVO, die ab dem 25.Mai 2018 in Kraft tritt, gerecht zu werden. Die neuen Datenschutzrichtlinien können Einfluss auf die Verwendung Ihrer Daten haben. Durch die weitere Nutzung unsere Webseiten stimmen Sie der Verwendung von Cookies, den neuen Datenschutzrichtlinien und den Geschäftsbedingungen zu.
Bitte loggen sie sich ein oder registrieren sie sich.

Einloggen mit Benutzername, Passwort und Sitzungslänge Bitte loggen sie sich ein oder registrieren sie sich.
Erweiterte Suche  

Autor Thema: X570 Unify - Ryzen 5900x crasht/startet neu WHEA-Logger ID 18 / Kernel-Power 41  (Gelesen 959 mal)

0 Mitglieder und 1 Gast betrachten dieses Thema.

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

HW:
Mainboard: MSI x570 Unify
Mainboard-BIOS: 7C35vA82 (Beta version)
CPU: Ryzen 5900x
RAM: Crucial Ballistix BL2K32G36C16U4B 3600 MHz, 64GB (32GB x2)
SSD: M.2 Samsung 970 Evo+ 1TB
Grafikkarte: SAPPHIRE Nitro+ Radeon RX 5700 XT
PSU: be quiet straight power 11 750w
OS: Win 10 - alle Updates installiert
Chipsatztreiber: 2.9.28.509 (released 2020-11-09)

Habe den PC zunächst vor einer Woche mit einem Ryzen 3800x zusammengebaut da unklar war ob und wann ich den bestellten Ryzen 5900x bekommen würde. Lief mit dem mitgelieferten AMD Prism Wrath CPU Kühler ohne Probleme für eine Woche.

- Heute Ryzen 5900x und Scythe Fuma 2 CPU Kühler eingebaut.
- Nach 20 min der erste Absturz/Neustart mit folgenden Einträge in der Ereignisanzeige: WHEA-Logger ID 18 und kritischer Fehler Kernel-Power ID 41.
- Passiert unregelmäßig immer wieder, teils nach Minuten, teils länger: Windows friert zuerst für paar Sekunden ein und dann startet der PC neu
- Oben genanntes BIOS und Chipsatztreiber geupdated: Problem besteht weiterhin
- XMP Profile deaktiviert (RAM auf 2600 MHz): Problem besteht weiterhin
- CMOS Reset: Problem besteht weiterhin
- Placebomäßig RAM und CPU-Mainboardstecker aus und eingesteckt

Entweder besteht ein Kompatibilitätsproblem von irgendwas mit der CPU, oder die CPU ist defekt?
Was tun? Echt frustrierend :-(
Gespeichert

jeanlegi

  • Global Moderator
  • *****
  • :
  • Offline Offline
  • Beiträge: 2.902

Hatte ich mal mit meinem 3700X. Ich habe dann 1x CPU und RAM und GPU neu eingesetzt. Vorher die Slots der RAM Module und der GPU ausgeplassen.
Danach ging es wieder bei mir.
Gespeichert
Cheerio
JP
1. |2. GS63VR 6RF Stealth Pro (014DE)|3. GE73VR 7RF Raider (266DE)

amd_man_bavarian

  • DoppelAss
  • *
  • :
  • Offline Offline
  • Beiträge: 118

Hallo.
Gehe mal in dein Bios unter OC - Erweiterte DRAM-Konfiguration - ON-DIE Termination Block - ProcODT -> Hier den wert 53.3 Ohm einstellen.

Sollte dies nich alleine Greifen GGf noch RttWR auf 80 Ohm Setzen , RttNom auf Disabled , RttPark auf 240 Ohm.

Eventuell unter CAD Bus werte in der Reihenfolge von oben nach unten einstellen : 24Ohm , 20Ohm , 24Ohm , 24Ohm

Wenn auch dies nicht ausreicht Folgende Spannungen anpassen :

- VDDP Voltage 0,950V
- VDDG CCD Voltage auf 1.000V
- VDDG IOD von 0,7V langsam steigern bis maximal 1.0V

Es kann nicht schaden unter den erweiterten Ram einstellungen unter Misc Gear Down Mode auf enable zu stellen und Power Down auf Deaktiviert.

Mit diesen Einstellungen habe ich auf meinem X570 Gaming Edge WiFi das Problem gelöst was du auch hast mit Kingston HyperX 3466 und auf dem X570 Unify.
Mit dem Aktuellen Bios brauchte ich nur noch den ProcODT anpassen das es stabil war.

Nun läuft der Kingston Ram bei meiner Frau auf dem X570-A Pro (Beta Bios) nur mit ProcODT und auf dem X570 Unify (A82 Bios) der G.Skill ddr4 3600 ebenfalls mit ProcODT angepasst stabil ohne Abstürze mit dem 5800X.

Laut MSI Support soll noch ein neues Agesa für eine bessere Kompatibilität für die Rams kommen

Beste Grüße

Andy
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

Hi,
danke für die detaillierten Anweisungen. Werde ich ausprobieren.
Andy - Woraus schließt du dass es ein RAM Problem ist? Das lief ja mit dem 3800x immerhin stabil. Oder hat die CPU trotzdem Einfluss darauf?

Würde es Sinn machen das System vorher noch mit einem Windows 2 Go vom USB-Stick zu testen um zu sehen ob es dort auch abstürzt? Um zumindest ein Windows Problem ausschließen zu können.
Habe Windows nach dem CPU-Wechseln nicht neu installiert.

Macht ein CMOS Reset mit dem Jumper statt dem CMOS Reset Button Sinn bzw. einen Unterschied?
« Letzte Änderung: 21. November 2020, 13:15:15 von CrispyCrunch »
Gespeichert

amd_man_bavarian

  • DoppelAss
  • *
  • :
  • Offline Offline
  • Beiträge: 118

Ich habe durch viele andere Foren und Fehlersuche herrausgefunden daß es ein Ram Problem ist.
Ich bin ähnlich vorgangen wie Du was die Fehlersuche betrifft.
Auf dem MSI X570 Gaming edge WiFi lief der Kingston HyperX Ram Anfangs auch Problemlos mit dem 3700X.Nach dieversen Biosupdates ,welche ich aus gewohnheit immer installiere da sich ja dadurch die Performance verbessert durch bessere CPU unterstützung (AGESA) .SO nach und nach haben sich unmerklich Fehler bezüglich des Rams eingeschlichen.
Der Ram hat zwei XMP Profile die ich anfangs wählen konnte.Irgendwann stand dann plötzlich für beide optionen nur noch das 3466er Profil zu Verfügung.
Da ich mich auf Ryzen 5000 vorbereiten wollte habe ich weiter die aktuellsten Bios installiert.
Es beganne vorher nicht so recht beachtete Abstürze inklusive Neustert,trotz deaktivierung des automatischen neustarts in Windows , immer häufiger beim Zocken aufzutreten.
Zuerst verbesserte es sich dadurch daß ich die Comandrate des Rams von 1 auf 2 gestellt habe.
Irgendwann half daß auch nicht mehr und ich startete die Fehlersuche.
Inzwischen konnte ich den Fehler provozieren indem ich Prime95 30.3Beta nutzte.
Nach durchforstung vieler Foren stieß ich auf das Ram problem.
Ich habe dann nach tiefer gehenden berichten herrausgefunden das man zB mit hilfe des sogenannten DRAM Calculators für Ryzen CPUs die Subtimings anpassen kann um stabilität für OC zu erreichen.
Wenn man aber keine "scharfen" Timings einstellen will kann man auch Ram stabil bekommen der zB nicht in der Kompatibilitätsliste steht.
Das die Einstellung des ProcODT manchmal nötig sein kann um die Stabilität zu gewährleisten wurde mir durch den Support von G.Skill bestätigt.
In einem anderen Forum haben User die gleichen oder ähnlichen Fehler gehabt wie wir (manche 5900/5950 sind auch im Idle abgestürzt).
Der größte Teil davon hatte einen MSI Unterbau.Denen habe ich meine Einstellungen weitergegeben und die Systeme liefen nun stabil.Zuvor reproduzierbare Abstürze traten dann nicht mehr auf.
Anfangs brauchte ich auf dem Unify alle einstellungen,die ich dir vorgeschlagen habe.Mit dem letzten UEFI/AGESA Update benötigte ich nur noch den angepassten ProcODT.
Da ja alle Ramhersteller anders Produzieren und die Qualität der CPUs auch variieren (Binning) können die Einstellungen auch dir helfen.
Es kann durchaus sein das nach weiteren UEFI/AGESA updates keine einstellungen mehr nötig sind.
Falls du dir unsicher bist ob die Einstellungen schäden hervorrufen können kannst du dazu auch gerne den Ramhersteller und den MSI Support kontaktieren.
Falls von dort ein negatives Feedback kommen sollte kannst du das gerne hier Posten,dann werde ich selbstverständlich weitere Empfehlungen,wie ich sie hier angeboten habe nicht mehr aussprechen.  :-)
Du kannst mit hilfe des Programms ZenTimings 1.2.1 die Werte von mir mit deinen aktuellen vergleichen.

Edit : Es macht keinen Unterschied ob du per Jumper oder Button einen CLRCMOS durchführst.
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

Nachtrag
- Cinebench lief erfolgreich durch, danach im idle trotzdem ein Absturz - schließe ein Lastproblem daher aus

Zwischen-Update:
- Sicherheitshalber Chkdsk /f /r laufen lassen. Es hat Fehler gefunden und behoben. (Oder tut es das immer?)
- 10 min ein Spiel in 4K gespielt ohne Absturz
- Aktuell läuft der von Andy erwähnte Prime95 Stresstest um zu schauen ob sich ein Absturz dadurch provozieren lässt. CPU 100%, RAM ~90% Auslastung. Läuft aktuell bereits 25 min. CPU Temperatur laut CPUID HWMonitor recht hoch während dem Stresstest. 80°C?

Danke noch für die ausführliche Erläuterung wie es zum vorgeschlagenen Lösungsweg gekommen ist. Werde ich ausprobieren.

Hatte in diversen Foren auch häufiger Probleme mit der 5700XT Grafikkarte in dem Zusammenhang gelesen. Das Teil ist ja riesig und hängt gefühlt auch etwas durch. Könnte das ein Problem sein?
Gespeichert

amd_man_bavarian

  • DoppelAss
  • *
  • :
  • Offline Offline
  • Beiträge: 118

Das Die Temperatur so hoch ist ist normal je nach Kühler.Bei mir mit einem Dark Rock Pro 4 liegt die Temperatur bei ca 72°C wenn ich Cinebench 23 im 10 minuten Loop laufen lasse erreiche ich sogar 90°C wenn ich die lüftung des gehäuses nicht anpasse.Die Belastung dort entspricht aber nicht einem normalverbrauch.Wenn in der standard Benutzung niedrigere Temps vorhanden sind passt das.
Bei mir (ich hab ja nur 8 Kerne) hat die CPU beim 4K Gaming mit zb Battlefield zwischen 68°C und 72°C bostet dann aber immer noch mit 4,6GHz.

Ob CHkdsk immer fehler findet kann ich nicht sagen.Bisher habe ich es nicht genutzt.
Ich selber Nutze eine RTX2080 Super von Asus, die ist auch ein ziemlicher Brocken und hängt auch minimal durch.Aber ich denke nicht daß es einen Einfluss hat.

Bei mir mir war es ohne Einstellung teilweise möglich mehere stunden zu Zocken,manchmal auch nur 20 Minuten.
Seit den Einstellungen (also jetzt nur noch ProcODT) hatte ich keinerlei Abstürze mehr.

Falls der Ram nicht ursächlich ist kann es auch helfen im Bios den PCIe Support von Auto auf PCIe 3.0 zu stellen.Das hat ab und zu bei manchen Grafikkarte auch schon geholfen  :-)
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

Prime95 lief nun 1h ohne Absturz. Der Rechner lag dabei, aber denke nicht dass das eine Rolle spielt.

Hier noch die aktuellen Timings ohne Änderungen:
Gespeichert

amd_man_bavarian

  • DoppelAss
  • *
  • :
  • Offline Offline
  • Beiträge: 118

So wie ich sehe sind deine Werte schon nahe dem was ich angegeben habe.Wenn du nur im Idle abstürze hast , dann ändere mal im Bios die Idle control auf Typical :
https://abload.de/img/msi_snapshotr3ki5nmkj1.png
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

Ich hab jetzt noch ProcODT auf 53 Ohm gestellt.

Hast du dann trotzdem noch ein XMP Profil aktiviert?
Gespeichert

amd_man_bavarian

  • DoppelAss
  • *
  • :
  • Offline Offline
  • Beiträge: 118

Ja bei mir ist XMP Aktiviert mit 3600MHz CL 16.

Sorry wenn meine Antworten nicht so schnell kommen, ich bin gerade dabei mei System neu aufzusetzen da ich ne Samsung 980 Pro verbaut habe  ;-)
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

Leider gab es wieder einen Absturz, ohne Last.
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Bus/Interconnect Error
Prozessor-APIC-ID: 25

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.


- Stelle jetzt im Bios die Idle control auf Typical --> Update: Wieder Absturz
- Eine Sache ist mir noch aufgefallen: Schon mit dem Ryzen 3800x ging öfter's mal das Ethernet nicht nach dem Start. In einem Onlinegame häufiger Verbindungsprobleme gehabt. Jetzt nach dem Absturz war das Wlan eine Weile nicht verfügbar. Könnte der Netzwerkadapter Probleme machen?
« Letzte Änderung: 21. November 2020, 17:56:37 von CrispyCrunch »
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

- PCIe der Grafikkarte auf Gen3 gestellt. --> Weiterhin Abstürze.

Werden morgen Mal mehr von den RAM-Settings oben probieren.
Gespeichert

amd_man_bavarian

  • DoppelAss
  • *
  • :
  • Offline Offline
  • Beiträge: 118

Machine Check Exception ist ein fehler der CPU/Ram .
Laut QVL ist dein Ram nicht kompatibel.
Das ganze scheint absolut nicht zu harmonisieren.
Hast du mal probiert deine Energieoptionen auf [b]Höchstleistung[/b] zu stellen ?
Hast du Beide CPU Stecker CPU PWR 1+2 angesteckt?
In welchem Slot stecken die Rams ?Stecken sie in A2/B2?
Hast du mal Memtest durchgeführt?
Eventuell mal schauen ob der CPU Kühler vielleicht zu fest ist oder ungleichmäßig sitzt?
Mal probiert ob es mit dem Wraith Prism Kühler funktioniert?

Hast du Gear down aktiviert und powerdown deaktiviert (RAM)?

Hast du mal die beiden Stecker der Graikkarte getauscht oder eine andere Rail probiert?

Das sind gerade alle möglichkeite die mir auf die schnelle einfallen.


Edit : was mir gerade noch eingefallen ist.Wenn du Windows Version 20H2 hast mal auf 1909 oder 2004 zurück gehen.Ich hab gehört daß das auch schon geholfen hat bei Stabilitätsproblemen  :-)
« Letzte Änderung: 21. November 2020, 22:16:48 von amd_man_bavarian »
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

Machine Check Exception ist ein fehler der CPU/Ram .
Laut QVL ist dein Ram nicht kompatibel.
Das ganze scheint absolut nicht zu harmonisieren.
Hast du mal probiert deine Energieoptionen auf [b]Höchstleistung[/b] zu stellen ?
Hast du Beide CPU Stecker CPU PWR 1+2 angesteckt?
In welchem Slot stecken die Rams ?Stecken sie in A2/B2?
Hast du mal Memtest durchgeführt?
Eventuell mal schauen ob der CPU Kühler vielleicht zu fest ist oder ungleichmäßig sitzt?
Mal probiert ob es mit dem Wraith Prism Kühler funktioniert?

Hast du Gear down aktiviert und powerdown deaktiviert (RAM)?

Hast du mal die beiden Stecker der Graikkarte getauscht oder eine andere Rail probiert?

Das sind gerade alle möglichkeite die mir auf die schnelle einfallen.


Edit : was mir gerade noch eingefallen ist.Wenn du Windows Version 20H2 hast mal auf 1909 oder 2004 zurück gehen.Ich hab gehört daß das auch schon geholfen hat bei Stabilitätsproblemen  :-)

Danke nochmals für die Hinweise.
Dass der RAM nicht kompatibel ist blöd, hab tatsächlich nicht darauf geachtet. Zum Glück kann ich den noch zurück schicken. Würde auch gleich welchen bestellen der passt. Gibt's da was empfehlenswertes mit 64 GB?

Hast du mal probiert deine Energieoptionen auf [b]Höchstleistung[/b] zu stellen ? --> Nein noch nicht
Hast du Beide CPU Stecker CPU PWR 1+2 angesteckt? --> Ja. Spielt es eine Rolle wie rum?
In welchem Slot stecken die Rams ?Stecken sie in A2/B2? --> Ja, A2/B2
Hast du mal Memtest durchgeführt? --> Nein, mach ich morgen
Eventuell mal schauen ob der CPU Kühler vielleicht zu fest ist oder ungleichmäßig sitzt? --> Das könnte tatsächlich der Fall sein, ich locker den morgen mal etwas.
Mal probiert ob es mit dem Wraith Prism Kühler funktioniert? --> Nein, der ist schon in der Post
Hast du Gear down aktiviert und powerdown deaktiviert (RAM)? --> Nein, probier ich morgen
Hast du mal die beiden Stecker der Graikkarte getauscht oder eine andere Rail probiert? --> Nein, probier ich morgen
Gespeichert

amd_man_bavarian

  • DoppelAss
  • *
  • :
  • Offline Offline
  • Beiträge: 118

Wie rum die 8 Pin Stecker eingesteckt sind ist eigentlich egal,aber ein tausch kann trotzdem mal nicht schaden nur das mal alles ausgeschlossen ist.

Crucial ist ansich kein schlechter Ram und hat bei mir mit Intel immer gut Funktioniert.Bei AMD und nicht mehr so ganz obwohl es ja die Hausmarke von Micron ist.

Die bisher besten Erfahrungen von der kompatibilität habe ich mit Corsair , G.Skill und Kingston gemacht.Natürlich gibt es auch andere Hersteller die gut sind,aber ich habe nicht so viel testen wollen und auch nicht das Bedürfnis Feldtester für die Hersteller zu sein.Somit habe ich mich an die gehalten wo ich die besten Erfahrungen hatte  ;-)

Freigegeben ist beispielsweise dieses Kit : CMK64GX4M2D3600C18  von Corsair

So wie ich es bei MSI festgestellt habe ,haben die überwiegend Rams mit samsung B-Dies getestet und freigegeben.Die sund natürlich zu teuer.Das Corsair set hat zwar nicht die besten Timings,aber ich denke da kann man noch was machen mit zB einem aktualisierten DRAM Calulator für Ryzen.Ich denke den werden die für Zen 3 auch noch aktualisieren.
Ich habe auch festgestellt daß Größere Kits bei MSI meist nur für maximal teilbestückung (2 Riegel) freigegeben sind,außer sie haben keinen hohen Takt.Ich vermute das sonst der Memory Controller überlastet.
Also ist es Fraglich ob es läuft wenn du auf 128GB erweitern willst.
Lustigerweise sind Rams freigegeben für das Board die eigentlich garnicht verbaut werden können da sie zB aus 8x8 GB bestehen  :-P
Mit ein wenig glück läuft das set mit den anderen Anpassungen (subtimings/Spannungen) auch bei dir.Wäre schade wenn du den Ram einschicken und auf neuen warten müsstest.

Was mir noch eingefallen ist wäre die möglichkei daß du nicht ein XMP verwendest sondern Memorytryit.Eventuell passt das Board weitergehende Subtimings bei dir dann so an das es stabil wird.
Eventuell musst du auch noch probieren die Spannung zu erhöhen,auch wenn ich davon kein freund bin.Manchmal hilft es schon auf 1,36-1,38V zu gehen.Vermeiden sollte man (meiner Meinung nach) spannungen über 1,4V.

Ds Corsair Set stammt aus der QVL vom Board.Wenn das auch Zickt müsstest du (wenn alle Vorschläge nicht weiter helfen) MSI Kontaktieren.
Wenn die einen Ram sehen der nicht in ihrer QVL steht bekommst du nur die Antwort : Benutzen Sie Ram aus der QVL ... so war es bei mir.Obwohl ich ram hatte der in ihrer QVL stand nur deren Test war mit Samsung Dies und Kingston hatte inzwischen auf Micron umgestellt ... als wenn man auf sowas schaut  :-rolleyes:
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

Anderer Ram ist bestellt. Schwierig da was mit 3600 MHz und CL16 zu finden (ich weiß auch nicht so recht was wichtiger ist). Habe den von dir vorgeschlagenen bestellt.

- Memtest86 läuft jetzt
- Verschraubung vom CPU-Kühler gelockert
- Gear down aktiviert und powerdown deaktiviert
- Stecker der Graikkarte getauscht
- CPU PWR 1+2 Stecker vertauscht
Ja, ich weiß, man sollte nicht mehrere Änderungen auf einmal machen :-)

Andere Rail für die Grafikkarte ist beim Fractal Design R7 Gehäuse leider super umständlich da das Netzteil in einem Kanal sitzt und man an die Stecker schlecht ran kommt. Deshalb nicht gemacht.

Wenn es jetzt noch immer zu Abstürzen kommt warte ich bis Mittwoch bis der andere RAM ankommt.
Danke für den Support!
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

- Memtest86 ohne Fehler durchgelaufen.
- Warte jetzt ab ob die restlichen Änderungen was geholfen haben --> musste nicht lang warten, weiterhin Abstürze

Warte nun auf den anderen RAM.
« Letzte Änderung: 22. November 2020, 18:15:31 von CrispyCrunch »
Gespeichert

amd_man_bavarian

  • DoppelAss
  • *
  • :
  • Offline Offline
  • Beiträge: 118

Ich kann nur empfehlen trotzdem den Support zu kontaktieren.Dein Problem ist kein einzelfall und betrifft auch andere Hersteller (Asus/Gigabyte).
Das Spezielle Problem mit den Idle abstürzen tritt vorrangig bei CPUs mit zwei CCX auf also 5900X und 5950X.
Es empfiehlt sich daher ein Ticket bei MSI und auch bei AMD zu eröffnen.Ich habe den Verdacht das nacharbeitsbedarf bei den Bios ist.

Tut mir leid das ich mit meinen Tips nicht helfen konnte.
Gespeichert

CrispyCrunch

  • Jungspund
  • **
  • :
  • Offline Offline
  • Beiträge: 15

Sobald ich sehe wie es mit einem RAM von der QVL läuft mach ich ein Ticket auf.

Zwischenupdate:
Gestern Abend noch im AMD Forum gelesen CBP und PBO der CPU zu deaktivieren. Mal schauen ob es was ändert. Sind das Mainboard- oder Ryzen-Funktionen?
8h ohne Neustart - Der bislang längste Zeitraum ohne Absturz. CBP oder PBO scheint geholfen zu haben.
« Letzte Änderung: 24. November 2020, 17:31:40 von CrispyCrunch »
Gespeichert