WHEA_UNCORRECTABLE_ERROR bei neuem Computer - Mindfactory Forum

Ankündigung

Einklappen
Keine Ankündigung bisher.

WHEA_UNCORRECTABLE_ERROR bei neuem Computer

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • WHEA_UNCORRECTABLE_ERROR bei neuem Computer

    Hallo,
    ich bin so verzweifelt, dass ich jetzt sogar ins Forum schreibe.
    Das ist erst mein zweiter Computer, den ich zusammenschraube. Seid also bitte gnädig. Beim Ersten (wo auch viele Komponenten von Mindfactory kamen) funktionierte damals alles reibungslos.

    Aber zuerst mal die Hardware des Computers:
    Komponente Modell Anbieter
    01 CPU AMD Ryzen 9 5900X Mindfactory
    02 CPU Kühler be quiet! Dark Rock Pro 4 Mindfactory
    03 Mainboard ASUS ROG Strix X570-E Gaming
    04 RAM 32GB (2x 16384MB) G.Skill RipJaws V schwarz DDR4-3600 DIMM CL16-19-19-39 Dual Kit Mindfactory
    05 m.2 SSD Samsung 980 PRO 2 TB Mindfactory
    06 OS
    m.2 SSD
    Samsung 980 PRO 250 GB Mindfactory
    07 Gehäuse be quiet! Dark Base Pro 900 Rev. 2 Mindfactory
    08 Netzteil 1200 Watt be quiet! Dark Power Pro 12 Modular Mindfactory
    09 optisches Laufwerk LG Electronics Blu-ray/DVD±RW BH16NS40 Mindfactory
    10 GPU ZOTAC GeForce RTX 3090 Trinity OC privat
    11 HDD Western digital 3 TB, die auch im alten Rechner schon verbaut war
    Die Mindfactory Komponenten wurden am 17.06.2021 bestellt (Vorgangsnummer: 8087983, Rechnungsnummer: 9869608) und waren bereits am 18.06.2021 da.
    Am Abend begann ich mit dem Zusammenbau und auch am 19.06.2021 baute ich noch.
    Am 20.06.2021 installierte ich Windows und alle Programme, die ich so brauche.

    Als ich den neuen Rechner mit den ersten Spielen stressgetestet habe, bekam ich den "WHEA_UNCORRECTABLE_ERROR."
    Erst trat der Fehler beim Benchmark von GTA V auf. (Später seltsamerweise nicht mehr.)
    Dann nach einer Trainingsmission in Hunt Showdown, auch nach einem Match bei Battlefield 4 oder nach einem Raid bei Escape from Tarkov.

    Zunächst dachte ich, ich hätte beim Zusammenbau einen Fehler gemacht.
    Bei einem der vielen Male, wo ich die Komponenten demontiert und kontrolliert habe, sah ich, dass ich wohl zu viel Wärmeleitpaste benutzt habe und die auf die OS Festplatte getropft ist…
    Na gut, Lehrgeld, das bezahlt werden musste.
    Also neue Festplatte gekauft, die Wärmeleitpaste mit Isopropanol entfernt und Neue aufgetragen (diesmal natürlich weniger).
    Leider brachte das keine Besserung.

    Auch Memtest lief anstandslos über Nacht durch und CMOS Resets brachten leider keine Besserung.
    Die neuste BIOS Version inklusive der neusten Mainboard Treiber sind installiert.
    Leider funktionierten ebenfalls die im Netz beschriebenen "Fehlerbehebungsmethoden" nicht.
    Selbst in einem Skype Gespräch hatte ich 2 Abstürze.
    Seltsamerweise ist es kein Problem, wenn ich nur Youtube oder Netflix etc. über den Browser gucke. Aber sobald ich noch was anderes mache, habe ich Probleme.

    Am 30.06.2021 hatte ich einen Stresstest bei CPU-Z gemacht und habe den nach ca. 45 Minuten gestoppt.
    Als ich danach Firefox öffnete, startete sich der Rechner ohne Fehlermeldung oder Bluescreen neu.

    Ich nahm also an, dass der Prozessor zu den fehlerhaften Prozessoren gehörte, von denen auch im Netz berichtet wird und habe den somit reklamiert.
    Dank Mindfactory funktionierte die Reklamation ohne Probleme und ich bekam meinen neuen Prozessor am 08.07.2021.
    Nach dem Einbau am selben Tag spielte ich ca. 3h Battlefield 4 und auch am darauf folgenden Tag schien alles zu funktionieren wie es sollte.
    Bis ich gestern, am 11.07.2021, wieder 2 Bluescreens mit dem WHEA-Fehler hatte.

    (Fehler ID + Quelle aus der Ereignisanzeige, sowie einen Screenshot der Bluescreen Dumpfile, ausgelesen mit Bluescreenview liefere ich nach.)

    Ich bin mit meinem Latein und den Nerven am Ende und hoffe, dass mir hier jemand helfen kann.

    Mit freundlichen Grüßen
    Rnjäh!
    Zuletzt geändert von Rnjäh!; 20.07.2021, 11:32.

  • #2
    RAM runter takten, z.B. auf 3200...
    Grafikkarte gegen eine andere tauschen und testen oder auf runter takten (z.B. mit MSI-Tool)...
    Gruß Mav
    Spoiler

    Kommentar


    • #3
      Danke schonmal Maverick64 für deine Hilfe. Ich probiere deine Tipps aus, wenn ich wieder blau sehe.

      Wie angekündigt hier der Vorgang vor dem letzten Bluescreen, der eigentliche Fehler und der letzte Bluescreen:

      Du hast keine Berechtigung diese Galerie anzusehen.
      Diese Galerie hat 3 Bilder
      Zuletzt geändert von Rnjäh!; 12.07.2021, 17:16.

      Kommentar


      • #4
        Okay, gerade wieder einen Bluescreen gehabt. Die Eigenschaften des Bluescreens findet ihr unten im Screenshot.

        Ich hatte die ganze Woche über keinerlei Probleme.
        (Obwohl, das Problem mit dem Dienst "GalaxyClientService," der unerwartet beendet wurde, weiterhin besteht. (Der Dienst kommt wohl von GOG Galaxy))

        Das Einzige, was ich am Wochenende anders mache, als unter der Woche ist, dass ich den PC nur in den Energie spar Modus versetze und nicht komplett herunterfahre.

        Dann will ich mal den RAM runtertakten und gucke dann weiter... hmpf... ich hoffte es hätte sich erledigt.

        Bluescreen 20210718.PNG
        Angehängte Dateien
        Zuletzt geändert von Rnjäh!; 19.07.2021, 17:57.

        Kommentar


        • #5
          Ich hatte gerade wieder den WHEA Bluescreen.
          Ich schreibe mal die Maßnahmen auf, die ich seit dem ersten Zusammenbau bereits durchgeführt habe (bin mir aber nicht sicher, ob die Liste vollständig sein wird):

          - tägliches checken nach neuen Windowsupdates, Mainboard Treibern und BIOS Versionen

          - haptisches Checken der Stecker

          - visuelles Checken der Hardware

          - OS Festplatte getauscht (Wärmeleitpaste draufgetropft)

          - Wärmeleitpaste erneuert

          - im cmd Befehle sfc scannow & chkdsk /f /r

          - RAM mit Memtest gecheckt

          - Zwischendurch immer wieder CMOS Resets (aber dann wieder Cha_fan2 auf PWM, RAM auf DOCP und ErP auf Enable(S4+S5)

          - Mit Crystal Disk Info die Festplattentemperaturen gecheckt

          - RAM auf Standardtakt (2133 MHz)

          - CPU Stability Test 6.0 (Build: 154) normalen Test ausprobiert. (Zeigt an: " Error message received from module TPrime Error: Exception, Fatal: Yes, End of Message"

          - 45 Minuten CPU Stresstest mit CPU-Z danach Firefox geöffnet -> PC startet einfach neu

          - CPU getauscht (RMA)

          - Default Einstellungen im BIOS geladen & Qfan automatische Optimierung durchgeführt. Danach alle Lüfter auf DC gestellt (nichts war mehr auf PWM)

          - ErP deaktiviert

          - Nochmals im cmd Befehle sfc scannow & chkdsk /f /r & dism /online /cleanup-image /restorehealth

          - RAM Riegel nochmal einzeln mit Memtest gecheckt

          - 4 Pin CPU Stromkabel zusätzlich zum 8 Pin Kabel eingebaut
          (Beim ersten Zusammenbau war ich mir nicht sicher, ob ich den brauche und habe das Handbuch des Mainboards fehlinterpretiert.
          Um sicher zu gehen, ob der Stecker nicht doch gebraucht wird, hatte ich gegooglet und in Foren gefunden, dass der Stecker nur gebraucht wird, wenn schwer overclocked wird.
          Deswegen hatte ich den Stecker erst nicht dran. Letzten Freitag dachte ich, dass es vllt von Vorteil wäre, den Stecker doch zu nutzen.
          Meine tiefergehende Recherche im Nachhinein ergab auch, dass der Ryzen 5900x im Spielbetrieb gerne mehr Strom als die 336 Watt des einzelnen 8 Pin Steckers hat.)

          - Erneuter Versuch CPU Stability Test 6.0 (Build: 154) normalen Test ausprobiert. (Zeigt an: " Error message received from module TPrime Error: Exception, Fatal: Yes, End of Message"



          Die einzigen Einstellungen im BIOS sind Cha_fan2 auf PWM, RAM auf DOCP und ErP auf Enable(S4+S5)

          Samstag spielte ich einen längeren Zeitraum und hatte schon Hoffnung, vorgestern spielte ich ca. 1,5h. Resident Evil VII und danach ca. 2,5h Battlefield 4.

          Ich dachte also, es hätte sich gegessen.

          Doch dann jetzt nach ca. 40 Minuten Resident Evil VII hatte ich wieder den WHEA Bluescreen.

          Ist dem CPU vielleicht nicht bekommen, dass ich ihm anfangs zu wenig Strom geliefert habe?

          Kommentar


          • #6
            Hallo, da bin ich wieder und ich wollte mal einen Zwischenstand geben, was in der Zwischenzeit so passiert ist.
            Das Problem ist, dass ich momentan beruflich sehr eingespannt bin, was meine seltenen Posts in letzter Zeit erklärt.



            Was ich mittlerweile gelernt habe:
            1. Meine Annahme, dass die CPU zu wenig Strom bekommt ist Blödsinn gewesen. Habe das Kabel aber dran gelassen, schadet ja nicht.
            2. Der RAM, den ich gekauft habe (G.Skill RipJaws V schwarz DIMM Kit 32GB, DDR4-3600, CL16-19-19-39 (F4-3600C16D-32GVKC)), steht weder beim Mainboardhersteller, noch beim CPU Hersteller auf der QVL (Qualified Vendor List) (Das MUSS nichts heißen, kann aber auf eine Inkompatibilität hindeuten, soweit ich informiert bin.)
            3. Das einfache Anklicken des DOCP-Profils und übernehmen der aus dem RAM ausgelesenen Werte ist bereits übertakten.
            4. Mein technisches Wissen über PC Komponenten, deren Verwendung und das Einstellen der passenden Parameter ist nicht so gut, wie gedacht. Eher ausbaufähig...
            Grundsätzlich dürft ihr mich bitte berichtigen, wenn ich mit meinen Annahmen falsch liege.

            Am 27.07. dachte ich es sei ein Vorteil ein Protokoll zu führen wann welche Maßnahmen durchgeführt wurden um Auswirkungen an die Änderung zu knüpfen.

            Hier also meine Aufzeichnungen aus dem Protokoll:
            Anfangs dachte ich noch, dass entweder "Energie-sparen" oder der "Ruhemodus" für die WHEAs verantwortlich sind.

            + Kein Energie sparen oder Ruhemodus mehr, nur noch sauberes Herunterfahren
            - 17 min Resident Evil VII -> OK (nach ordentlichem herunterfahren)
            - 28.07. RE VII ca. 1h15min -> OK (nach ordentlichem Herunterfahren)
            - 30.07. RE VII ca. 13min -> OK (nach ordentlichem Herunterfahren)
            - 02.08. Battlefield 4 + Youtube ca. 1h02min -> WHEA (nach ordentlichem Herunterfahren)

            Die RAM Frequenzen wurden oben ja schonmal genannt und ein Kollege riet mir Benchmarks über Nacht laufen zu lassen, wenn die Zeit zum ausprobieren fehlt.

            + 02.08. RAM auf 2666 MHz runtertakten (Mit DOCP Timings und Spannung)
            - 03.08. Battlefield 4 ca. 1h35min -> OK (Auffällig, weil voriger Bootzyklus GPU nur bei Youtube 100% Auslastung hatte)
            - 04.08. Battlefield 4 ca. 1h35min -> OK (nach ordentlichem Herunterfahren)
            - 10.08. AIDA64 EXTREME Stability Test alle Haken an ca. 3h -> OK
            - 3DMark Timespy Extreme Benchmark Loop ca. 8h40min -> OK
            - 11.08. 3DMark Timespy Extreme Benchmark Loop ca. 8h40min-> OK

            + 12.08. RAM wieder auf 3600 MHz hochtakten (mit DOCP Timings und Spannung)
            - 3DMark Timespy Extreme Benchmark Loop ca. 8h40min -> OK
            - 14.08. 3DMark Timespy Extreme Benchmark borderless window Loop nach weniger als 3,3h -> PC freeze (ohne Bluescreen) mit Grafikfehler (Lüfter der GPU standen)

            + 14.08. RAM auf 2666 MHz runtertakten (Mit DOCP Timings und Spannung)
            - 15.08. 3DMark Timespy Extreme Benchmark borderless window Loop ca. 8h20min -> OK
            - 15.08 AIDA64 EXTREME Stability Test nur GPU ca. 8h30min -> OK
            - 15.08 AIDA64 EXTREME Stability Test nur CPU ca. 9h20min -> OK
            - 17.08. Battlefield 4 + Youtube ca. 2h19min -> OK
            - AIDA64 EXTREME Stability Test nur System Memory ca. 9h34min -> OK
            - 18.08. AIDA64 EXTREME Stability Test alle Haken an ca. 8h23min -> OK

            + 19.08. RAM wieder auf 3600 MHz hochtakten (mit DOCP Timings und Spannung)
            - AIDA64 EXTREME Stability Test nur System Memory ca. 8h30min -> OK
            - 20.08. Battlefield 4 + Youtube ca. 1h50min -> OK
            - 21.08. (nach Gaming Session) AIDA64 EXTREME Stability Test alle Haken an ca. 30min -> Warning: Hardware Failure detected! Test stopped
            - 21.08. AIDA64 EXTREME Stability Test alle Haken an ca. 1h10min -> Warning: Hardware Failure detected! Test stopped

            + 21.08. RAM auf 3466 MHz runtertakten (Mit DOCP Timings und Spannung)
            - 21.08. AIDA64 EXTREME Stability Test alle Haken an ca. 5h28min -> OK

            + 21.08. RAM auf 3533 MHz hochtakten (Mit DOCP Timings und Spannung)
            - 21.08. AIDA64 EXTREME Stability Test alle Haken an ca. 8h19min keine Fehlermeldung. Beim Stoppen des Tests -> WHEA

            + 22.08. RAM auf 3466 MHz runtertakten (Mit DOCP Timings und Spannung)
            - AIDA64 EXTREME Stability Test alle Haken an ca. 9h6min -> OK
            - 23.08. 3DMark Timespy Extreme Benchmark borderless window Loop ca. 8h07min -> OK
            - 24.08. 3DMark Timespy Extreme Benchmark borderless window -> OK
            - 3DMark Timespy Extreme Stress Test -> OK
            - 3DMark Timespy Extreme Benchmark -> OK
            - 25.08. 3DMark Timespy Benchmark borderless window -> OK
            - 3DMark Timespy Stress Test -> OK
            - 3DMark Timespy Benchmark -> OK

            - 26.08. Installieren von BIOS Version 4021

            + 29.08. RAM war auf 2133 MHz, ohne DOCP Timings runtergetaktet (Nicht selbst umgestellt. Wahrscheinlich durch BIOS Update)
            - Splitgate ca. 2h28min -> OK

            + 29.08. RAM auf 3466 MHz hochtakten (Mit DOCP Timings und Spannung)
            - Splitgate ca. 28min -> OK
            - 01.09. Grafikfehler nach dem Einschalten beim Öffnen von Firefox. Dann Ausfall aller Monitore. (Nach Neustart -> OK)
            - Splitgate ca. 43min -> OK
            - 03.09. Splitgate ca. 1h45min -> OK
            - 04.09. Splitgate ca. 1h04min -> OK
            - Resident Evil VII ca. 8min -> WHEA

            + DOCP abgeschaltet (Ai Overclock Tuner auf Auto)
            - Splitgate ca. 36min -> OK
            - 05.09. Splitgate ca. 2h22min -> OK

            Nächste Schritte:
            1. Versuchen den WHEA Bluescreen mit abgeschaltetem DOCP zu reproduzieren. (Wenn das nicht klappt wird es am RAM liegen)
            2. Manuelles Einstellen der RAM Angaben (3600 MHz CL16-19-19-39 1,35 V) ohne DOCP zu aktivieren
            Ich denke aber auch darüber nach neuen RAM zu kaufen, da ich mich schon seit geraumer Zeit damit rumärgere...
            Ich will doch eigentlich nur den RAM auf den angegebenen Parametern zum Laufen kriegen. Oder wenigstens annähernd...

            Danke an alle, die bis hierhin gelesen haben.

            Mit freundlichen Grüßen
            Rnjäh!

            Kommentar


            • #7
              Ich will doch eigentlich nur den RAM auf den angegebenen Parametern zum Laufen kriegen. Oder wenigstens annähernd...
              und das ist jedesmal der fehler. der user wird mit sachen geködert, von denen er meint, das wäre alles so easy. ist es aber nicht, dank der ganzen parameter und diversesten kombinationsmöglichkeiten. wenn du ein setting gefunden hast, das stabil läuft und wenn das auch "nur" 3200er wäre, dann nimm das und vergiss den quatsch mit neukauf...damit kannst du genauso die gleichen probleme haben oder eben auch nicht, als sinnvoll erachte ich das allerdings nicht.

              ich kaufe schon einige jahre immer den ram mit takt x und lass den generell mit x-y laufen. spart meistens einiges an konfigarbeit, da solche auto-profile ala xmp auch keine eierlegenden wollmichsäue sind, zumindest nicht immer und meist braucht man auch nicht an den spannungen rumfummeln, mit was man sich früher, als man noch viel mehr zeit hatte, die tage vertrieben hat, um den ram stabil ans laufen zu bekommen. der ganze aufwand ist es mir aber nicht mehr wert, da der gewinn davon so winzig ist, dass man ihn meist gerade so überhaupt ermitteln kann. spürbar ist da gar nix...

              3466 scheint es ja fast schon zu sein, geh einfach stufenweise weiter runter und teste entsprechend auf herz und nieren und freu dich dann über deine stabile kiste, fertig
              Mit freundlichen Grüßen
              Ihr Moderatorenteam


              Kontakt: Kundenbetreuung | Logistik | Reklamation | Technik | Service Level Gold | Infocenter | Highlights

              Sent from my fingers using my brain, both arms and my keyboard und NEIN, ich will nicht wissen, was irgendwer zum posten nutzt! solche msg darf man gern deaktivieren, danke!
              ...und nein, ich bin kein Mitarbeiter der Mindfactory AG!

              Kommentar


              • #8
                Danke Black & White für den Mutzuspruch und das Abraten vom Neukauf.
                Beim nächsten Aufrüsten, was hoffentlich noch eine Zeit dauern wird, werde ich auf jeden Fall an diese Eskapade zurückdenken und hoffentlich daraus gelernt haben.

                Dann werde ich wohl nach dem Testen mit abgeschaltetem DOCP demnächst die Stufen unter 3466 MHz testen. Auch 3200 MHz fände ich noch okay. Die 11% "Leistungsverlust" nehme ich zugunsten der Stabilität gerne in Kauf. Trotzdem reizt es mich ein wenig das "beste" aus dem RAM zu kriegen.

                Ich habe mich so ein bisschen in das ganze RAM Overclock Thema eingelesen. Das ist mir tatsächlich viel zu zeitintensiv. Ich hätte auch nicht erwartet, dass das so kompliziert ist, wie es sich herausstellt.

                The more you know.

                Was ist eigentlich ein gutes Programm um RAM auf Stabilität zu testen?
                Ich hatte ja bei 3466 MHz weder beim 3D Mark noch bei AIDA 64 Probleme und trotzdem bei RE VII nen WHEA.

                regards
                Rnjäh!

                Kommentar


                • #9
                  Die 11% "Leistungsverlust"
                  taktverlust, kein leistungsverlust in dieser höhe! das ist ein unterschied

                  Was ist eigentlich ein gutes Programm um RAM auf Stabilität zu testen?
                  Ich hatte ja bei 3466 MHz weder beim 3D Mark noch bei AIDA 64 Probleme und trotzdem bei RE VII nen WHEA.
                  ich setze seit jahren eigentlich auch weiterhin auf goldmemory und seltenst auch auf memtest86+. erst nach bestandenen tests damit (bei mir bei goldmem über 8h dauertest, bei memtest mehr als 24h), sollte man unter windows mit prime95 weiterarbeiten, logischerweise auch da eher länger als kürzer (24h stresstest mit den entsprechenden settings)

                  das tools unter windows nicht den gesamten ram testen können, sollte ja jedem klar sein, daher sind tests mit windows-tools oftmals auch so schwankend in den ergebnissen und sollten gegengeprüft werden, eben zb mit tools ohne os
                  Mit freundlichen Grüßen
                  Ihr Moderatorenteam


                  Kontakt: Kundenbetreuung | Logistik | Reklamation | Technik | Service Level Gold | Infocenter | Highlights

                  Sent from my fingers using my brain, both arms and my keyboard und NEIN, ich will nicht wissen, was irgendwer zum posten nutzt! solche msg darf man gern deaktivieren, danke!
                  ...und nein, ich bin kein Mitarbeiter der Mindfactory AG!

                  Kommentar


                  • #10
                    Dann werde ich mir mal Goldmemory und Prime95 angucken.
                    Danke nochmal dafür.

                    Hoffentlich stellt sich am Ende nicht raus, dass zusätzlich doch noch was mit der GPU is. Das wäre wirklich worst case.
                    (weshalb die pessimistische Seite in mir das schon fast vermutet)

                    regards
                    Rnjäh!

                    Kommentar

                    Lädt...
                    X