Crash / Blackscreen sur nouvelle config

Jakoubi Messages postés 3 Date d'inscription   Statut Membre Dernière intervention   -  
flo88 Messages postés 28422 Date d'inscription   Statut Contributeur Dernière intervention   -

Bonjour,

Ma copine a récemment changé de GPU en raison de problèmes de surchauffe et d'instabilité sur son précédent.

Elle avait une GTX 1080 qui commençait à dater et est passée sur une RTX 5070.

Elle comptait changer la carte mère et le processeur en fin d'année.

Depuis que la nouvelle carte est installée elle subis régulièrement (3-4 fois par jour) des crash du système (freeze complet de l'écran et de l'audio, et plus rien ne fonctionne jusqu'au reboot forcé).

Nous avons bien entendu soupçonné un problème de compatibilité entre le GPU et les anciens composants mais avant de céder à la facilité nous avons préféré diagnostiquer l'origine du problème pour être sûrs qu'il s'agisse d'un problème matériel.

La config actuelle est la suivante :

  • OS : Windows 10
  • GPU : MSI RTX 5070 Ventus
  • CPU : i7-6700K
  • MB : MSI z170A Gaming Pro Carbon
  • PSU : G750M Cooler Master (750 W)

Nous avons essayé plusieurs solutions qui n'ont pas fonctionné pour le moment :

  • Mise à jour Windows
  • Réinstallation complète des drivers (via DDU en mode sans échec)
  • Installation d'un ancien driver réputé plus stable (572.83)
  • Activation du safe boot suite à une erreur indiquée dans l'observateur d'évènement
  • Mise à jour du BIOS
  • Changement de slot PCI E
  • Changement de la génération PCI E (gen switch) dans le bios (fonctionnalité inexistante sur cette carte mère)
  • Changement du câblage du GPU (anciennement "daisy chained")
  • Réparation des fichiers corrompus via sfc /scannow

Après la mise à jour du BIOS les freezes sont parfois devenus des blackscreens, et l'observateur d'évènement à indiqué le message suivant : L’ordinateur a redémarré après une vérification d’erreur. La vérification d’erreur était : 0x00000116 (0xffff800c48cf2410, 0xfffff801a3d54930, 0xffffffffc000009a, 0x0000000000000004).

Un vidage a été enregistré dans : C:\WINDOWS\Minidump\092525-6812-01.dmp. ID de rapport : 7c0ddb6c-8c41-4582-b051-99353b5dda58.

Deux fichiers dmp ont été générés indiquant un lien avec nvlddmkm.sys, le détail sera posté en fin de message.

J'ai pu constater que deux fichiers nvlddmkm.sys étaient présents dans son dossier System32, je ne sais pas si cela a quoi que ce soit à voir avec notre problème, je n'ai pas vraiment trouvé d'informations à ce sujet.

Parmi les solutions restantes nous avons prévu de tenter :

  • Changer les paramètres de sécurité du nvlddmkm.sys en Contrôle total pour le groupe Utilisateurs (solution souvent mentionnée)
  • Réinitialisation des paramètres d’overclocking via MSI Afterburner
  • Réinstallation complète de Windows

Nous avons pour le moment écarté la possibilité d'un problème d'alimentation, bien que relativement vieille l'alimentation fonctionnait parfaitement jusqu'à présent.

Enfin, voici les rapports d'analyse WinDbg :

*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

VIDEO_TDR_FAILURE (116)
Attempt to reset the display driver and recover from timeout failed.
Arguments:
Arg1: ffffbf067628c010, Optional pointer to internal TDR recovery context (TDR_RECOVERY_CONTEXT).
Arg2: fffff80287e34930, The pointer into responsible device driver module (e.g. owner tag).
Arg3: ffffffffc000009a, Optional error code (NTSTATUS) of the last failed operation.
Arg4: 0000000000000004, Optional internal context dependent data.

Debugging Details:
------------------

Unable to load image nvlddmkm.sys, Win32 error 0n2
*** WARNING: Unable to verify timestamp for nvlddmkm.sys

KEY_VALUES_STRING: 1

    Key  : Analysis.CPU.mSec
    Value: 1609

    Key  : Analysis.Elapsed.mSec
    Value: 7613

    Key  : Analysis.IO.Other.Mb
    Value: 0

    Key  : Analysis.IO.Read.Mb
    Value: 1

    Key  : Analysis.IO.Write.Mb
    Value: 0

    Key  : Analysis.Init.CPU.mSec
    Value: 781

    Key  : Analysis.Init.Elapsed.mSec
    Value: 76356

    Key  : Analysis.Memory.CommitPeak.Mb
    Value: 108

    Key  : Analysis.Version.DbgEng
    Value: 10.0.27920.1001

    Key  : Analysis.Version.Description
    Value: 10.2506.23.01 amd64fre

    Key  : Analysis.Version.Ext
    Value: 1.2506.23.1

    Key  : Bugcheck.Code.LegacyAPI
    Value: 0x116

    Key  : Bugcheck.Code.TargetModel
    Value: 0x116

    Key  : Dump.Attributes.AsUlong
    Value: 0x8

    Key  : Dump.Attributes.KernelGeneratedTriageDump
    Value: 1

    Key  : Failure.Bucket
    Value: 0x116_IMAGE_nvlddmkm.sys

    Key  : Failure.Exception.IP.Address
    Value: 0xfffff80287e34930

    Key  : Failure.Exception.IP.Module
    Value: nvlddmkm

    Key  : Failure.Exception.IP.Offset
    Value: 0x1874930

    Key  : Failure.Hash
    Value: {c89bfe8c-ed39-f658-ef27-f2898997fdbd}

    Key  : WER.System.BIOSRevision
    Value: 5.12.0.0


BUGCHECK_CODE:  116

BUGCHECK_P1: ffffbf067628c010

BUGCHECK_P2: fffff80287e34930

BUGCHECK_P3: ffffffffc000009a

BUGCHECK_P4: 4

FILE_IN_CAB:  092625-5578-01.dmp

DUMP_FILE_ATTRIBUTES: 0x8
  Kernel Generated Triage Dump

FAULTING_THREAD:  ffffbf067ad2c040

VIDEO_TDR_CONTEXT: dt dxgkrnl!_TDR_RECOVERY_CONTEXT ffffbf067628c010
Symbol dxgkrnl!_TDR_RECOVERY_CONTEXT not found.

PROCESS_OBJECT: 0000000000000004

BLACKBOXBSD: 1 (!blackboxbsd)


BLACKBOXNTFS: 1 (!blackboxntfs)


BLACKBOXPNP: 1 (!blackboxpnp)


BLACKBOXWINLOGON: 1 (!blackboxwinlogon)


CUSTOMER_CRASH_COUNT:  1

PROCESS_NAME:  System

STACK_TEXT:  
ffffad0d`aa58f918 fffff802`6d2d6efe     : 00000000`00000116 ffffbf06`7628c010 fffff802`87e34930 ffffffff`c000009a : nt!KeBugCheckEx
ffffad0d`aa58f920 fffff802`6d287474     : fffff802`87e34930 ffffbf06`78cca660 00000000`00002000 ffffbf06`78cca720 : dxgkrnl!TdrBugcheckOnTimeout+0xfe
ffffad0d`aa58f960 fffff802`6d27ffac     : ffffbf06`78ce0000 00000000`01000000 00000000`00000004 00000000`00000004 : dxgkrnl!ADAPTER_RENDER::Reset+0x174
ffffad0d`aa58f990 fffff802`6d2d6625     : 00000000`00000100 ffffbf06`78ce0a70 00000000`763f81f0 fffff802`585083fc : dxgkrnl!DXGADAPTER::Reset+0x4dc
ffffad0d`aa58fa10 fffff802`6d2d6797     : fffff802`58f25440 ffffbf06`7c6ca290 00000000`00000000 00000000`00000400 : dxgkrnl!TdrResetFromTimeout+0x15
ffffad0d`aa58fa40 fffff802`584418f5     : ffffbf06`7ad2c040 fffff802`6d2d6770 ffffbf06`70eb49a0 ffffbf06`00000000 : dxgkrnl!TdrResetFromTimeoutWorkItem+0x27
ffffad0d`aa58fa70 fffff802`5855d6e5     : ffffbf06`7ad2c040 00000000`00000080 ffffbf06`70eba080 00000000`00000000 : nt!ExpWorkerThread+0x105
ffffad0d`aa58fb10 fffff802`58606578     : ffffd280`92be5180 ffffbf06`7ad2c040 fffff802`5855d690 00000000`00000246 : nt!PspSystemThreadStartup+0x55
ffffad0d`aa58fb60 00000000`00000000     : ffffad0d`aa590000 ffffad0d`aa589000 00000000`00000000 00000000`00000000 : nt!KiStartSystemThread+0x28


SYMBOL_NAME:  nvlddmkm+1874930

MODULE_NAME: nvlddmkm

IMAGE_NAME:  nvlddmkm.sys

STACK_COMMAND: .process /r /p 0xffffbf0670eba080; .thread 0xffffbf067ad2c040 ; kb

FAILURE_BUCKET_ID:  0x116_IMAGE_nvlddmkm.sys

OSPLATFORM_TYPE:  x64

OSNAME:  Windows 10

FAILURE_ID_HASH:  {c89bfe8c-ed39-f658-ef27-f2898997fdbd}

Followup:     MachineOwner

*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

VIDEO_TDR_FAILURE (116)
Attempt to reset the display driver and recover from timeout failed.
Arguments:
Arg1: ffff800c48cf2410, Optional pointer to internal TDR recovery context (TDR_RECOVERY_CONTEXT).
Arg2: fffff801a3d54930, The pointer into responsible device driver module (e.g. owner tag).
Arg3: ffffffffc000009a, Optional error code (NTSTATUS) of the last failed operation.
Arg4: 0000000000000004, Optional internal context dependent data.

Debugging Details:
------------------

Unable to load image nvlddmkm.sys, Win32 error 0n2
*** WARNING: Unable to verify timestamp for nvlddmkm.sys

KEY_VALUES_STRING: 1

    Key  : Analysis.CPU.mSec
    Value: 1828

    Key  : Analysis.Elapsed.mSec
    Value: 26118

    Key  : Analysis.IO.Other.Mb
    Value: 1

    Key  : Analysis.IO.Read.Mb
    Value: 1

    Key  : Analysis.IO.Write.Mb
    Value: 39

    Key  : Analysis.Init.CPU.mSec
    Value: 2156

    Key  : Analysis.Init.Elapsed.mSec
    Value: 455173

    Key  : Analysis.Memory.CommitPeak.Mb
    Value: 101

    Key  : Analysis.Version.DbgEng
    Value: 10.0.27920.1001

    Key  : Analysis.Version.Description
    Value: 10.2506.23.01 amd64fre

    Key  : Analysis.Version.Ext
    Value: 1.2506.23.1

    Key  : Bugcheck.Code.LegacyAPI
    Value: 0x116

    Key  : Bugcheck.Code.TargetModel
    Value: 0x116

    Key  : Dump.Attributes.AsUlong
    Value: 0x8

    Key  : Dump.Attributes.KernelGeneratedTriageDump
    Value: 1

    Key  : Failure.Bucket
    Value: 0x116_IMAGE_nvlddmkm.sys

    Key  : Failure.Exception.IP.Address
    Value: 0xfffff801a3d54930

    Key  : Failure.Exception.IP.Module
    Value: nvlddmkm

    Key  : Failure.Exception.IP.Offset
    Value: 0x1874930

    Key  : Failure.Hash
    Value: {c89bfe8c-ed39-f658-ef27-f2898997fdbd}

    Key  : WER.System.BIOSRevision
    Value: 5.12.0.0


BUGCHECK_CODE:  116

BUGCHECK_P1: ffff800c48cf2410

BUGCHECK_P2: fffff801a3d54930

BUGCHECK_P3: ffffffffc000009a

BUGCHECK_P4: 4

FILE_IN_CAB:  092525-6812-01.dmp

DUMP_FILE_ATTRIBUTES: 0x8
  Kernel Generated Triage Dump

FAULTING_THREAD:  ffff800c43991040

VIDEO_TDR_CONTEXT: dt dxgkrnl!_TDR_RECOVERY_CONTEXT ffff800c48cf2410
Symbol dxgkrnl!_TDR_RECOVERY_CONTEXT not found.

PROCESS_OBJECT: 0000000000000004

BLACKBOXBSD: 1 (!blackboxbsd)


BLACKBOXNTFS: 1 (!blackboxntfs)


BLACKBOXPNP: 1 (!blackboxpnp)


BLACKBOXWINLOGON: 1 (!blackboxwinlogon)


CUSTOMER_CRASH_COUNT:  1

PROCESS_NAME:  System

STACK_TEXT:  
ffffd68d`4c677918 fffff801`88116efe     : 00000000`00000116 ffff800c`48cf2410 fffff801`a3d54930 ffffffff`c000009a : nt!KeBugCheckEx
ffffd68d`4c677920 fffff801`880c7474     : fffff801`a3d54930 ffff800c`3b1ea720 00000000`00002000 ffff800c`3b1ea7e0 : dxgkrnl!TdrBugcheckOnTimeout+0xfe
ffffd68d`4c677960 fffff801`880bffac     : ffff800c`3b1c9000 00000000`01000000 00000000`00000004 00000000`00000004 : dxgkrnl!ADAPTER_RENDER::Reset+0x174
ffffd68d`4c677990 fffff801`88116625     : 00000000`00000100 ffff800c`3b1c9a70 00000000`3bcc86d0 fffff801`717083fc : dxgkrnl!DXGADAPTER::Reset+0x4dc
ffffd68d`4c677a10 fffff801`88116797     : fffff801`72125440 ffff800c`3e8602d0 00000000`00000000 00000000`00000200 : dxgkrnl!TdrResetFromTimeout+0x15
ffffd68d`4c677a40 fffff801`716418f5     : ffff800c`43991040 fffff801`88116770 ffff800c`32b02a60 ffff800c`00000000 : dxgkrnl!TdrResetFromTimeoutWorkItem+0x27
ffffd68d`4c677a70 fffff801`7175d6e5     : ffff800c`43991040 00000000`00000080 ffff800c`32aaf040 00000000`00000000 : nt!ExpWorkerThread+0x105
ffffd68d`4c677b10 fffff801`71806578     : ffff9701`16da3180 ffff800c`43991040 fffff801`7175d690 00000000`00000001 : nt!PspSystemThreadStartup+0x55
ffffd68d`4c677b60 00000000`00000000     : ffffd68d`4c678000 ffffd68d`4c671000 00000000`00000000 00000000`00000000 : nt!KiStartSystemThread+0x28


SYMBOL_NAME:  nvlddmkm+1874930

MODULE_NAME: nvlddmkm

IMAGE_NAME:  nvlddmkm.sys

STACK_COMMAND: .process /r /p 0xffff800c32aaf040; .thread 0xffff800c43991040 ; kb

FAILURE_BUCKET_ID:  0x116_IMAGE_nvlddmkm.sys

OSPLATFORM_TYPE:  x64

OSNAME:  Windows 10

FAILURE_ID_HASH:  {c89bfe8c-ed39-f658-ef27-f2898997fdbd}

Followup:     MachineOwner

Windows / Edge 140.0.0.0

A voir également:

1 réponse

flo88 Messages postés 28422 Date d'inscription   Statut Contributeur Dernière intervention   Ambassadeur 5 007
 

Bjr

Les RTX 5070 ne réclame pas spécialement une alim plus puissante que pour une gtx 1080, néanmoins elles consomment beaucoup plus de puissance sur le port pciexpress car ceux des cartes mères actuelles en delivre plus suite à des modifications de la norme pciexpress 16 dédiée au carte graphique. 

Vu l'ancienneté de ta carte mère,  c'est fort probable que 5070 mette à plat la tension sur sur le bus. Pour moi il n'y a pas de solution. Le problème est connu.

0