2020. január 5., vasárnap

Ryzen 3 1200 random újraindulás...

Sziasztok!

Szégyen, nem szégyen, régen írtam bármit is, de a mai esetet el akarom menteni, hogy nyoma maradjon az interneten..

Adott az asztali gépem:

ALAPLAP: MSI B320M BAZOOKA
PROCI: AMD Ryzen 3 1200
RAM: 2xCorsair CMK8GX4M2A2400C14 4096MB DIMM DDR4
SSD: Kingston SUV400S37120G 120GB

A gépen a gyári BIOS van, nem frissítettem, mivel ment vele a Manjaro eleinte..
Már új korában is produkált néha random újraindulást, de ezt betudtam az akkor még friss AMD grafikus vezérlőnek, soha nem is jártam utána/nem érdekelt, mivel nagyon ritkán jött elő a probléma.

Volt egy év, amikor alig használtam, mivel nem tartózkodtam az országban, így szinte nem is foglalkoztam vele. Azóta újra beröffentettem és saját kis Arch konfigomat szeretném rajta kikísérletezni, afféle homokozós gép lett.

A napokban már kétszer tapasztaltam a random újraindulást, ezért elérkezett az idő, hogy utánajárjak. A dolog érdekessége, hogy terheléstöl teljesen független a történet. Tehát volt olyan, hogy több alkalmazás, háttérben Borderlands2 futott nyugalomban, nem történt semmi. De volt olyan is, hogy boot után csak megnyitottam a Discordot és már indult is újra a masina. A gép elmúlt már 2 éves bőven..
Az AMD-microcode is frissült azóta jó párszor.. Emlékeim szerint még 412-es kernel ment a Manjaro-n amikor összeraktam.. Most Arch van rajta, 5.4.7-arch1-1-kernellel, tehát már nagyon régóta gond ez.. Utánanéztem a neten, hátha találok valami megoldást.

Mivel én csak egy autodidakta felhasználó vagyok, a logokból azt tudtam kideríteni, hogy a CPU fut valami olyasmire, amit nem tud végrehajtani.

log output:

11:47:49 kernel: mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1578221265 SOCKET 0 APIC 9 microcode 8001126
11:47:49 kernel: mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1578221265 SOCKET 0 APIC 9 microcode 8001126
11:47:49 kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffff954d07ac MISC d012000101000000 SYND 4d000000 IPID 500b000000000
11:47:49 kernel: mce: [Hardware Error]: CPU 3: Machine Check: 0 Bank 5: bea0000000000108
11:47:49 kernel: mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1578221265 SOCKET 0 APIC 0 microcode 8001126
11:47:49 kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffff954d494e MISC d012000101000000 SYND 4d000000 IPID 500b000000000
11:47:49 kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 5: bea0000000000108

Keresgélve a neten ezt találtam:


Mivel itt azt olvastam, hogy más is belefutott ebbe már nagyon régen, gondoltam hátha majd Discordon segít valaki.
Előre mondom én még sosem csesztettem a kernelt, mivel ahhoz még nagyon lámer vagyok. Segítségemre sietett @Alexc és közölte velem, hogy egy kernelmodul megoldhatja, amit nekem kell belökni..

Így hát létrehoztam egy fájlt, ami bootkor végrehajtásra kerül:

az /etc/modules-load.d/amd_mce.conf -útvonalon, bele pedig ezt írtam:

# Load AMD MCE on boot
edac_mce_amd

Majd újraindítottam és néztem egy dmesg-t..

dmesg >$HOME/dmesg_2020_01_05.txt

Ahol a 897-edik sorban meg is jelent szépen a megnyugtató visszajelzés:



Nos, remélhetőleg ez megoldotta a problémát..
Ezúton is köszönöm még egyszer @Alexc -nek a segítséget!
Ha más is belefutott volna ebbe, remélem segített ez a blogbejegyzés!

Nincsenek megjegyzések:

Megjegyzés küldése