前言
介绍安装和使用磁盘监控工具smartmontools,以Mac为例。
smartmontools软件包包含两个实用程序(smartctl
和 smartd
),使用内置在大多数现代 ATA/SATA、SCSI/SAS 和 NVMe 磁盘中的自我监控、分析和报告技术系统 (SMART) 来控制和监控存储系统。在许多情况下,这些工具将提供磁盘降级和故障的高级警告。 Smartmontools 最初源自 Linux smartsuite 包,实际上支持 ATA/SATA、SCSI/SAS 和 NVMe 磁盘以及 SCSI/SAS 磁带设备。它应该可以在任何现代 Linux、FreeBSD、NetBSD、OpenBSD、Darwin (macOS)、Solaris、Windows、Cygwin、OS/2、eComStation 或 QNX 系统上运行。 Smartmontools 也可以从许多不同的 Live CD/DVD 之一运行。
安装
brew install smartmontools
检查硬盘
方式一(通用):
1、打开磁盘工具,找到设备名,如disk3s1s1
2、smartctl -a disk3s3s1
方式二(仅内置):smartctl -a disk0
参数解析
ID1:Critical Warning警告状态
RAW数值显示0为正常无警告,1为过热警告,2为闪存介质引起的内部错误导致可靠性降级,3为闪存进入只读状态,4为增强型断电保护功能失效(只针对有该特性的固态硬盘)。
正常情况下ID1的RAW属性值应为0,当显示为1时代表NVMe固态硬盘已经过热,需要改善散热条件或降低工作负载。属性值为2时应考虑返修或更换新硬盘,当属性值为3时硬盘已经进入只读状态,无法正常工作,应抓紧时间备份其中的数据。家用固态硬盘通常不会配备增强型断电保护(完整断电保护),所以通常该项目不会显示为4。
ID2:Temperature当前温度(十进制显示)
ID3:Available Spare可用冗余空间(百分比显示)
指示当前固态硬盘可用于替换坏块的保留备用块占出厂备用块总数量的百分比。该数值从出厂时的100%随使用过程降低,直至到零。ID3归零之前就有可能产生不可预料的故障,所以不要等到该项目彻底归零才考虑更换新硬盘。
ID4:Available Spare Threshold备用空间阈值
与ID3相关,当ID3的数值低于ID4所定义的阈值之后,固态硬盘被认为达到极限状态,此时系统可能会发出可靠性警告。该项数值由厂商定义,通常为10%或0%。
ID5:Percentage Used已使用的写入耐久度(百分比显示)
该项显示已产生的写入量占厂商定义总写入寿命的百分比。该项数值为动态显示,计算结果与写入量及固态硬盘的TBW总写入量指标有关。新盘状态下该项目为0%。
ID6:Data Units Read读取扇区计数(1000)
该项数值乘以1000后即为读取的扇区(512Byte)数量统计。
ID7:Data Units Write写入扇区计数(1000)
该项数值乘以1000后即为写入的扇区(512Byte)数量统计。
ID8:Host Read Commands读取命令计数
硬盘生命周期内累计接收到的读取命令数量统计。
ID9:Host Write Commands写入命令计数
硬盘生命周期内累计接收到的写入命令数量统计。
ID10:Controller Busy Time主控繁忙时间计数
该项统计的是主控忙于处理IO命令的时间总和(单位:分钟)。当IO队列有未完成的命令时,主控即处于“忙”的状态。
ID11:Power Cycles通电次数
ID12:Power On Hours通电时间
ID13:Unsafe Shut downs不安全关机次数(异常断电计数)
ID14:Media and Data Integrity Errors闪存和数据完整性错误
主控检测到未恢复的数据完整性错误的次数。正常情况下主控不应检测到数据完整性错误(纠错应该在此之前完成),当有不可校正的ECC、CRC校验失败或者LBA标签不匹配错误发生时,该数值会增加。正常情况下ID14应保持为零。
ID15:Number of Error Information Log Entries错误日志条目计数
控制器使用期限内,发生的错误信息日志条目的数量统计。正常情况该项目应为零。
有时该条目下会有Read 1 entries from Error Information Log failed: GetLogPage failed: system=0x38, sub=0x0, code=745
之类的信息提示。
以下项目为非标准项,并非所有NVMe SSD都支持显示。
ID16:Warning Composite Temperature Time过热警告时间
ID17:Critical Composite Temerature Time过热临界温度时间
ID18-25:Temperature Sensor X:多个温度传感器(若存在)的读数
参考:https://blog.csdn.net/qq_24343177/article/details/122521952