硬盘检测工具Smartmontools安装、部署、使用_smartmontools rpm-程序员宅基地

在服务器管理的实际环境中,硬盘是最容易出现问题及发生故障的硬件,而且硬盘中存储着大量重要的数据,万一出现故障所造成的损失也是无法估计的,轻则需要化费大量的时间与精力去做数据恢复,重则硬盘报废,里面重要的数据也无法100%挽回,所以对硬盘健康状监控十分必要。

一:什么是Smartmontools?

Smartmontools是一种硬盘检测工具,通过控制和管理硬盘的SMART(Self Monitoring Analysis and Reporting Technology,自动检测分析及报告技术)技术来实现的,SMART技术可以对硬盘的磁头单元、盘片电机驱动系统、硬盘内部电路以及盘片表面介质材料等进行监测,当SMART监测并分析出硬盘可能出现问题时会及时向用户报警以避免计算机数据受损失。

SMART技术必须在主板支持的前提下才能发生作用,而且 SMART技术也不能保证能预报所有可能发生的硬盘故障。SMART(SFF-8035i) 是硬盘生产商们建立的一个工业标准,这个标准就是在硬盘上保存一个跟执行情况,可靠程度,读找错误率等属性的表格。所有属性都有一个1byte(大小范围1-253)的标准化值,还包含另一个1byte的关键阶段值,如果属性表格内某个数据接近小于或达到关键阶段值,表明硬盘工作不正常了。


二:安装部署


2.1:下载最新源码包安装


下载

wget http://down1.chinaunix.net/distfiles/smartmontools-6.0.tar.gz


解压

tar -xvf smartmontools-6.0.tar.gz


编译

cd smartmontools-6.0

./configure


安装

make && make install


2.2:使用yum安装部署

yum install smartmontools -y


三:

smartd是smartmontools软件包中的一个实用程序,可以单独运行,也可以注册为系统服务,

Windows上的注册命令为:>smartd install注册后,打开services.msc,可看到一个名叫“SmartD Service”服务,并设置为“自动”启动。

在linux 系统平台上可通过向/etc/init.d添加smartd脚本,其实在安装smartmontools软件包的时候通常会安装到这个位置,只需要在对应的启动级别下做一个软链接就可以了。

smartd的配置文件为smartd.conf(Windows和非Windows平台都叫这个名字,Windows平台与smartd.exe在同 一个目录下,非Windows平台位于/etc目录下),在这个配置文件中已经内置许多种监视方法和参数说明,值得一体的是-m参数,可以利用它将监视报 告以邮件的形式发送给指定的E-mail地址,这样设备管理员就可以坐在电脑前就可以掌控所有硬盘设备的健康状况了,利用smartd进行自动监控。


3.1:启动监控进程


cp -rp /usr/local/etc/rc.d/init.d/smartd /etc/init.d/

[root@cn-ptmind smartmontools-6.0]# /etc/init.d/smartd start

正在启动 smartd:[确定]

3.2:注册服务、添加开机启动

chkconfig --add smartd

chkconfig smartd on


四:使用方法简介

1、smartctl -a检查该设备是否已经打开SMART技术。

2、smartctl -s on如果没有打开SMART技术,使用该命令打开SMART技术。

3、smartctl -t short后台检测硬盘,消耗时间短;

smartctl -t long后台检测硬盘,消耗时间长;

smartctl -C -t short前台检测硬盘,消耗时间短;

smartctl -C -t long前台检测硬盘,消耗时间长。其实就是利用硬盘SMART的自检程序。

4、smartctl -X中断后台检测硬盘。

5、smartctl -l selftest显示硬盘检测日志。

6、smartctl -l error显示硬盘错误汇总。


五:检测方法案例介绍;


5.1:检查硬盘是否支持SMART

1993年以后出厂的硬盘基本上都支持SMART技术,使用如下命令可以来查看

[root@cn-ptmind smartmontools-6.0]# smartctl -i /dev/sda

sda   sda1  sda2  sda3  sda4  sda5  

[root@cn-ptmind smartmontools-6.0]# smartctl -i /dev/sda5

smartctl 6.0 2012-10-10 r3643 [x86_64-linux-2.6.32-220.el6.x86_64] (local build)

Copyright (C) 2002-12, Bruce Allen, Christian Franke, www.smartmontools.org


=== START OF INFORMATION SECTION ===

Model Family:     Western Digital RE4 Serial ATA

Device Model:     WDC WD5003ABYX-01WERA1

Serial Number:    WD-WMAYP2734314

LU WWN Device Id: 5 0014ee 0030d7592

Firmware Version: 01.01S02

User Capacity:    500,107,862,016 bytes [500 GB]

Sector Size:      512 bytes logical/physical

Rotation Rate:    7200 rpm

Device is:        In smartctl database [for details use: -P show]

ATA Version is:   ATA8-ACS (minor revision not indicated)

SATA Version is:  SATA 3.0, 3.0 Gb/s (current: 3.0 Gb/s)

Local Time is:    Wed Aug 14 18:14:23 2013 CST

SMART support is: Available - device has SMART capability.

SMART support is: Enabled

从返回的信息中,可以看到硬盘的生产厂家,型号,序列号,容量,是否支持SMART,目前SMART开启没有。

如果运行这个命令返回了类似“Device does not support SMART”的信息就说明目标硬盘不支持SMART,不能使用这套软件包进行测试和监控。

在上面的信息可以看到,该硬盘是支持SMART技术,且当前是开启的。如果SMART support is: Disabled表示SMART未启用,执行如下命令,启动SMART


smartctl --smart=on --offlineauto=on --saveauto=on /dev/sda5 或者 smartctl -s on -d ata /dev/sda5


这里的参数-s就是用来开关SMART特性的,如果加上参数值on就表示开启,如果参数值是off就表示关闭。


5.2:检查硬盘健康状态

[root@cn-ptmind smartmontools-6.0]# smartctl -H /dev/sda5

smartctl 6.0 2012-10-10 r3643 [x86_64-linux-2.6.32-220.el6.x86_64] (local build)

Copyright (C) 2002-12, Bruce Allen, Christian Franke, www.smartmontools.org


=== START OF READ SMART DATA SECTION ===

SMART overall-health self-assessment test result: PASSED

请注意result后边的结果:PASSED,这表示硬盘健康状态良好,如果这里显示Failure,那么最好立刻给服务器更换硬盘。

SMART只能报告磁盘已经不再健康,但是报警后还能继续运行多久是不确定的,通常,SMART报警参数是有预留的,磁盘报警后,不会当场坏掉,一般能坚持一段时间,有的硬盘SMART报警后还继续跑了好几年,有的硬盘SMART报错后几天就坏了,千万不要存在侥幸心理。

执行如下命令可以看到详细的参数:


# smartctl -A /dev/hdb


-a 显示设备所有的SMART信息。


-l error 列出硬盘错误日志。如果显示没有错误最好,如果显示了大量的错误信息,那就该着手准备替换硬盘了。


-l selftest 列出自行测试结果

[root@cn-ptmind smartmontools-6.0]# smartctl -A /dev/sda5

smartctl 6.0 2012-10-10 r3643 [x86_64-linux-2.6.32-220.el6.x86_64] (local build)

Copyright (C) 2002-12, Bruce Allen, Christian Franke, www.smartmontools.org


=== START OF READ SMART DATA SECTION ===

SMART Attributes Data Structure revision number: 16

Vendor Specific SMART Attributes with Thresholds:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE

 1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0

 3 Spin_Up_Time            0x0027   142   141   021    Pre-fail  Always       -       3900

 4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       77

 5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0

 7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0

 9 Power_On_Hours          0x0032   086   086   000    Old_age   Always       -       10783

10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0

11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0

12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       75

192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       70

193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       6

194 Temperature_Celsius     0x0022   109   107   000    Old_age   Always       -       34

196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0

197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0

199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0

200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

FLAG是标记,标准数值(VALUE)应当小于或等於关键值(THRESH)。WHEN_FAILED 代表错误信息,上面显示的WHEN_FAILED纵行是空行,说明硬盘没有故障。如果WHEN_FAILED显示数字,表明硬盘磁道可能有比较大的坏道。

5.3:对硬盘进行检测 手工对硬盘进行测试的方法有以下四种:

smartctl -t short     后台检测硬盘,消耗时间短

smartctl -t long       后台检测硬盘,消耗时间长

smartctl -C -t short  前台检测硬盘,消耗时间短

smartctl -C -t long   前台检测硬盘,消耗时间长


例如,在后台对硬盘进行详细的检查,命令如下:

smartctl -t long /dev/hdb

同时可以使用 smartctl -X 终止检查。终止硬盘检查命令的使用方法是:

smartctl -X /dev/hdb

查看硬盘错误日志:

#smartctl -l error /dev/hdb

以下是希捷的机械盘

/opt/smartmontools-6.0/sbin/smartctl --info --device=megaraid,1 /dev/sda


健康查询 :

DELL SAS 机械盘 :

/opt/smartmontools-6.0/sbin/smartctl -H -d megaraid,1 /dev/sda

smartctl 6.0 2012-10-10 r3643 [x86_64-linux-2.6.18-274.el5] (local build)

Copyright (C) 2002-12, Bruce Allen, Christian Franke, www.smartmontools.org


SMART Health Status: OK

DELL SATA SSD硬盘 :

/opt/smartmontools-6.0/sbin/smartctl -H -d sat+megaraid,2 /dev/sdb

smartctl 6.0 2012-10-10 r3643 [x86_64-linux-2.6.18-274.el5] (local build)

Copyright (C) 2002-12, Bruce Allen, Christian Franke, www.smartmontools.org


本文出自 “康建华” 博客,请务必保留此出处http://michaelkang.blog.51cto.com/1553154/1274807

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/beckdon/article/details/12616465

智能推荐

古典密码技术_了解古典密码的算法 了解古典密码的详细步骤 掌握古典密码的基本原理-程序员宅基地

文章浏览阅读7.4k次,点赞4次,收藏18次。古典密码技术古典密码是密码学中的其中一个类型,其大部分加密方式都是利用替换式密码或移项式密码,有时则是两者的混合。其于历史中经常使用,但在现代由于计算机的出现,使得古典密码解密已经不再困难,已经很少使用,大部分的已经不再使用了。古典密码技术根据其基本原理大体可以分为两类:替换密码技术和换位密码技术。替换密码技术替换密码技术是基于符号替换的密码技术。一般有单字符单表替换密码技术、单字符多表..._了解古典密码的算法 了解古典密码的详细步骤 掌握古典密码的基本原理

liunx中ls -la-程序员宅基地

文章浏览阅读1.4w次,点赞2次,收藏7次。ls 列出目录(文件夹)中的文件和子目录-l 长格式列出-a 显示所有文件,包括隐藏文件和目录(所有以“.”为开始的文件和目录为隐藏文件)所以ls -la 是列出当前目录中的所有文件和目录,包括隐藏文件和目录但不是查看文件里面的内容,查看文件的里的内容用的是more,less,cat等命令_ls -la

Java pta 面对对象(下)_定义一个车辆类(vehicle)和它的一个子类——客车类(bus),具体要求如下:(1)车辆类v-程序员宅基地

文章浏览阅读984次,点赞21次,收藏18次。Java pta 面对对象(下)7-1 定义一个车辆类和它的一个子类——客车类7-2 jmu-Java-03面向对象基础-04-形状-继承_定义一个车辆类(vehicle)和它的一个子类——客车类(bus),具体要求如下:(1)车辆类v

图像处理中常用的彩色模型_cmy-程序员宅基地

文章浏览阅读3.6w次,点赞10次,收藏68次。颜色模型就是描述用一组数值来描述颜色的数学模型。在彩色图像处理中,选择合适的彩色模型是很重要的。从应用的角度来看,彩色模型可分为两类:面向硬件设备的彩色模型面向视觉感知的彩色模型_cmy

计算机毕业设计 SSM+Vue健身房系统 健身会员管理系统 健身俱乐部管理系统 健身会所管理系统 健身预约教练管理系统Java Vue MySQL数据库 远程调试 代码讲解_ssm vue健身管理系统源码百度网盘-程序员宅基地

文章浏览阅读146次。计算机毕业设计 SSM+Vue健身房系统 健身会员管理系统 健身俱乐部管理系统 健身会所管理系统 健身预约教练管理系统_ssm vue健身管理系统源码百度网盘

LangChain - Chain-程序员宅基地

文章浏览阅读771次,点赞20次,收藏25次。1、概览为什么我们需要链?2、快速入门 (Get started) - Using `LLMChain`多个变量 使用字典输入在 `LLMChain` 中使用聊天模型:3、异步 API4、不同的调用方法`__call__`调用仅返回输出键值 return_only_outputs只有一个输出键 run只有一个输入键5、自定义chain6、调试链 (Debugging chains)7、从 LangChainHub 加载8、添加记忆(state)9、序列化将chain 保存到

随便推点

TailwindCSS为前端开发者带来了什么?_tailwindcss的优点-程序员宅基地

文章浏览阅读2.3k次。什么是Tailwind CSS?Tailwind CSS是一个功能类优先的CSS框架,它集成了flex、text-center这样的类,Tailwind CSS希望实现的是开发者无需离开HTML页面,即可快速创建出各种样式效果。Tailwind CSS相较于其他CSS框架有什么优势?优势1:Tailwind CSS类名具有较好的语义化传统的语义化类名是CSS难以维护的重要原因,也就是说起名很麻烦,但是Tailwind CSS的语义化类名可以很好的解决这个问题,例如:text-lg:表示一个_tailwindcss的优点

python 设置全局变量-程序员宅基地

文章浏览阅读8.2k次,点赞3次,收藏14次。python 设置全局变量,跨文件使用_python 设置全局变量

遍历磁盘_遍历所有移动硬盘-程序员宅基地

文章浏览阅读1.2k次。#include "stdafx.h"#include int main(){ TCHAR buf[MAX_PATH] = {}; int nDriveType; //1 获取磁盘盘符 GetLogicalDriveStrings(MAX_PATH, buf); TCHAR* pDrives = buf; while (_遍历所有移动硬盘

element-ui的隐藏组件el-scrollbar的使用(解决原生滚动条没有隐藏的问题 高宽设置)_el-scrollbar__wrap-程序员宅基地

文章浏览阅读1.3w次,点赞9次,收藏27次。element-ui的官网页面使用的这个滚动条,但是在官网文档中没有介绍这个组件。在vue+elementui搭建的前端项目中使用这个el-scrollbar组件。在项目中使用这个组件时由于各层的样式没有设置好,可能会显示出原生的滚动条,特此记录。搭建脚手架项目,安装element-ui插件按需引入需要的组件import Vue from 'vue'import { Scrollbar} from 'element-ui'Vue.use(Scrollbar)使用<_el-scrollbar__wrap

LabVIEW开发TDS1000 和TDS2000 系列泰克示波器_泰克示波器 labview-程序员宅基地

文章浏览阅读392次,点赞2次,收藏3次。泰克示波器是经常用到的工具,一般手动操作即可,但有时候也要集成到系统中,需要程控。这时候先要下载厂家提供的例子,了解LabVIEW的demo。示波器的功能挺多的,手册也是几百上千页,需要哪些功能,查找对应的部分就可以了。附件给出了LabVIEW的demo,需要的时候可以下载。手册可以到官网上下载,如果查不到,也可以联系厂家在线的技术,他们也会及时提供的。这是LabVIEW的一个功能介绍,更多的使用方法与开发案例,欢迎登录官网,了解更多信息。根据通讯协议的相关的说明,编写了适合项目的程序。_泰克示波器 labview

USB转2路RS422串口_ch347转接rs422-程序员宅基地

文章浏览阅读958次。默认建议使用厂商提供的VCP串口驱动程序。CH342DS1.PDF - 南京沁恒微电子股份有限公司CH342技术手册,USB转双串口芯片,支持最高3M波特率,串口信号支持1.8~5V,内置晶振。CH342芯片支持最高4Mbps串口波特率,如果对波特率有更高的需求,可以选择支持9Mbps的高速USB转接芯片CH347,使用单个CH342芯片即可实现USB一拖二串口转接产品,内置USB收发器和控制器、高速全双工串口控制器、以及每个UART内置独立的串口收发FIFO,可轻松满足各类串口波特率下的连续稳定通信。_ch347转接rs422