提到存储,我们就不得不提到SCSI接口的硬盘,它一般使用SCSI的HBA来连接到主机上,该HBA一般称之为SCSI适配器,主要生产厂家有Adaptec等。
SCSI直译为小型计算机系统专用接口(Small Computer System Interface)是一种连结主机和外围设备的接口,支持包括磁盘驱动器、磁带机、光驱、扫描仪在内的多种设备。它由SCSI控制器进行数据操作,SCSI控制器相当于一块小型CPU,有自己的命令集和缓存。要了解SCSI,必须先了解它的类型,以下是STA(SCSI Trade Association,SCSI同业公会)的标准分类。
1、SCSI接口类型
SCSI连接器分为内置和外置两种,内置数据线的外型和IDE数据线一样,只是针数和规格稍有差别,主要用于连接光驱和硬盘。40针IDE线有40根导线,40针ATA66有80根导线,SCSI内置则分为50针、68针和80针。
2、SCSI ID
ID(identify)作为SCSI设备在SCSI总线的唯一识别符,绝对不允许重复,可选范围从0到15,SCSI主控制器在SCSI总线中也算一个设备,通常占用ID 7,即是说我们可以用在设备上的ID号共有15个,即实际最大可连接设备数目 = 理论最大支持设备数目-1。
3、总线终结器
总线终结器能告诉SCSI主控制器整条总线在何处终结,并发出一个反射信号给控制器,必须在两个物理终端作一个终结信号才能使用SCSI总线。常见的错误是把终结设置在ID号最高或最低的地方,而不是设置在物理终端的SCSI设备上。其实,SCSI设备总是以链形来连接的,按顺序就能分辨出哪一个是终结设备。
终结的方式有三种:自终结设备、物理总线终结器和自终结电缆。大多数新型SCSI设备都有自终结跳线,只要把非终结设备的自终结跳线设置成OFF即可避免冲突问题;物理总线终结器是一种硬件接头,又分为主动型和被动型两种,主动型使用电压调整器来进行操作,被动型利用总线上的能源信号来操作,被动型比主动型更为精确;自终结电缆可以代替物理总线终结器,也是一种硬件,它的价格非常昂贵,常用于两个主机连接同一个物理设备,如:两个服务器存取同一个物理SCSI硬盘。
通过检查SCSI ID和总线终结器,我们可以找出大多数冲突现象的解决方法,这是SCSI设备用户必须重视的一点。
4、SCSI规格公用的几个标准术语解释:
SCSI-1:它是最早SCSI,特点是:支持同步和异步SCSI外围设备,支持7台8位的外围设备,使用8位的通道宽度,传输速率为4MB/s,这现在通常是扫描仪在用的。
SCSI-2:类似SCSI-1,但是可以支持同时连接7个装置,传输速率为 10-20MB/s,目前有CD-R、CD-ROM在使用。
Fast SCSI:8位的通道宽度,使用双倍的频率,传输速率为 10MB/s。
Wide SCSI:16位的通道宽度,传输速率为20MB/s。
Ultra SCSI:8位的通道宽度,传输速率为20MB/s,其允许接口电缆 最大长度为1.5米。
Ultra Wide SCSI:16位的通道宽度,传输速率为40MB/s,其允许接口电缆的最大长度为1.5米。
Ultra 2 SCSI:8位的通道宽度,其采用了LVD(Low Voltage Differential,低电平微分)传输模式,传输速率为40MB/s,允许接口电缆的最长为12米,大大增加了设备的灵活性,支持同时挂接15个装置。
WIDE Ultra 2 SCSI:它跟Ultra 2 SCSI差不多,也是采用LVD传输模式,允许最长接口电缆为12米,可同时挂接15个装置,不同于Ultra 2 SCSI,它有16位的通道宽度,因此传输速度为80MB/s。
Ultra 160 SCSI:支持最高数据传输率为160MB/s。
Ultra320 SCSI:支持最高数据传输达到了320MB/s,是目前最新的SCSI接口类型。
Single Ended(单终结):许多旧式设备都是单终结设备,它们限制于 SCSI-1协议的6米长度。注意:此距离包括设备内部电缆的距离。Single-Ended中每个信号都是通过总线中的一根电缆传送的。
Differential(分差动):DIFF通过总线传送时是靠两根电缆上的电压差传送的。SCSI总线和设备可借助它来沿长传输的距离,附加线的最大长度为25米。缺点是与单终结设备不兼容。
S.E与DIFF的信号最大传输距离也不同。DIFF较S.E的有效电平高,信号衰减也较慢,所以传输距离也较远。DIFF又分为高压差分(HVD)和低压差分(LVD,Ultra 2 SCSI)。LVD使用3.3V电压,2个线路传输数据(1路为传输数据1路为数据校验),大大降低信号的干扰,增强了稳定性。
SCSI类型 SCSI Fast SCSI Ultra SCSI Ultra 2 SCSI Ultra 3 SCSI
接口类型 N N W N W N W W
总线带宽(Bits)
8 8 16 8 16 8 16 16
最大支持设备数
7 7 15 7 15 7 15 15
最大传输速率(MB/sec)
5 10 20 20 40 40 80 160
S.E最大总线长度(m)
6 3 3 1.5 1.5 N/A N/A N/A
HVD最大总线长度(m)
25 25 25 25 25 N/A N/A N/A
LVD最大总线长度(m)
N/A N/A N/A N/A N/A 12 12 12
5、SCSI的优点与缺点
SCSI接口优点:
适应面广,在一块SCSI控制卡上就可以同时挂接15个设备
高性能(具有很多任务、宽带宽及少CPU占用率等特点)
具有外置和内置两种
SCSI接口缺点:
价格昂贵;安装复杂
RAID技术简介
RAID,为Redundant Arrays of Independent Disks的简称,中文为廉价冗余磁盘阵列,就是把许多块硬盘放在一起,有一个智能的控制器来统一操控,使主机系统把全部硬盘看成一块虚拟的硬盘驱动器,其主要功能是增加资料的安全性、硬盘驱动器的存取性能和增加存储总容量。IBM早于1970年就开始研究此项技术.在1987年由美国柏克莱大学提出RAID(Redundant Arrayof Inexpensive Disks)理论,作为高性能的存储系统,巳经得到了越来越广泛的应用。RAID的级别从RAID概念的提出到现在,巳经发展了多个级别,有明确标准级别分别是0、1、2、3、4、5等。但是最常用的是0、1、3、5四个级别。其他还有6、7、10、30、50等。RAID为使用者降低了成本、增加了执行效率,并提供了系统运行的稳定性。每一个RAID级别都有自己的强项和弱项. "奇偶校验"定义为用户数据的冗余信息, 当硬盘失效时, 可以重新产生数据.
NRAID:硬盘连续使用。NRAID 意思是不使用RAID功能。它使用硬盘的总容量组成逻辑碟(不使用条块读写)。换句话说,它生成的逻辑碟容量就是物理碟容量的总和。此外,NRAID 不提供资料的备余。
JBOD:JBOD 的含意是控制器将机器上每颗硬盘都当作单独的硬盘处理,因此每颗硬盘都被当作单颗独立的逻辑碟使用。此外,JBOD并不提供资料备余的功能。
RAID 0: RAID 0又称数据分块,又称“Stripping”(即将数据条带化),并不是真正的RAID结构, 没有数据冗余. RAID 0把数据分成若干相等大小的小块 ,连续地并并行地读/写于多个磁盘上, 因此具有很高的数据传输率。 但RAID 0在提高性能的同时,并没有提供数据可靠性,平均故障时间MTTF只有单盘的N分之一,如果一个磁盘失效, 将影响整个数据。若阵列控制器有多个硬盘通道时,对多个通道上的硬盘进行RAID0操作,I/O性能会更高,因此常用于图象,视频等领域。因此RAID 0 不可应用于需要数据高可用性的关键应用.
RAID 1: RAID 1又称镜像,通过数据镜像实现数据冗余, 在两对分离的磁盘上产生互为备份的数据,每个工作盘都有一个镜像盘. 一旦工作盘发生故障立即转入镜像盘,从镜像盘中读出数据。RAID 1是磁盘阵列中费用最高的, 但提供了最高的数据可用率。因此RAID1常用于对容错要求极严的应用场合,如财政、金融等领域。RAID 1也可以提高读的性能, 当原始数据繁忙时, 可直接从镜像拷贝中读取数据。
RAID (0+1): 结合了RAID 0 和 RAID 1 — 条块化读写的同时使用镜像操作。 RAID (0+1) 允许多个硬盘损坏,因为它完全使用硬盘来实现资料备余。如果有超过两个硬盘做RAID 1,系统会自动实现RAID (0+1)。
RAID 2: 又称位交叉,从概念上讲, RAID 2 同RAID 3类似, 两者都是将数据条块化分布于不同的硬盘上, 条块单位为位或字节. 然而RAID 2 使用汉明码作盘错校验("加重平均纠错码"的编码技术),采用按位交叉存取,运用于大数据的读写,需要多个磁盘存放检查及恢复信息, 使得RAID 2技术实施更复杂,冗余信息开销太大(校验盘为多个),这种编码技术此,在商业环境中很少使用。
RAID 3: 不同于RAID 2, RAID 3使用单块磁盘存放奇偶校验信息和并行传输,采用Stripping技术将数据分块,数据以位或字节的方式存于各盘(分散记录在组内相同扇区的各个硬盘上),对这些块进行异或校验,校验数据写到最后一个硬盘上。 如果一块磁盘失效, 奇偶盘及其他数据盘可以重新产生数据. 如果奇偶盘失效,则不影响数据使用.RAID 3对于大量的连续数据可提供很好的传输率, 但对于随机数据, 奇偶盘会成为写操作的瓶颈。RAID3的优点是并行I/O传输和单盘容错,具有很高可靠性。缺点:每次读写要牵动整个组,每次只能完成一次I/O。
RAID 4:与RAID3相似,区别是:RAID3是按位或字节交叉存取,而RAID4是按块(扇区)存取,可以单独地对某个盘进行操作,无须像RAID3那样,哪怕每一次小I/O操作也要涉及全组,只需涉及组中两块硬盘(一块数据盘,一块校验盘)即可,从而提高了小量数据I/O速度。缺点:对于随机分散的小数据量I/O,固定的校验盘又成为I/O瓶颈,例如:事务处理。作两个很小的写操作,一个写在drive2的stripe1 上,一个写在drive3的stripe2上,它们都要往校验盘上写,所以发生争用校验盘的问题。
RAID 5: RAID 5是一种旋转奇偶校验独立存取的阵列方式,它与RAID3,RAID4不同的是没有固定的校验盘,而是按某种规则交叉地把奇偶校验信息均匀地分布在阵列所属的硬盘上,所以在每块硬盘上,既有数据信息也有校验信息。在RAID5 上, 读/写指针可同时对阵列设备进行操作, 提供了更高的数据流量, 随机读写的数据.RAID 3 与RAID 5相比, 重要的区别在于RAID 3每进行一次数据传输,需涉及到所有的阵列盘.而对于RAID 5来说, 大部分数据传输只对一块磁盘操作, 可进行并行操作.在RAID 5中有"写损失", 即每一次写操作,将产生四个实际的读/写操作, 其中两次读旧的数据及奇偶信息, 两次写新的数据及奇偶信息.这一改变解决了争用校验盘的问题,使得在同一组内并发进行多个写操作。所以RAID5即适用于大数据量的操作,也适用于各种事务处理,它是一种快速、大容量和容错分布合理的磁盘阵列。当有N块阵列盘时,用户空间为N-1块盘容量。
RAID3、RAID5中,在一块硬盘发生故障后,RAID组从ONLINE变为DEGRADED方式,但I/O读写不受影响,直到故障盘恢复。但如果DEGRADED状态下,又有第二块盘故障,整个RAID组的数据将丢失。
RAID 6: RAID 6 与RAID 5相比,增加了第二个独立的奇偶校验信息块. 两个独立的奇偶系统使用不同的算法, 数据的可靠性非常高. 即使两块磁盘同时失效,也不会影响数据的使用. 但需要分配给奇偶校验信息更大的磁盘空间, 相对于RAID 5有更大的"写损失". RAID 6 的写性能非常差, 较差的性能和复杂的实施使得RAID 6很少使用.
标准的RAID写操作,包括如:RAID4或RAID5中所必需的校验计算,需包括以下几个步骤:
(1)以校验盘中读取数据
(2)以目标数据盘中读取数据
(3)以旧校验数据,新数据及已存在数据,生成新的校验数据
(4)将新校验数据写入校验盘
(5)将新数据写入目标数据盘
当主机将一个待写入阵列RAID组中的数据发送到阵列时,阵列控制器将该数据保存在缓存中并立即报告主机该数据的写入工作已完成。该数据写入到阵列硬盘的工作由阵列控制器完成,该数据可继续存放在Cache中直到Cache满,而且要为新数据腾出空间而必须刷新时或阵列需停机时,控制器会及时将该数据从Cache写入阵列硬盘中。
这种缓存回写技术使得主机不必等待RAID校验计算过程的完成,即可处理下一个读写任务,这样,主机的读写效率大为增加。当主机命令将一个数据写入硬盘,则阵列控制器将该数据写入缓存最上面的位置,只有新数据才会被控制器按Write-Back Cache的方式最后写入硬盘。
存储基础篇
2007-10-09 20:02 来源: DoSTOR 作者:Joeyoung 网友评论 0 条 浏览次数 2
上一篇:NAS发展:高效、..
下一篇:虚拟鸡和虚拟鸭
相关主题:IBM SCSI RAID 小型计算机系统专用接口 NRAID JBOD 奇偶校验 HVD LVD
- 2007-10-06 05:09IBM的中小企业存储解决方案
- 2007-10-06 05:15LSI在Intel峰会上展示端到端SAS解决方案
- 2007-10-06 06:30深入分析各种raid模式
- 2007-10-06 21:21IDC称台湾地区外部存储市场Q2出货量同比增52%
- 2007-10-07 03:56IBM

