Ⅰ. A11系列矿机型号介绍
A11系列矿机型号,在装配方面,与其他型号有两个明显的区别,请参考下图:
1、算力板从左到右为算力板1—算力板4;
2、没有SPI线,A11系列控制板和算力板通过转接板连接。
目前有6种型号:
A11三星颗粒,有8G和16G;
A11M镁粒,16G;
A11MX镁粒,8G;
A8P相当于A11
A8PM相当于A11M
A8PMX相当于A11MX
由于DDR颗粒(品牌、颗粒容量)不同,各型号不能随意组装!
在您了解机器属性之前,不建议混合使用算力板/算力模块。组装算力板/算力模块的前提是整机矿机桶上粘贴的SN码信息一致。
SN码信息有两种:
RA51:如RA51A21A2400441
RB51:如RB51XN21C090704
RB51 SN码的相互汇编原理:
1、可直接相互组装;
RA51 SN码的相互汇编原理:
1、SN码第六位必须相同;
2. 都是AG或者都是BG;
3、A11M矿机,21和22生产的不能混用(看SN码第7位和第8位)。
二. 维修平台建设
用于修复A11算力板的修复平台需要使用已烧录修复程序到控制板中的A11控制板(修复程序分为三星RA51和镁光RB51,每个修复帖子配备2个修复-特定控制板),单模块测试的电源板,或者A11本身的电源板,使用A11本身的电源或者12V恒压电源。修复平台搭建如下:
三.故障矿机故障排除
以故障矿机维修为例,维修步骤如下:
1、通电前需要使用UT890D+万用表的蜂鸣器档位检测算力板供电端是否存在短路故障;
2、如果算力板存在短路,需要断开算力板和电源,单独测量算力板,找到短路的算力板;
3、首先观察短路算力板外观是否有缺陷,然后将各个算力板模块逐一拆下,直至找到短路算力板模块;
4、如果没有短路,可以给整机上电,插上网线,扫描矿机运行状态和错误信息(错误代码见下图),定位故障算力板;
5、关闭矿机,取出故障算力板,目视检查并定位故障算力板模块,或者使用维修平台/桶+测试控制板对故障算力板进行测试(参考下图) (方法与T3+算力板的维修类似),根据维修平台的错误信息,排除故障算力模块,准备维修。
错误代码 | 错误类型 | 对应原来的错误 | 阐明 | 判断依据 | 维修建议 |
E0 | 目视检查异常 | F15 | 其他 | 其他异常 | |
E1 | 目视检查异常 | F1 | 电源异常 | 矿机上电后控制板和风扇不通电 | |
E2 | 目视检查异常 | F7/F8/F12 | 控制板异常 | 1.无法烧录 2.启动后控制板上Normal指示灯不闪烁 3.启动后网口灯不闪烁 4.IPSET按钮无效 5.其他控制板故障 | |
E3 | 目视检查异常 | F2 | 网络无法连接 | 矿机无法上报IP | |
E4 | 目视检查异常 | F3 | 老化系统不显示 | 老化系统页面不显示对应的SLOT | |
21 | 矿机错误代码 | 21 | 未检测到 1 个或多个算力板 | 老化系统ErrCode栏显示错误代码 | |
22 | 矿机错误代码 | 22 | 电源I2C通讯异常 | 老化系统ErrCode栏显示错误代码 | |
23 | 矿机错误代码 | 23 | 所有算力板的 SPI 链都失败 | 老化系统ErrCode栏显示错误代码 | |
24 | 矿机错误代码 | 24 | 部分算力板SPI链故障 | 老化系统ErrCode栏显示错误代码 | 检修工艺、SPI电缆等 |
25 | 矿机错误代码 | 25 | 超频失败 | 老化系统ErrCode栏显示错误代码 | |
26 | 矿机错误代码 | 26 | 设置电压失败 | 老化系统ErrCode栏显示错误代码 | A11报告26是SPI通讯问题 |
27 | 矿机错误代码 | 27 | 比斯特失败 | 老化系统ErrCode栏显示错误代码 | |
28 | 矿机错误代码 | 28 | 运行时SPI错误且无法自动恢复 | 老化系统ErrCode栏显示错误代码 | |
29 | 矿机错误代码 | 29 | 运行时I2C通信出错且无法自动恢复 | 老化系统ErrCode栏显示错误代码 | |
30 | 矿机错误代码 | 30 | 矿池连接中断 | 老化系统ErrCode栏显示错误代码 | |
31 | 矿机错误代码 | 31 | 单个芯片的损坏会导致算力膨胀 | 老化系统ErrCode栏显示错误代码 | |
32 | 矿机错误代码 | 32 | 温度过高 | 老化系统ErrCode栏显示错误代码 | |
33 | 矿机错误代码 | 33 | 读取温度失败(运行时SPI通信错误) | 老化系统ErrCode栏显示错误代码 | A11系列断电重启仍无效,更换控制模块 |
34 | 矿机错误代码 | 34 | SPI线连接异常 | 老化系统ErrCode栏显示错误代码 | |
35 | 矿机错误代码 | 35 | 电源异常 | 老化系统ErrCode栏显示错误代码 | |
36 | 矿机错误代码 | 36 | 芯片好核数异常 | 老化系统ErrCode栏显示错误代码 | |
37 | 矿机错误代码 | 37 | 控制板视频类型错误 | 老化系统ErrCode栏显示错误代码 | |
40 | 矿机错误代码 | 没有任何 | 电力负载不足 | 老化系统ErrCode栏显示错误代码 | |
41 | 矿机错误代码 | 没有任何 | 电源启动电压过低 | 老化系统ErrCode栏显示错误代码 | |
42 | 矿机错误代码 | 没有任何 | 超频失败且无法自动恢复 | 老化系统ErrCode栏显示错误代码 | |
43 | 矿机错误代码 | 没有任何 | 一定程度的芯片电压异常 | 老化系统ErrCode栏显示错误代码 | |
44 | 矿机错误代码 | 没有任何 | 算力板A/B压差太大 | 老化系统ErrCode栏显示错误代码 | |
46 | 矿机错误代码 | 没有任何 | 控制板测试模式开启 | 老化系统ErrCode栏显示错误代码 | |
47 | 矿机错误代码 | 没有任何 | 过温保护失效(软件缺陷) | 老化系统ErrCode栏显示错误代码 | |
48 | 矿机错误代码 | 没有任何 | 算力板局部温度过高 | 老化系统ErrCode栏显示错误代码 | |
49 | 矿机错误代码 | 没有任何 | 电源型号与矿机型号不匹配 | 老化系统ErrCode栏显示错误代码 | |
50 | 矿机错误代码 | 没有任何 | 控制板SPI HUB寄存器检测错误 | 老化系统ErrCode栏显示错误代码 | |
51 | 矿机错误代码 | 28 | 切换到SPI 3M后读取电压失败 | 老化系统ErrCode栏显示错误代码 | |
52 | 矿机错误代码 | 没有任何 | 老化频率参数小于600M | 老化系统ErrCode栏显示错误代码 | |
53 | 矿机错误代码 | 没有任何 | 某条链老化频率参数异常 | 老化系统ErrCode栏显示错误代码 | |
55 | 矿机错误代码 | 没有任何 | A11 GDDR 低速 | 老化系统ErrCode栏显示错误代码 | |
56 | 矿机错误代码 | 没有任何 | A11 3G速率配置失败 | 老化系统ErrCode栏显示错误代码 | |
57 | 矿机错误代码 | 没有任何 | 电源功耗参数异常 | 老化系统ErrCode栏显示错误代码 | |
59 | 矿机错误代码 | 没有任何 | ddr粒子初始化失败 | 老化系统ErrCode栏显示错误代码 | A11系列断电重启仍无效,更换控制模块 |
60 | 矿机错误代码 | 没有任何 | A11低频转高频失败 | 老化系统ErrCode栏显示错误代码 | A11系列断电重启仍无效,更换控制模块 |
61 | 矿机错误代码 | 没有任何 | A11 缓存计算错误 | 老化系统ErrCode栏显示错误代码 | A11系列断电重启仍无效,更换控制模块 |
62 | 矿机错误代码 | 没有任何 | A11 dag计算错误 | 老化系统ErrCode栏显示错误代码 | A11系列断电重启仍无效,更换控制模块 |
63 | 矿机错误代码 | 没有任何 | A11 作业计算错误 | 老化系统ErrCode栏显示错误代码 | A11系列断电重启仍无效,更换控制模块 |
64 | 矿机错误代码 | 没有任何 | GDDR颗粒平均温度>68 ℃ | 老化系统ErrCode栏显示错误代码 | 检查散热条及散热片、风扇 |
65 | 矿机错误代码 | 没有任何 | ASIC芯片温度>78 ℃ | 老化系统ErrCode栏显示错误代码 | 检查硅脂及散热片、风扇 |
四.哈希模块故障定位与修复
1、依次清理算力模块表面和内部的灰尘;
2、目视检查电容、电阻等是否有腐蚀或脱落现象,并进行针对性修复;
3、用万用表的二极管档测量6个电压点的接地值。常温下,哈希模块VDD对地值不小于1Ω,VDDQ对地值不小于20Ω,U3/U4/U6/U7输出端对地值开路(二极管档位测得的二极管不低于0.10v,如下右下图),否则可能存在短路,必须排除短路后再通电。
4、确认没有短路后,将待修复的哈希模块安装到单模块电源板上,通电测试,测量6个电压点的输出(如左上图),借助修复测试程序(参考下图测试页)定位故障点并进行维修(注:哈希模块在没有散热器的情况下不能长时间通电)。
(1) 如果链路失败,会报错E0,后面会报错误的模块号。每块板上有8个算力板模块,如下图所示。通过单板测试定位具体模块问题,并拆下模块进行维护。大多数故障是由于链条故障引起的,可能是转接板或模块腐蚀引起的。下面仅列出E0的修复。其他错误代码不建议自行修复。
(2) 模块电压时序图(指先哪个电压后哪个电压),参考下图进行修复,以确保电压正常。
Ⅴ. 常见问题
1、腐蚀故障问题
A11系列矿机的通病是腐蚀导致的故障。进风口附近的模块、电源板、转接板等故障概率较高。
腐蚀的电容、电阻等需要清理干净,用刀片刮去氧化层,然后重新给焊盘镀锡,焊接新的元件,涂上三防胶。其他模组的位置相同进风口也需要检查是否腐蚀,必要时更换新部件,然后涂上三防胶。
(1)算力模块腐蚀、断线;
(2)电源板腐蚀、断线;
对于出现腐蚀现象的算力板模块,很大概率是6个输出电压中的一个或多个出现问题。仔细观察腐蚀点或参考时序图找出问题点。找到断线位置后,参考下面电路图进行跳线。
2、转接板故障
转接板也容易出现很多问题:
(1)电路腐蚀;
(2)转接板插座损坏;
(3)转接板接触不良;
转接板和算力板组装时,无法直观地看到插针和插座的对准情况,且插针较多,对准偏差,强力安装会导致插针变形、错位,甚至脱落损坏的。
Ⅵ. 防范措施
1、转接板的拆卸和安装必须轻柔,不得使用蛮力。
拆解时,可以在转接板四个角附近一点点撬起,注意保护好算力板SPI插座的引脚。
安装时,先将算力板放入矿机筒内,推到底,然后检查算力板SPI插座的针脚是否弯曲,确保算力板的方向和间距没有差异。引脚,最后将转接板轻轻放在算力板上。就在测力台SPI插座的上方,稍微调整一下,确保插头引脚与插孔对齐,然后轻压转接板,用力将转接板与SPI插座连接到位。检查安装无问题后,锁紧算力板电极螺丝;
2、维修算力板或算力模块时,通电前确保各电压点没有对地短路;
3、如果算力模块没有配备散热器,则不要长时间通电,以免主芯片和DDR过热;
4、对于进风口的哈希模块,应在进风侧安装灰条,常见易腐蚀位置涂三防胶;
5、测试报错E0的模块时,大概率是由于腐蚀导致电压输出异常。如果6路电压输出正常稳定,晶振工作正常,则错误E0的故障仍然无法解决。建议将此类无法处理的模块收集起来送专业维修中心维修;
6、修复短路模块时(一般是PL1/PL2/PL3对地短路),如果拆下PL1/2/3后仍然短路,则此类模块无法现场修复,需要到现场维修。送专业维修中心统一处理;
7. 常见的哈希模块有两种:Samsung RA51 和 Magnesium RB51。修复程序(指修复专用控制板)必须与待测试算力板/模块相匹配,才能完成正常测试并显示正确的测试结果。如果只需要验证待测算力板/模块是否连接(是否报错E0),则无需修复程序,测试程序显示屏上会出现矿机/芯片的型号页面(此时页面上可以看到监测到的温度和电压)。
8、对于报错E3的算力模块,如果6个电压点电压正常稳定,则可以认为是一个好的模块,将其作为完整的矿机安装并上架运行,看看是否可以工作通常情况下;
9、对于报错E4的模块,重点检查晶振输出是否正常(使用DS1102E示波器 测量晶振输出波形);
10、当测试结果显示报错E21时,则为电源板故障。检查电源板上插座附近的电阻是否异常;
11、现场维修点,只需修复问题模块的正常故障即可(只需修复报错E0的模块)。对于其他错误,或者现场无法修复的故障,请标记模块的错误信息,并发送给专业维修站点进行修复。