蚂蚁矿机S19 Pro算力板如何维修?

蚂蚁矿机10个月前发布 YKK
1.1K 0 0

一、维护平台/工具/设备准备要求

1、平台要求:

橡胶毯维修工作台(工作台需接地)、防静电腕带并接地。

2、设备要求:

恒温烙铁(350℃-380℃),尖头烙铁头用于焊接贴片电阻、电容等小贴片;热风枪BGA返修台用于芯片/BGA拆焊;使用带焊钢针和热缩T型套管的万用表方便测量(推荐使用Fluke15b+ );示波器(推荐安捷伦)、网线(要求:互联网连接、网络稳定)

3、测试工具要求:

APW12电源:APW12_12V-15V_V1.2和电源适配器线(自制:使用粗铜线连接电源正负极和算力板,建议使用4AWG铜线,长度60cm或更少)用于算力板。使用V2.2010控制板算力板测试仪。测试仪正负极需安装放电电阻。建议使用25欧姆、100W以上的水泥电阻。

4、维修辅助材料/工具要求:

锡膏柱M705、助焊剂、无水酒精洗板水;返修后用洗板水清理焊锡残渣;修复后使用导热胶(规格:Fujipoly SPG-30B)涂抹芯片表面;植锡钢网、吸锡丝、焊球(球径建议0.4mm);更换新芯片时,需要将芯片管脚镀锡,然后焊接到算力板上,在芯片表面均匀涂抹导热胶后,锁住大散热片。

5、常用维修备件材料要求:

0402电阻(0R、51R、10K、4.7K、);0402电容(0.1uf、1uf)

以上维修工具是必须的。当然,您也可以选择便捷的比特大陆蚂蚁矿机算力板维修包

二. 维护要求

1、更换芯片时要注意操作方法。更换任何配件后,PCB板应无明显变形。检查更换部件及周边部件是否有开路、短路问题。

2、维修操作人员必须具备一定的电子知识,一年以上维修经验,精通BGA/QFN/LGA封装焊接技术。

3.修复后算力板必须测试两次以上才OK才可以通过!

4、检查工具和算力板测试仪是否可以正常工作,确定维修站测试软件参数、测试治具版本等。

5、维修更换芯片的测试时,需要先对芯片进行测试,合格后再进行功能测试。功能测试必须保证小散热器焊接合格。安装大散热器时,芯片表面必须均匀涂上导热胶,且散热风扇应全速运转。使用机箱散热时,应同时放置2块算力板,形成风道。制作的单面测试还要保证风道成型(重要)。

6. 测量信号时,使用4个风扇辅助散热,风扇应保持全速运转。

7、算力板通电时,必须先连接电源负极铜线,再连接电源正极铜线,最后插上信号线。拆卸时,安装顺序必须相反。先拆信号线,再拆电源正极铜线,最后拆电源负极铜线。如果用户不按照这个顺序,很容易造成R233、R232的损坏(不是所有芯片都能找到)。在测试图案之前,修复后的算力板必须先冷却后再进行测试,否则可能会导致PNG。

8、更换新芯片,需要打印引脚和焊膏,确保芯片预焊好,然后焊接到PCBA上进行维修

三.算力板测试仪制作及注意事项

算力板测试仪的支撑夹具应满足算力板的散热并便于信号的测量。 

1、第一次使用19 Pro测试治具时,需要使用FPGA(写入转换文件)更新测试治具解压fpga文件,将所有文件复制到SD卡中,然后插入测试固定卡槽,通电约1分钟,等待指示灯闪烁3次以上完成更新,然后取出SD卡。注意:如果更新未完成,可能会导致测试治具每次都提示相同的芯片错误。

蚂蚁矿机S19 Pro算力板如何维修?

2:请直接解压转换文件并将其复制到SD卡。(复制前请先格式化SD卡)

蚂蚁矿机S19 Pro算力板如何维修?

3:转换文件写入后,格式化SD卡,解压测试文件,复制到SD卡上。然后插入测试治具卡槽,开机,直到出现治具屏幕,说明你的所有文件都安装成功了。现在您可以测试算力板了。

蚂蚁矿机S19 Pro算力板如何维修?

四.原理概述

1、S19 Pro算力板工作结构:

算力板由114颗BM1398芯片 组成,分为38组(域),每组由3颗IC组成;S19 Pro算力板使用的BM1398芯片工作电压为0.32V;第38、37、36、35、34、33、32组(共7组)LDO由升压电路Q9输出的19V供电,输出1.8V。第31组-第一组由VDD12.6V通过LDO提供1.8V,每退一域的电压降低0.32V。所有0.8V均由该域的1.8V输出通过LDO提供,如图4-1所示;

蚂蚁矿机S19 Pro算力板如何维修?

图4-1

蚂蚁矿机S19 Pro算力板如何维修?

图4-2

蚂蚁矿机S19 Pro算力板如何维修?

图4-3

蚂蚁矿机S19 Pro算力板如何维修?

图4-4

2、S19 Pro算力板升压电路:

升压电路将电源供电的12.6V转为20V,如图4-5所示。

蚂蚁矿机S19 Pro算力板如何维修?

图4-5

3、S19 Pro芯片信号趋势:

1)CLK(XIN)信号流向:由Y1 25M振荡器产生,从芯片01传输到芯片114;电压0.7V-1.3V;

2)TX(CI、CO)信号流向:从IO口7脚(3.3V)经过电平转换到IC U4,再从芯片01传输到芯片114;未插入IO线时电压为0V,运行时电压为1.8V;

3)RX(RI、RO)信号流向:从芯片114到芯片01,经U2返回信号线端子8脚再返回控制板;未插入IO信号线时电压为0.3V,运行时电压为1.8V;

4)BO(BI,BO)信号流向:从芯片01到芯片114;万用表测量值为0V;

5)RST信号流向:RST信号流向是从IO口的3脚经过电平转换到IC U3,再经过电平转换从芯片01传输到芯片114;如果没有插入IO信号线且设备处于待机状态,电压为0V,工作时电压为1.8V;

4. 整个矿机架构:

整机主要由3块算力板、1块控制板、APW12电源、4个散热风扇组成,如图4-6所示。

蚂蚁矿机S19 Pro算力板如何维修?

图4-6

五、算力板常见故障及排除步骤

1、现象:单板测试检测芯片为0(PT1/PT2站)

步骤1:首先检查电源输出,请检查图5-1。

蚂蚁矿机S19 Pro算力板如何维修?

图5-1

步骤2:检查电压域的电压输出

每个电压域的电压约为0.32V。如果有16V电源,一般都有域电压。优先测量算力板供电端输出,检查MOS是否短路(测量1、4、8脚之间的电阻)。如果16V有供电但无域电压,继续检查。

蚂蚁矿机S19 Pro算力板如何维修?

图5-2

第三步:检查PIC电路

测量U6第2脚是否有输出,电压约为3.3V;如果是,请继续排查问题;如果没有3.3V,请检查算力板测试线和算力板的连接状态是否正常,并重新烧写PIC。

蚂蚁矿机S19 Pro算力板如何维修?

图5-3

蚂蚁矿机S19 Pro算力板如何维修?图5-4

PIC编程步骤:

1、算力板上PIC程序编程。

程序:20191226-PIC1704-BM1398.hex

下载编程工具:PICkit3,PICkit3电缆的1脚对应PCB上J2的1脚,需要连接1、2、3、4、5、6脚。

蚂蚁矿机S19 Pro算力板如何维修?

图5-5

2、编程软件:

打开MPLABIPE,选择器件:PIC16F1704,点击power选择供电模式,然后点击operate。第一步:选择“文件”找到要烧写的.HEX文件;第二步:点击“连接”即可正常连接;第三步:点击“烧写”按钮,完成后点击“验证”,提示验证,证明烧写成功。

蚂蚁矿机S19 Pro算力板如何维修?

图5-6

蚂蚁矿机S19 Pro算力板如何维修?蚂蚁矿机S19 Pro算力板如何维修?

图5-7

第四步:检查升压电路输出,图5-8中的C69可以测量20V电压。

蚂蚁矿机S19 Pro算力板如何维修?图5-8

蚂蚁矿机S19 Pro算力板如何维修?图5-9

第五步:检查每组LDO 1.8V或PLL 0.8V的输出

蚂蚁矿机S19 Pro算力板如何维修?蚂蚁矿机S19 Pro算力板如何维修?

图5-10

蚂蚁矿机S19 Pro算力板如何维修?

蚂蚁矿机S19 Pro算力板如何维修?图5-11

第六步:检查芯片信号输出(CLK/CI/RI/BO/RST) 

参考信号趋势描述的电压值范围。如果测量遇到电压值偏差较大,可与相邻组的测量值进行比较来确定。

蚂蚁矿机S19 Pro算力板如何维修?

图5-12

2、算力板测试仪液晶屏显示EEPROM NG时,检查U10焊接是否正常;

3、如果算力板测试仪液晶屏显示“PICsensor NG”且测试温度异常,请按照以下步骤排查:

a) 检查R217、R218、C22、C23 4个电阻是否焊接异常,检查U5的PIN焊接是否正常;

B) 检查U5、R216、R219、R220、U7、R221~R223、U8、R224~R226、U9、R229~R231 四个温度传感器及配套电阻焊接是否异常,温度传感器位置如下如图4-4和5-13所示,温度传感器全部位于PCB背面,电阻位于PCB正反面,温度传感器3.3V供电是否正常;

检查传感器与小散热片连接芯片的焊接质量。大的散热片材料变形会导致芯片散热不良,影响温差。

蚂蚁矿机S19 Pro算力板如何维修?

图5-13

3、现象:单板检测芯片不完整(PT1/PT2站)

a) LCD 显示 ASICNG:如果(0),先测量测量域总电压,升压电路 20V 正常,然后用短路探头将 RO 测试点与 1V8 测试点之间短路第一个和第二个芯片,然后运行程序找到芯片。检查串口日志,如果此时仍然发现0芯片,则属于以下情况之一:

a-1) 用万用表测量1V8、0V8测试点电压是否为1.8V或0.8V。如果不是,说明该域的1.8V或0.8V LDO电路异常,或者该域的两块ASIC芯片没有焊接好;这种现象多数情况是0.8V、1.8V贴片滤波电容短路造成的(测量PCBA正反面相关贴片滤波电容的阻值)。

a-2) 检查U2、U3、U4电路是否有异常,如阻焊等。

a-3) 用万用表测量R232或R233的阻值是否在1欧姆以内,且读数不会乱跳。如果不是,请更换这两个电阻。

a-4) 检查第一个芯片的引脚是否焊接良好(维修时发现从侧面观察引脚有镀锡,但拆下芯片后引脚根本没有沾锡)。

b) 如果在步骤a)中能找到一个芯片,则表明第一个芯片和前一个电路是好的。用类似的方法检查后续芯片。例如,将第38、39芯片之间的1V8测试点和RO测试点短接。如果日志可以找到38个芯片,则前38个芯片没有问题;如果还是发现0个芯片,先检查1V8;如果正常,说明38以后的芯片有问题。继续用二分法排查,直到找到有问题的芯片。假设第N个芯片出现问题,当第N-1个和第N个芯片之间的1V8和RO短路时,可以找到N-1个芯片,但是当第N个和第N+1个芯片之间的1V8和RO短路时芯片短路,整个芯片找不到。

c) LCD 显示 ASIC113:(报告 113),表示算力板在 115200 波特率下可以检测到 114 个芯片,但在 12M 波特率下只检测到 113 个芯片,在 12M 波特率下检测不到 1 个芯片;

修复方法:采用二分法,用短路探头将第38、39号芯片之间的1V8测试点和RO测试点短路。如果日志可以找到38个芯片,则前38个芯片没有问题;如果短路47号芯片,但日志报46号,则说明无法检测到47号芯片,目视检查没有问题。一般更换47号芯片即可;

蚂蚁矿机S19 Pro算力板如何维修?

图5-15

d) LCD显示ASICNG:(X,固定报某芯片),有两种情况:

d-1) 第一种情况:测试时间与好板基本一致(一般每次测试X的值不会改变)(测试时间是指从按下开始测试按钮到开始测试的时间) ASICNG 结果:(X) 显示在 LCD 上的时间)。这种情况很可能是第X芯片前后CLK、CI、BO电阻焊接异常造成的,所以用户重点关注这6个电阻。小概率是由于X-1、X、X+1,即三个芯片中,出现芯片的以下管脚焊接异常情况:

蚂蚁矿机S19 Pro算力板如何维修?

图5-16

d-2)第二种情况:测试时间几乎是好板的两倍(有时每次测试X的值都会改变,有时X=0);此时日志通常有以下信息(红色数字有时不是13,具体取决于算力板测试仪连接到哪个座席);测试时,假设异常位置前面的所有场的域电压几乎都小于0.3V,而后面的场的域电压几乎都高于0.34V。这种情况是芯片没有焊接好造成的,通常是1.8V、0.8V、RXT、CLK没有焊接好。建议直接测量域电压来定位问题所在。a)节采用的1V8和RO短路法也可以定位异常位置;

蚂蚁矿机S19 Pro算力板如何维修?

图5-17

5、现象:单板Pattern NG,说明响应nonce数据不完整(PT2站)

Pattern NG是由于该芯片与其他芯片的特性差异较大造成的。目前发现芯片管芯损坏,只需更换芯片即可。根据日志信息,替换规则如下:

如果芯片外观没有损坏,只需更换各个域中响应率最低的芯片即可。下图为其中一份测试日志,从日志中可以看出四颗芯片asic[57][58][61][63][64]的响应率较低。更换第61(62)个芯片。

PS:特别注意domain和asic的编号都是从0开始的

蚂蚁矿机S19 Pro算力板如何维修?图5-18

蚂蚁矿机S19 Pro算力板如何维修?图5-19

6、现象:芯片测试正常,PT2功能测试串口不停止(长距离运行)

修复方法:PT2测试时,检查串口打印日志。当串口开始长时间工作时,使用短路探头将RO&1.8V短路。短路从第一个芯片开始。如果短路后串口停止长期工作,则第一颗芯片正常。根据这种方法,找到某颗芯片短路后仍然存在长期运行故障的芯片。一般是某个芯片损坏造成的,更换即可;

蚂蚁矿机S19 Pro算力板如何维修?图5-20

7、现象:PT1芯片测试正常,PT2功能测试总是报某芯片NG;

修复方法:检查外观,测量前面的贴片电容或电阻,一般是贴片焊接不良或贴片电容、电阻损坏或阻值异常所致;

六.控制板问题导致以下问题

1、整机不工作

1)检查几个电压输出点电压是否正常。如果3.3V短路可以先断开U8。如果仍短路,可拔掉CPU进行测量。对于其他电压异常,一般更换相应的转换器IC。

2)如果电压正常,请检查DDR/CPU的焊接状态。

3)尝试用SD卡更新Flash程序;

如果刷了控制板的矿机需要正常启动,需要执行以下两个步骤:

a) 卡恢复通过后,绿色LED指示灯常亮,重新上电;

b) 再次上电后等待30秒(开启OTP的时间过程)。

c) OTP(One Time Programmable)是MCU的一种存储器类型,意思是一次性可编程:程序烧写到IC后,不能再次更改和清除;

防范措施:

(1) OTP 过程中突然断电或时间小于 30s 会导致控制板无法开启 OTP 功能。至于控制板无法启动(未联网)的问题,用户需要更换U1(控制板主控IC FBGA),更换后U1不能再在19系列中使用。

(2) 对于开启OTP功能的控制板,U1不能用于其他系列机型;

蚂蚁矿机S19 Pro算力板如何维修?图6-1

2、全机找不到IP

可能是操作异常导致找不到IP。故障排除请参考第一点。

检查网口、网络变压器T1、CPU的外观及焊接情况。

3.整机无法升级

检查网口、网络变压器T1、CPU的外观及焊接情况。

4、整机加载算力板失败或链接少

A. 检查电缆连接状态。

B、检查控制板上与链条对应的部分。

C、检查插件引脚的波峰焊质量和插件接口周围的电阻。

蚂蚁矿机S19 Pro算力板如何维修?

图6-2

七.整机故障现象

常见故障:

检测不到IP、粉丝数异常、外链异常。如果测试出现异常,按照监控界面和测试LOG提示进行维护。

1)风扇显示异常——检查风扇工作是否正常,与控制板的连接是否正常,控制板是否异常。

2)少链接:少链接是指3块板中缺少1块。大多数情况是算力板和控制板之间的连接有问题。检查电缆是否存在开路。如果连接正常,用户可以测试单板PT2,看看是否可以通过测试。如果测试通过,基本可以确定问题出在控制板上。如果测试失败,则使用PT2修复方法进行修复。

3)温度异常:一般是由于温度高造成的。我们的监控系统设定的PCB温度不能超过90度。如果超过90度,矿机就会报警,无法正常工作。一般是环境温度过高导致矿机无法正常工作。风扇运转异常也会引起温度异常。

4)找不到所有芯片(开机可以操作,但算力r为正常值的2/3或1/3)。芯片数量不够:如果芯片数量不够,可以参考PT2进行测试修复。

蚂蚁矿机S19 Pro算力板如何维修?

图7-1

5)运行一段时间后,没有算力,与矿池的连接中断,请检查网络;

蚂蚁矿机S19 Pro算力板如何维修?

图7-2

6)普通矿工状态;

蚂蚁矿机S19 Pro算力板如何维修?图7-3

蚂蚁矿机S19 Pro算力板如何维修?图7-4

7)某块算力板算力低:针对这种情况,可以通过Putty软件登录该IP,观察该算力板的域工作电压是否正常,NONCE返回是否正常。您可以根据Putty LOG提示进行修复。 

8)putty的使用方法: tail -f /tmp/nonce.log-NONCE 打印命令 tail -f /tmp/adc.log-domain 电压打印命令 

具体操作如下:

1、打开putty,输入矿机IP,点击OPEN。

蚂蚁矿机S19 Pro算力板如何维修?图7-5

2. 输入用户名、密码和测试命令,检查NONCE响应状态和电压域状态。如果NONCE和域电压异常,用户可以根据打印的异常芯片进行测量和维修。

蚂蚁矿机S19 Pro算力板如何维修?图7-6

八.其他注意事项

维护流程图

蚂蚁矿机S19 Pro算力板如何维修?图8-1 维护流程图

● 例行检查:首先目视检查待修复的算力板,观察PCB是否有变形、烧焦的情况。如果是,则必须先处理;零件是否有明显的烧焦痕迹、碰撞偏移零件或缺失零件等;其次,目视检查通过后,可以先测试各电压域的阻抗,检测是否存在短路或开路的情况。如果是,则必须先处理。进一步检查各域电压是否在0.36V左右。

● 例行测试通过后(一般例行测试中的短路测试是必要的,避免上电时因短路而烧毁芯片或其他材料),即可进行芯片测试。算力板测试仪,根据算力板测试仪的测试结果确定定位。

● 根据算力板测试仪检测显示的结果,从故障附近的芯片开始,检查芯片测试点(CO/NRST/RO/XIN/BI)以及VDD0V8、VDD1V8 等电压。

● 从信号流程来看,除 RX 信号为反向传输信号(从 114 号芯片到 1 号芯片)外,包括 CLK CO BO RST 在内的几个信号为正向传输(1-114),异常故障通过电源时序可以找到该点。

● 找到故障芯片后,需要重新焊接芯片。方法是在芯片周围添加助焊剂(最好是免清洗助焊剂),并将芯片引脚的焊点加热至溶解状态,促使芯片引脚和焊盘重新磨合并收集锡,从而达到达到再次镀锡的效果。如果重新焊接后故障依旧,可直接更换芯片。

● 修复后的算力板用算力板测试仪检测两次以上即可判定为良品。第一次,更换部件后,等待算力板冷却,使用算力板测试仪进行测试,测试通过后,将其放在一边,然后冷却。第二次,等算力板冷却几分钟后,再次测试。

© 版权声明

相关文章

暂无评论

暂无评论...