蚂蚁矿机T19算力板维修指南

蚂蚁矿机10个月前发布 YKK
1.1K 0 0

本卷内容:主要讲述T19各种故障的排除,以及如何使用测试治具进行准确定位。

一、维护平台/工具/设备的准备要求

1、平台要求:

防静电皮肤维护工作台 (工作台需接地)、防静电手腕带、接地。

2、设备要求:

恒温烙铁 (350度-380度),尖头烙铁头用于焊接贴片电阻、电容等小贴片;便携式拆焊枪 和BGA返修台 用于芯片/BGA拆焊;福禄克万用表FNIRSI 示波器

3、测试工具要求:

APW12电源 (AP12_12V-15V_V1.2和电源适配器线(自制:电源正负极使用粗铜线连接电源和电源板,建议使用4AWG铜线)长度小于60cm),用于给算力板供电使用;控制板、算力板测试治具、测试治具正负极需安装放电电阻,建议使用水泥电阻25欧姆,100W以上。

4、维修辅助材料/工具要求:

焊膏、助焊剂、电路板清洗液、无水酒精;线路板清洗液用于清理修复后的助焊剂残留物;导热膏用于修复后涂抹在芯片/散热器上(部分型号需要使用导热膏);锡工具钢网、除锡丝焊锡球 (建议焊锡球直径为0.4mm);更换新芯片时,需要在芯片引脚上植锡,并做一个短路引脚,用于维修。将1.8V与RO信号短路即可确定问题。

5、常用维修备件材料要求:

0402电阻器 (55R和10K);0402电容 (0.1uf、1uf)

二. 维护要求

1、维修人员必须具备一定的电子知识,一年以上维修经验,精通BGA/QFN/LGA封装焊接技术。

2、维护后算力板必须测试两次以上,全部OK后方可通过!

3、更换芯片时要注意操作方法。更换任意配件后,PCB板无明显变形。检查更换件及周边部件是否有开路、短路问题。

4、检查工具、治具是否能正常工作,并确定维修站测试软件的软件参数、测试治具的版本等。

5、维修、更换芯片时,需先对芯片进行测试,合格后再进行功能测试。功能测试必须确保小散热器焊接OK。大散热片应涂导热胶并按要求安装,冷却风扇应全速运转。使用机箱散热时,应同时放置两块算力板,形成风道。测量信号时,辅助4个冷却风扇 ,风扇保持全速运转。

6、电源板通电时,必须先连接电源负极铜线。接下来,必须连接电源的正极铜线,最后必须插入信号线。拆卸时,安装顺序必须相反。首先拆掉信号线,然后拆掉电源正极铜线,最后拆掉电源负极铜线。如果不按照这个顺序,很容易造成R8、R9、U1、U2损坏(不是所有芯片都能找到)。在测试图案之前,算力板必须先将刚刚修复的区域冷却后再进行测试;否则,将导致测试 PNG。

7、更换新芯片时,应先印刷引脚的焊膏,确保芯片引脚预镀锡后再焊接到PCBA上,避免焊接不良。

三.Tesr治具制作及注意事项

配套治具应满足算力板的散热并便于信号的测量。

1、使用测试治具SD卡刷程序更新控制板的FPGA,解压并复制到SD卡上,将卡插入治具卡槽;开机约1分钟,等待控制板指示灯双闪3次,更新完成。

蚂蚁矿机T19算力板维修指南

2、根据要求制作测试SD卡,单面散热片使用PT1文件制作SD卡,双面散热片使用PT2文件制作SD卡。

四.原理概述

1、T19算力板工作结构:

算力板由76颗BM1398芯片组成,分为38组,每组由2颗IC组成;T19算力板使用的BM1398芯片工作电压为0.36-0.38V,倒数32-38组由19V给DCDC供电,第38域的VDD13.64V提供DCDC输出1.8V第 31 个域为 LDO 提供 1.8V。所以每个域的电压每次返回都会降低0.36V,这个域的1.8V通过LDO输出提供全部0.8V。

蚂蚁矿机T19算力板维修指南蚂蚁矿机T19算力板维修指南

2、T19算力板升压电路:

升压由电源供电,电压范围为 14V 至 19V。

蚂蚁矿机T19算力板维修指南

3、T19芯片信号方向:

1)CLK(XIN)信号流由Y1 25M晶振产生,从01号芯片传输到76号芯片;工作时电压1.8V(示波器),万用表测量0.7-1.2V左右;

2)TX(CI、CO)信号从IO口7脚(3.3V)流入电平转换IC U2,再由01号芯片向76号芯片传输;未插IO线时电压为0V,工作时电压为1.8V(示波器)

3)RX(RI、RO)信号流向,从76号芯片到01号芯片,经U1回到信号线端子第8脚,再回到控制板;未插入IO信号时电压为0.3V,运行时电压为1.8V(用万用表测量);

4)BO(BI、BO)信号流向,从01号芯片到76​​号芯片;万用表测量0V;

5)RST信号的流程从IO口3输入,然后从01号芯片传输到76号芯片;如果没有插入IO信号,待机时为0V,运行时为1.8V(万用表测试音量);

蚂蚁矿机T19算力板维修指南

4. 整个矿机结构:

整机主要由3块算力板、1块控制板、1块APW12电源、4个散热风扇组成。

蚂蚁矿机T19算力板维修指南

五、算力板常见不良现象及排除步骤

现象一:单板测试检测芯片为0(PT1/PT2站)

第一步:首先检查电源输出。

蚂蚁矿机T19算力板维修指南蚂蚁矿机T19算力板维修指南

步骤2:检查电压域电压输出。

每个电压域的电压约为0.36V,14V电源一般都有一个域电压。首先测试算力板供电端输出,MOS是否短路(测量1、4、8脚之间的电阻)。如果 14V 供电但无域电压,请继续排除故障。

蚂蚁矿机T19算力板维修指南

第三步:检查PIC电路。

测量U3的第二脚是否有输出;电压约为3.2;如果有,请继续排查问题;如果没有3. 3V,请检查测试治具排线与算力板的连接状态是否为0K,并重新烧录PIC记录。算力板供电时,14V电压首先经过U10电路,输出21V左右的电压,为R41、R42电阻的负载电路供电。PIC U3的11脚会输出3V左右的电压,为Q4的1脚供电(用万用表测量Q4的1脚到2脚的电压);Q4的1脚收到电压后,导通2脚和3脚,拉低Q5的1脚电压,使Q5的2脚和3脚导通。最终Q2、Q3、Q6的4针电池,

蚂蚁矿机T19算力板维修指南蚂蚁矿机T19算力板维修指南蚂蚁矿机T19算力板维修指南

 编程步骤:

1、烧写算力板的PIC程序。

程序:20190908-PIC1704-BHB07602-0x88.hex

下载烧写工具:PICkit3,PICkit3排线的1脚对应PCB板上J3的1脚,需要连接到1、2、3、4、5、6脚。

蚂蚁矿机T19算力板维修指南

2、烧录软件:

打开MPLAB IPE,选择器件:PIC16F1704,点击power选择供电模式(推荐电压为3.375V,而不是5V),然后点击操作;第一步:选择文件找到要烧录的.HEX文件,第二部分:点击连接,连接正常,第三步:点击烧录按钮,完成后点击验证,并提示验证完成,证明编程成功。

蚂蚁矿机T19算力板维修指南蚂蚁矿机T19算力板维修指南

第四步:检查升压电路输出。

C55可以测量19V。

蚂蚁矿机T19算力板维修指南蚂蚁矿机T19算力板维修指南

Step5:检查各组LDO 1.8V 或PLL 0.8V 输出。

蚂蚁矿机T19算力板维修指南蚂蚁矿机T19算力板维修指南

Step6:检查芯片的信号输出(CLK/CI/RI/BO/RST)。

参考信号方向描述了电压范围。如果测量遇到电压值偏差较大,可与相邻组的测量值进行比较。

蚂蚁矿机T19算力板维修指南

假设芯片的信号引脚输出电压正常,芯片的检测仍然不完整。例如检测到75个芯片,可以通过短接RO和1.8V来检查。如果短路后可以检测到74个芯片,则可以短路74个芯片,直到某个芯片短路,夹具也报告该芯片。可以确定下一个芯片有问题。

现象2:单板检测芯片不完整(PT1/PT2站)

检查报错位置前后芯片的相关信号(CLK/CI/RI/BO/RST),根据信号异常的IC定位坏位置,并对信号方向和电压值范围进行维修。假设芯片信号引脚输出电压正常,则芯片的检测仍然不完整。例如检测到75个芯片,可以通过短接RO和1.8V来检查;如果短路后可以检测到74个芯片,则可以对74个芯片进行短路,直到某个芯片短路,并且测试治具也报告该芯片;基本上就可以确定下一个芯片有问题了。

现象3:单板Pattern NG,即回复nonce数据不完整(PT2站)

Pattern NG是由于芯片与其他芯片的特性差异造成的,因此只需更换芯片即可。根据日志信息,更换规则为:更换各域响应率最低的芯片。下图为其中一份测试日志。从日志可以看出asic[36][37][43][75]这四个芯片的恢复率较低。36和37在同一个域,因此替换36和37中nonce最低的那个。同时替换两个芯片43和75。

PS:要特别注意domain和ASIC的编号是从0开始的。

蚂蚁矿机T19算力板维修指南

还有一个PATTERN-NG的现象:显示屏幕不断刷新,显示BTC_check_register: reg_value_buf缓冲区已满!在这种情况下,PCBA上至少有一颗芯片有缺陷。修复方法使用50M单板PT2测试固件,进行单板测试;当LOG显示芯片检测到76个芯片并开始刷新屏幕时,用短路引脚将其中一个芯片短路。如果这颗芯片没有问题,比如将第五颗芯片RO输入与1.8V短接,15秒后LOG就会停止刷屏,这就证明第五颗芯片没有问题。但当第6个芯片短路时,如果15秒后屏幕继续刷新,就可以证明第6个芯片有问题。可能是焊接不正确或者芯片有缺陷。

现象4:测试时温度读数异常(PT2站)

检查四个温度传感器U4、R28~R30、U6、R31~R33、U7、R34~R36、U8、R37~R39的匹配电阻是否虚焊,匹配电阻是否虚焊。位于PCB正面,温感3.3V供电正常。

蚂蚁矿机T19算力板维修指南蚂蚁矿机T19算力板维修指南

检查与温度传感器相连的芯片另一侧的散热片焊接质量。如果散热片焊接不好,会影响温差。

六.控制板问题导致以下问题

1、整机不工作

第一步,检查几个电压输出点的电压是否正常。例如3.3V短路,可以先断开U8。如果还是短路,可以拔掉CPU进行测量。对于其他电压异常,一般更换相应的转换器IC。

第二步,如果电压正常,请检查DDR/CPU的焊接情况。

第三步,尝试用SD卡更新Flash程序。

蚂蚁矿机T19算力板维修指南

2、全机找不到IP

大概率是由于运行异常而找不到IP。故障排除请参考第 1 点。

检查网口、网络变压器T1、CPU的外观及焊接情况。

3.整机无法升级

检查网口、网络变压器T1、CPU的外观及焊接情况。

4、整机读取算力板失败,或者链丢失

A. 检查电缆连接状态。

B、检查控制板上与链条对应的部分。

C、检查插件引脚的波峰焊质量和插件接口周围的电阻。

蚂蚁矿机T19算力板维修指南

七.整机故障现象

矿机常见故障症状:检测不到IP、检测到风扇数量异常、检测到链异常。如果测试过程中出现异常,请按照监控界面和测试LOG的提示进行维护。

1、风扇显示异常:

我们要检查风扇是否正常工作,与控制板的连接是否正常,控制板是否有异常;

2. 链条少

更少的链意味着减少 3 个算力板中的一个。大多数情况是算力板和控制板之间的连接有问题。检查电缆是否存在开路。如果连接没有问题,可以对板子进行PT2测试,看看测试是否能够通过。如果能通过,基本可以确定是控制板的问题。若测试失败,则采用修复PT2的方法进行修复;

3、温度异常

一般情况下,温度较高。我们的监控系统设定的最高PCB温度不能超过90°C。如果超过90℃,矿机就会报警,无法正常工作,一般是环境温度过高造成的。另外,风扇运转异常也会引起温度异常;

4、芯片数量不足

如果芯片数量不够,可以参考PT2进行测试和维修;

蚂蚁矿机T19算力板维修指南

1)单板算力较低:这种情况可以通过Putty软件登录IP,观察该单板的域工作电压和NONCE返回是否正常。根据Putty的LOG提示进行修复;

2)具体操作如下:

A.打开输入问题矿机的IP,点击打开;

蚂蚁矿机T19算力板维修指南

B、输入用户名、密码和测试命令,查看NONCE返回和电压域状态。如果NONCE和域电压异常,可以根据打印的异常芯片进行测量和修复。

蚂蚁矿机T19算力板维修指南

另一种情况:测试显示某板稳定,无算力或算力低,单板PT2测试又OK。在这种情况下,取出有问题的算力板,让该算力板用100M的测试固件单独挖矿。当这块板子出现问题时,用万用表测量信号,就可以找到问题所在。

八.其他注意事项

维护流程图:

蚂蚁矿机T19算力板维修指南

~例行检查:首先目视检查待修复的算力板,观察是否有PCB变形、烧焦的情况。如果有,必须先处理;检查零件是否有明显烧伤痕迹、零件撞击偏移或缺件等;其次,目视检查没有问题后,可以先测试各个电压域的阻抗,检测是否存在短路或开路的情况。如果发现,必须首先处理。再次检查各域电压是否有0.36v左右。

~例行检查OK后(一般例行检查的短路检查是必要的,避免上电时因短路而烧毁芯片或其他材料),可以用测试来检查芯片夹具,根据测试夹具的测试结果确定定位。

~根据测试治具的显示结果,从故障芯片附近开始,检查芯片测试点(CO/NRST/RO/XIN/BI)与VDD0V8、VDD1V8等电压。

~然后根据信号流程,反向传输RX信号(76号到1号芯片),正向传输几个信号CLK CO BO RST(1号到76号芯片)芯片),通过供电时序找到异常故障点。

~当定位到故障芯片时,需要重新焊接芯片。方法是在芯片周围添加助焊剂(最好是免清洗助焊剂),将芯片引脚的焊点加热至溶解状态,促使芯片引脚和焊盘重新磨合、合锡,达到重新润锡的目的。 -焊接。如果重新焊接后故障依旧,可直接更换芯片。

~算力板修复后,在测试治具时需要通过两次以上才能判定为良品。第一次更换零件完成后,等待算力板冷却,使用测试治具测试通过,冷却前放置一旁。等待几分钟,让算力板冷却下来,然后再运行第二次测试。

© 版权声明

相关文章

暂无评论

暂无评论...