蚂蚁矿机S17+算力板如何维修?

蚂蚁矿机8个月前发布 YKK
882 0 0

蚂蚁矿机S17+算力板维修指南

版本日期: 2019-11-25

文件类别: 维护计划

本手册内容:介绍S17+算力板如何排查故障以及如何使用算力板测试仪准确定位。

※ 本文版权归Bitmaintech Pte. Ltd.所有。有限公司(比特大陆)。转载、摘录或以任何其他方式使用该文章须经版权人许可。如有转载或引用需求,请联系比特大陆官方客服。

一、维护平台/工具准备

1、平台要求:胶板维修工作台(工作台需接地)、防静电手腕带并接地。

2、恒温烙铁(350-360℃),烙铁头用于焊接贴片电阻、电容等小贴片;热风枪BGA返修台,用于芯片/BGA拆卸和焊接;万用表、焊接钢针和热缩管,方便测量(推荐使用Fluke 15b+);示波器(推荐安捷伦)

3、测试工具要求:APW9+算力板供电电源及电源转接线;1040 S17+控制板算力板测试治具

4、维修辅助材料/工具要求:低温锡膏Alpha OM550、助焊剂、清洗面板水、无水酒精;清洗面板水用于清理维修后的焊锡残留物;导热膏用于维修后涂抹在芯片/散热片上(部分型号需要导热膏);植锡钢网、植球钢网、焊锡丝、焊球(球径建议0.4mm);更换新芯片时,需要先在芯片引脚和BSM表面植锡,然后再焊接到算力板上。

5、常用维修备件材料需求:0402电阻(0R、33R、1K、4.7K、);0201电阻(0R)、0402电容(0.1uf、1uf)

二. 操作要求

1、维修人员必须具备一定的电子知识,一年以上维修经验,精通BGA/QFN/LGA封装焊接技术。

2、修复后的算力板必须测试两次以上,否则视为拒收。

3、更换芯片时请注意操作方法。更换任何配件后PCB板不应有明显变形。检查更换部件及周围是否有断路、短路、缺件等情况。

4、检查工具,确认测试治具是否能正常工作,确定维修站的测试软件参数、测试治具的版本等。

5、维修更换芯片测试通过后,需要对芯片进行全片检查,然后再进行功能测试。功能测试应确保双面散热器焊接良好且冷却风扇全速运转。使用机箱散热功能时,必须同时放置3块算力板,形成风道。生产的单面测试还必须保证风道的形成(重要)。

6. 测量信号时,使用两个风扇辅助散热,风扇保持全速运转(建议使用激光转速计测试风扇转速)。

7. 算力板正面和背面,钢挡风玻璃承受21V电压。测量和维护时,请保持维护台清洁和绝缘,以免维护时发生短路。

蚂蚁矿机S17+算力板如何维修?

8、更换新芯片时,在引脚和BSM表面涂上锡膏,确保芯片在焊接到PCBA上进行预镀锡后进行维护。

9、维护端灯具采用Repair_Mode模式,config配置文件在非扫描模式下测试。测试合格后,生产端从试件开始生产线;售后端正常安装老化(同级安装)。测试配置文件可以从TE获取。

三.算力板测试仪的制作及注意事项

算力板测试仪的配套夹具应满足算力板的散热要求,并便于信号的测量。

1. 校准算力板测试仪。

2、使用测试治具SD卡刷写程序更新控制板FPGA。解压后复制到SD卡并将卡插入夹具卡槽。上电约1分钟,等待控制板指示灯闪烁3次,即可完成更新。

蚂蚁矿机S17+算力板如何维修?图3-1

蚂蚁矿机S17+算力板如何维修?

图3-2

3、按照要求制作测试SD卡。单面散热片使用刷之前的文件制作SD卡;双面散热片使用刷完后的文件制作SD卡。

蚂蚁矿机S17+算力板如何维修?

图3-3

4、生产端的双面测试需要扫码枪和串口工具。详细内容请参考测试流程文件。

5、售后端和外包维护方不需要使用扫码方式(算力板测试仪SD卡配置文件需要更改,可将需求提交给TE,TE将测试config配置文件是否算力板测试仪)。

四.原理概述

1、S17+算力板工作结构:

算力板由65颗BM1397芯片 组成,分为13组,每组由5颗IC组成;S17算力板使用的BM1397芯片工作电压为1.5V;升压电路U6输出最后24.5V给LDO供电,LDO输出1.8V,最后三组和第三组由24.5V DCDC供电输出1.8V,其余组由21V分压供电提供1.8V通过 DCDC。所有 0.8V 均由该域的 1.8V 通过 LDO 输出提供,如图 4-1 所示。

蚂蚁矿机S17+算力板如何维修?蚂蚁矿机S17+算力板如何维修?

图4-1

2、S17算力板升压电路:

升压由电源供电从21V升压到24.5V,如图4-2所示。

蚂蚁矿机S17+算力板如何维修?

图4-2

3、S17芯片信号方向:

3.1 CLK(XIN)信号方向:由Y1 25M晶振产生,从芯片01传输到芯片65。工作时电压为1.45-1.65V(示波器)。用万用表测量电压约为0.7-0.9V。

3.2. TX(CI、CO)信号方向:从IO口7脚(3.3V)输入,经过电平转换传送到IC U2,再从芯片01传送到芯片65;未插入IO线时电压为0V,工作时电压为1.8V。

3.3 RX(RI、RO)信号方向:从芯片65到芯片01,经U1返回信号线端子8脚,返回控制板;未插入IO线时电压为0.3V,工作时电压为1.8V。

3.4 BO(BI、BO)信号方向:从芯片01到芯片65;用万用表测量电压为0V。

3.5 RST信号方向:从IO口的3脚输入,然后从芯片01传输到芯片65;无 IO 信号或待机时为 0V,运行时为 1.8V。

蚂蚁矿机S17+算力板如何维修?

图4-3

4、整体架构:

矿机主要由3块算力板、1块控制板、APW9+电源、4个散热风扇组成,如图4-4所示。

蚂蚁矿机S17+算力板如何维修?

图4-4

五、算力板常见不良现象及处理步骤

现象:单板测试时检测到芯片为0(PT1/PT2站类型)

第一步:首先检查功率输出。请检查图5-1中圈出的部分。

蚂蚁矿机S17+算力板如何维修?

图5-1

第二步:检查电压域电压输出

每个电压域的电压约为1.6V。一般21V供电时会有域电压。最好测量算力板供电端的输出,判断MOS是否短路(测量1、4、8脚之间的电阻)。如果21V有供电但无域电压,继续向下检查。

蚂蚁矿机S17+算力板如何维修?

图5-2

第三步:检查PIC电路

测量U3的第2脚是否有输出,电压约为3.2V;如果是,请继续排查,如果没有3.3V,请检查治具排线与算力板的连接状态是否正常,并重新烧录PIC。

蚂蚁矿机S17+算力板如何维修?

图5-3

蚂蚁矿机S17+算力板如何维修?

图5-4

蚂蚁矿机S17+算力板如何维修?

图5-5

PIC编程流程:

1、编写算术板的PIC程序。

程序:20190908-PIC1704-BHB07602-0x88.hex

下载编程工具:PICkit3;PICkit3电缆的引脚1对应PCB上J3的引脚1,需要连接引脚1、2、3、4、5和6。

蚂蚁矿机S17+算力板如何维修?

图5-6

2、编程软件:

打开MPLAB IPE,选择器件:PIC16F1704,点击power选择供电方式,然后点击operate。第一步:选择文件找到要烧写的.HEX文件。第二步:点击连接即可正常连接。第三步:点击程序按钮,完成后点击验证。会发出提示,证明编程成功。

蚂蚁矿机S17+算力板如何维修?

图5-7

蚂蚁矿机S17+算力板如何维修?

蚂蚁矿机S17+算力板如何维修?

图5-8

第四步:检查升压电路输出

测试图5-9中的D5/D8,测量23-24.5V电压。

蚂蚁矿机S17+算力板如何维修?蚂蚁矿机S17+算力板如何维修?

图5-9

第五步:检查各组LDO 1.8V或PLL 0.8V输出

蚂蚁矿机S17+算力板如何维修?

图5-10

第六步:检查芯片信号输出(CLK/CI/RI/BO/RST)

参考信号方向描述的电压值范围。如果测量遇到电压值偏差较大,可以与相邻组的测量值进行比较。

蚂蚁矿机S17+算力板如何维修?

图5-11

假设芯片信号引脚输出电压正常,如果芯片仍然不完整,例如检测到64芯片,可以通过短接RO上拉电阻R639来排除故障。如果短接后能检测到64个芯片,说明1-64号芯片应该正常,此时可以对第65号芯片进行故障排除。如果短路后检测到63芯片,则向前进行故障排除;建议采用二分法排除故障,即从中间开始测试(从第32个开始

蚂蚁矿机S17+算力板如何维修?

图5-12

故障排除对照表:

蚂蚁矿机S17+算力板如何维修?

2、现象:单板检测芯片不完整(PT1/PT2站)

检查错误位置前后芯片的相关信号(CLK/CI/RI/BO/RST),根据测得异常信号的IC定位不良位置,并参考信号方向和电压范围进行维修。

3、现象:单板模式NG,即响应nonce数据不完整(PT2站型)

串口连接电脑,电脑读取测试日志;根据日志显示的结果,可以确定nonce数据不足的芯片位置;更换相应位置的芯片。

4、现象:测试温度读数异常(PT2站)

检查温度传感电源VDD以及温度传感与芯片(TEMP_P;TEMP_N)之间的连接状态,并检查相应温度传感所连接芯片的焊接质量。

蚂蚁矿机S17+算力板如何维修?

图5-13

蚂蚁矿机S17+算力板如何维修?

图5-14

检查与温度传感器连接的前后芯片散热片的质量。如果散热片焊接不好,会影响温差。

六.控制板问题引起的问题

1.整机不运行

第一步:检查几个电压输出点电压是否正常。如果3.3V短路可以先断开U8。如果短路仍然存在,可以拔掉CPU进行测量。对于其他电压异常,一般更换相应的变压器IC即可。

第二步:如果电压正常,请检查DDR/CPU的焊接状态(生产端X-RAY检查)。

第三步:尝试用SD卡更新Flash程序。

蚂蚁矿机S17+算力板如何维修?

图6-1

2、全机找不到IP

可能是操作异常导致找不到IP。故障排除请参考第 1 点。检查网口、网络变压器T1、CPU的外观及焊接情况。

3.整机无法升级

检查网口、网络变压器T1、CPU的外观及焊接情况。

4、整机读算力板失败或链数较少

A. 检查电缆连接

B、检查控制板上相应链条部分

C、检查管脚的波峰焊质量和插件接口周围的电阻

蚂蚁矿机S17+算力板如何维修?

图6-2

七.整个矿工问题

1、整机初步测试

参考测试工艺文档,一般问题是组装工艺问题和控制板工艺问题。

常见现象:未检测到IP、粉丝数异常、外链异常。

2、全矿机扫频频段

老化导致算力低:检查对应算力板的算力偏差,是否算力差异较大,取出算力偏差较大的算力板进行测试维护。

检查是否存在网络中断导致平均算力偏低的情况。

算力造成温差大:检查老化环境;对于温度较高的算力板,检查算力板散热片的焊接质量。

老化矿机保护:一般需要过温保护,请将老化环境温度控制在40摄氏度以下。

蚂蚁矿机S17+算力板如何维修?

图7-1

少链:

如果检测不到其中一条链,请拆解矿机并测试对应的算力板;若确定算力板故障,则修复算力板;如果确定控制板有故障,则修理控制板。

蚂蚁矿机S17+算力板如何维修?

图7-2

4、售后维护

请参阅上述每个站的故障排除步骤。相关测试流程和算力板测试仪请与售后工程师沟通详细。修复后,请使用非扫描模式测试PT2。

八.其他注意事项

维护流程图

蚂蚁矿机S17+算力板如何维修?

• 例行测试:首先对待修复的算力板进行目视检查,观察PCB是否变形、烧毁。如果是,则必须先处理;检查零件是否有明显烧痕、碰撞偏移或缺件等;其次,如果目视检查没有发现问题,可以先测试各电压域的阻抗,检测是否存在短路或开路的情况。如果是的话,必须先处理。第三,检查各域电压是否在1.5V左右。

• 例行测试OK后(一般例行测试需要进行短路测试,防止上电时因短路烧毁芯片或其他材料),即可使用算力板测试仪进行芯片检测,根据算力板测试仪测试结果确定定位。

• 根据测试治具测试的显示结果,从故障芯片附近开始,测试芯片测试点(CO/NRST/RO/XIN/BI)、 VDD0V8、VDD1V8 等电压。

根据信号方向(RX信号反向传递(从芯片65到1),几个信号CLK CO BO RST正向传递(从芯片1到65),查找异常故障点通过电源顺序。

• 查找到故障芯片后,需要重新焊接芯片。方法是在芯片周围添加助焊剂(最好是免清洗助焊剂),将芯片引脚的焊点加热到溶解状态,以促进芯片引脚和焊盘重新运行,然后除锡最后,从而达到重新镀锡的效果。如果重新焊接后故障依旧,则直接更换芯片。

• 修复后的算力板通过两次以上夹具测试即可判定为良品。第一次,更换配件完成后,等待算力板冷却并进行治具测试,合格后放置一边冷却;第二次,等待几分钟,待算力板完全冷却后再进行测试。

• 单板返修后,应准备相关维修/分析记录(维修报告要求:日期、SN、PCB版本、标签号、不良原因、不良责任归属等),反馈给生产、售后、研究和开发部门。

• 记录准备好后,安装整机进行常规老化。

• 生产端修复好的产品应从生产第一工位开始流水生产(至少进行外观检查,并从PT1/PT2测试工位开始)

© 版权声明

相关文章

暂无评论

暂无评论...