蚂蚁矿机T17e算力板如何维修?

蚂蚁矿机10个月前发布 YKK
1K 0 0

蚂蚁矿机T17e算力板维修指南

发布日期:2019-11-25

文件类别: 维护计划

本卷内容:主要讲述如何排查T17e算力板的各种故障,以及如何使用测试治具进行准确定位。

※ 本文版权归Bitmaintech Pte. Ltd所有。(比特大陆)。转载、摘录或以任何其他方式使用该文章须经版权人许可。如有转载或引用需求,请联系比特大陆官方客服。

一、维护平台/工具/设备准备要求

1、平台要求:

橡胶垫维护平台(平台需接地)、防静电腕带及接地线。

2、设备要求:

恒温烙铁(350-360℃),尖头烙铁头用于焊接贴片电阻、电容等小贴片;热风枪BGA返修台,用于芯片/BGA拆卸和焊接;万用表、焊接钢针和热缩管,方便测量(推荐使用Fluke 15b+);示波器(推荐安捷伦)

3.测试工具要求:

APW9+算力板供电电源(APW9​​+_14.5V-21V_V2.01(470uF450V))及电源转接线(自制);2.1040控制板测试夹具(夹具零件号ZJ0001000001)

4.维修辅助材料/工具要求:

低温锡膏Alpha OM550、助焊剂锡膏、面板清洗水、无水酒精;清洗面板水用于清理维修后的焊锡残留物;导热膏用于维修后涂抹在芯片/散热片上(部分型号需要导热膏);植锡钢网、植球钢网、焊锡丝、焊球(球径建议0.4mm);更换新芯片时,需要先在芯片引脚和BSM表面植锡,然后再焊接到算力板上。您还可以选择简单便捷的比特大陆蚂蚁矿机算力板维修包,其中包含必要的蚂蚁矿机维修工具。

5.常用维修备件需求:

0402电阻(0R、33R、1K、4.7K、);0201电阻(0R)、0402电容(0.1uf、1uf)

二. 维护要求

维修人员必须具备一定的电子知识,一年以上维修经验,精通BGA/QFN/LGA封装焊接技术。

1、修复后的算力板必须测试两次以上,否则视为拒收。

2、更换芯片时请注意操作方法。更换任何配件后PCB板不应有明显变形。检查更换部件及周围是否有断路、短路、缺件等情况。

3、检查工具,确认测试治具是否能正常工作,确定维修站的测试软件参数、测试治具的版本等。

4、维修更换芯片测试通过后,需要对芯片进行全片检查,然后再进行功能测试。功能测试应确保双面散热器焊接良好且冷却风扇全速运转。使用机箱散热功能时,必须同时放置3块算力板,形成风道。生产的单面测试还必须保证风道的形成(重要)。

5. 测量信号时,使用两个风扇进行辅助散热,风扇保持全速运转(建议使用激光转速计检查散热风扇的转速。)

6. 算力板正反面,钢挡风玻璃承受20V电压。测量和维护时,请保持维护台清洁和绝缘,以免维护时发生短路。

蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?

图2-1

7、更换新芯片时,在引脚和BSM表面涂上锡膏,确保芯片在焊接到PCBA上之前已预镀锡,以便进行维护。

8、维护端灯具采用Repair_Mode模式,config配置文件在非扫描模式下测试。测试合格后,生产端从试件开始生产线;售后端正常安装老化(同级安装)。测试配置文件可以从TE获取。

三.夹具制作及注意事项

 

夹具的支撑夹具应满足算力板的散热要求,并便于信号的测量。

1. 采集材料编号:ZJ0001000001 测试夹具

2、使用测试治具SD卡刷写程序更新控制板FPGA。解压后复制到SD卡并将卡插入夹具卡槽。上电约1分钟,等待控制板指示灯闪烁3次,即可完成更新。

蚂蚁矿机T17e算力板如何维修?图3-1

蚂蚁矿机T17e算力板如何维修?

图3-2

3、按照要求制作测试SD卡。单面散热片使用刷之前的文件制作SD卡;双面散热片使用刷完后的文件制作SD卡(供生产分包商批量测试)

蚂蚁矿机T17e算力板如何维修?

图3-3

4、生产端的双面测试需要扫码枪和串口工具。详细内容请参考测试流程文件。

5.售后端和外包维护方不需要使用扫码方式(治具SD卡配置文件需要更改,可以将需求提交给TE,TE会对治具的config配置文件进行测试)。

四.原理概述

1、T17e算力板工作结构:

算力板由78颗BM1396芯片 组成,分为13组,每组由6颗IC组成;T17e算力板使用的BM1396芯片工作电压为1.35V;升压电路U6输出最后24.5V给LDO供电,LDO输出1.8V,最后两组由24.5V DCDC供电输出1.8V,其余组由17.65V分压供电,通过疾病预防控制中心。所有 0.8V 均由该域的 1.8V 通过 LDO 输出提供,如图 4-1 所示。

蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?

图4-1

2、T17e算力板升压电路:

升压由电源供电从21V升压到24.5V,如图4-2所示。

蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?

图4-2

3、T17e芯片信号方向:

3.1 CLK(XIN)信号方向:由Y1 25M晶振产生,从芯片01传输到芯片44。工作时电压为1.45-1.65V(示波器)。万用表测量值约为0.7-0.9V。

3.2 TX(CI、CO)信号方向:从IO口7脚(3.3V)输入,经过电平转换传送到IC U2,再从芯片01传送到芯片78;未插入IO线时电压为0V,工作时电压为1.8V。

3.3 RX(RI、RO)信号方向:从芯片78到芯片01,经U1返回信号线端子8脚,返回控制板;未插入IO线时电压为0.3V,工作时电压为1.8V。 

3.4 BO(BI、BO)信号方向:从芯片01到芯片44;用万用表测量时测量值为0V。 

3.5 RST信号方向:从IO口的3脚输入,然后从芯片01传输到芯片78;无 IO 信号或待机时为 0V,运行时为 1.8V。

蚂蚁矿机T17e算力板如何维修?

图4-3

4、整体架构:

矿机主要由3块算力板、1块T17e控制板、APW9+电源、4个散热风扇 组成,如图3-4所示。

蚂蚁矿机T17e算力板如何维修?

图4-4

五、算力板常见不良现象及排除步骤

现象:单板测试时检测到芯片为0(PT1/PT2站类型) 

第一步:首先检查功率输出。请检查图5-1中圈出的部分。

蚂蚁矿机T17e算力板如何维修?

图5-1

第二步:检查电压域电压输出

每个电压域的电压约为1.35V。一般情况下,17.65V供电时会有一个域电压。最好测量算力板供电端的输出,判断MOS是否短路(测量1、4、8脚之间的电阻)。如果17.65V有供电但无域电压,则继续向下检查(特别注意各域之间的电压必须平衡,最大差值不能超过0.2V)。

蚂蚁矿机T17e算力板如何维修?

图5-2

第三步:检查PIC电路

测量U3的第2脚是否有输出,电压约为3.2V;如果是,请继续排查,如果没有3.3V,请检查治具排线与算力板的连接状态是否正常,并重新烧录PIC。

蚂蚁矿机T17e算力板如何维修?

图5-3

蚂蚁矿机T17e算力板如何维修?

图5-4

蚂蚁矿机T17e算力板如何维修?

图5-5

PIC编程流程:

1、编写算术板的PIC程序。

程序:

蚂蚁矿机T17e算力板如何维修?

下载编程工具:PICkit3;PICkit3电缆的引脚1对应PCB上J3的引脚1,需要连接引脚1、2、3、4、5和6。

蚂蚁矿机T17e算力板如何维修?

图5-6

2、编程软件:

打开MPLAB IPE,选择器件:PIC16F1704,点击power选择供电方式,然后点击operate。第一步:选择文件找到要烧写的.HEX文件。第二步:点击连接即可正常连接。第三步:点击程序按钮,完成后点击验证。会发出提示,证明编程成功。

蚂蚁矿机T17e算力板如何维修?

图5-7

蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?
图5-8

第四步:检查升压电路输出

测试图4-9中的D5/D8,测量23-24.5V电压。

蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?

图5-9

第五步:检查各组LDO 1.8V或PLL 0.8V输出

蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?

图5-10

第六步:检查芯片信号输出(CLK/CI/RI/BO/RST)

参考信号方向描述的电压值范围。如果测量遇到电压值偏差较大,可以与相邻组的测量值进行比较。同时请注意,如果第一个电压域的 CLOK CI RSET 第一个芯片的输入引脚焊锡不足或断线,单板测试会返回 ASIC 0。

蚂蚁矿机T17e算力板如何维修?

图5-11

假设芯片信号引脚输出电压正常,如果芯片仍然不完整,例如检测到77芯片,可以通过短接该域的RO和1.8V来排除故障。如果短接后能检测到77芯片,说明1-77芯片应该正常,此时可以对78芯片进行故障排除。如果短路后检测到76芯片,则继续排除故障;建议采用二分法排查,即从中间开始测试(检查第39,每个域都可以这样操作)。

蚂蚁矿机T17e算力板如何维修?

图5-12

2、现象:单板检测芯片不完整(PT1/PT2站)

检查错误位置前后芯片的相关信号(CLK/CI/RI/BO/RST),根据测得异常信号的IC定位不良位置,并参考信号方向和电压范围进行维修。

3、现象:单板模式NG,即响应nonce数据不完整(PT2站型)

串口连接电脑,电脑读取测试日志;根据日志显示的结果,可以确定nonce数据不足的芯片位置;更换相应位置的芯片。

4、现象:测试温度读数异常(PT2站)

检查温度传感电源VDD以及温度传感与芯片(TEMP_P;TEMP_N)之间的连接状态,并检查相应温度传感所连接芯片的焊接质量。

蚂蚁矿机T17e算力板如何维修?

图5-13

蚂蚁矿机T17e算力板如何维修?

图5-14

检查与温度传感器连接的前后芯片散热片的质量。如果散热片焊接不好,会影响温差。

六.控制板问题引起的问题

1.整机不运行

第一步:检查几个电压输出点电压是否正常。如果3.3V短路可以先断开U8。如果短路仍然存在,可以拔掉CPU进行测量。对于其他电压异常,一般更换相应的变压器IC即可。

第二步:如果电压正常,请检查DDR/CPU的焊接状态(生产端X-RAY检查)。

第三步:尝试用SD卡更新Flash程序。

蚂蚁矿机T17e算力板如何维修?

图6-1

2、全机找不到IP

可能是操作异常导致找不到IP。故障排除请参考第 1 点。检查网口、网络变压器T1、CPU的外观及焊接情况。

3.整机无法升级

检查网口、网络变压器T1、CPU的外观及焊接情况。 

4.整机读算力板失败或链数较少

A.检查电缆连接

B、检查控制板上相应链条部分

C.检查管脚波峰焊质量及插件接口周围电阻

蚂蚁矿机T17e算力板如何维修?

七.矿工失败

1、整机初步测试

参考测试工艺文档,一般问题是组装工艺问题和控制板工艺问题。

常见现象:未检测到IP、粉丝数异常、外链异常。

2、全矿机扫频频段

扫频时扫描坏码定义见表7-1

蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?蚂蚁矿机T17e算力板如何维修?

3. 矿机老化及矿场运营部分

老化算力低:检查对应算力板的算力偏差,是否存在较大算力差异。取出算力差异较大的算力板进行测试和维护。检查网络是否因中断而导致平均算力较低。

老化温差大:检查老化环境;对于高温板,检查算力板散热片的焊接质量。

矿机老化保护:一般是过温保护。请将老化环境温度控制在40摄氏度以下。

蚂蚁矿机T17e算力板如何维修?

图7-1

少链:

若检测不到其中一条链,则需将矿机拆解并在对应的算力板上进行测试;如果确定算力板故障,则维修算力板;如果测试控制板故障,则维修控制板。

4、售后维护

请参考上述步骤进行故障排除。相关测试流程及测试治具的使用请与售后工程师沟通了解使用详情。修复后,可以使用非扫描模式测试PT2。

八.其他注意事项

维护流程图

蚂蚁矿机T17e算力板如何维修?

图8-1 维护流程图

•例行测试:首先对待修复的算力板进行目视检查,观察PCB是否变形、烧毁。如果是,则必须先处理;检查零件是否有明显烧痕、碰撞偏移或缺件等;其次,如果目视检查没有发现问题,可以先测试各电压域的阻抗,检测是否存在短路或开路的情况。如果是的话,必须先处理。第三,检查各域电压是否在1.5V左右。

•例行测试OK后(一般例行测试需要进行短路测试,防止上电时因短路烧毁芯片或其他材料),即可使用测试治具进行测试。进行芯片检测,并根据测试治具测试结果确定定位。

•根据测试治具测试的显示结果,从故障芯片附近开始,测试芯片测试点(CO/NRST/RO/XIN/BI)、VDD0V8、VDD1V8等电压。

•根据信号方向(RX信号反向传递(从芯片65到1),几个信号CLK CO BO RST正向传递(从芯片1到65),查找异常故障点通过电源顺序。

•当定位到故障芯片时,需要重新焊接芯片。方法是在芯片周围添加助焊剂(最好是免清洗助焊剂),将芯片引脚的焊点加热到溶解状态,以促进芯片引脚和焊盘重新运行,然后除锡最后,从而达到重新镀锡的效果。如果重新焊接后故障依旧,则直接更换芯片。

•修复后的算力板通过两次以上夹具测试即可判定为良品。第一次,更换配件完成后,等待算力板冷却并进行治具测试,合格后放置一边冷却;第二次,等待几分钟,待算力板完全冷却后再进行测试。

•单板返修后,应准备相关维修/分析记录(维修报告要求:日期、SN、PCB版本、标签号、不良原因、不良责任归属等),反馈给生产、售后、研究和开发部门。

•记录准备好后,安装整机进行常规老化。

•生产端修复好的产品应该从生产第一站开始流水生产(至少进行外观检查,从PT1/PT2测试站开始)!

© 版权声明

相关文章

暂无评论

暂无评论...