蚂蚁矿机D7算力板维修指南

蚂蚁矿机1年前 (2023)发布 YKK
1.5K 0 0

本文内容:主要讲述蚂蚁矿机D7各种故障的排除以及如何使用测试治具进行准确定位。ZEUS MINING 组织内容、排版和共享。

Ⅰ. 维修平台/工具/设备的准备要求

1、平台要求:

防静电维护工作台(工作台需接地)、防静电腕带及接地。

2、设备要求:

(1)恒温烙铁(350℃-380℃),尖头烙铁头用于焊接贴片电阻、电容等小贴片;

(2)采用热风枪和BGA返修台进行芯片/BGA拆焊;

(3) 带焊接钢针和热缩套管的万用表,方便测量( 推荐使用Fluke 15b+万用表);

(4)示波器(推荐示波器UTD2102CEX+)、网线(要求:互联网连接、网络稳定)

3、测试工具要求:

(1)APW12电源:AP12_12V-15V_V1.2和电源适配器线(自制:电源正负极使用粗铜线连接电源和电源板,建议使用长度小于60cm的4AWG铜线,仅限PT1和维护测试用),用于算力板供电;

(2) 使用V2.3控制板的测试治具(测试治具材料号ZJ0001000001)。测试治具正负极需安装放电电阻。建议使用20欧姆、100W以上的水泥电阻。

4、维修辅助材料/工具要求:

(1) 138°C锡膏、助焊剂、机械无铅电路板清洁剂和无水酒精;

(2)机械式无铅电路板清洁剂 用于清理维修后的助焊剂残留物;

(3) 修复后的芯片表面使用导热凝胶涂抹;

(4)植球钢网、吸锡线焊球 (推荐球径0.4mm);

(5)更换新芯片时,需要将芯片引脚镀锡,然后焊接到算力板上。将导热胶均匀涂抹在芯片表面,然后锁紧散热片。

(6)串口扫码器

(7)串口转接板 RS232转TTL 转接板3.3V。

(8)自制短路探头(使用插针接线焊接,需要加热缩套,防止探头与小散热片短路)。

5、常用维修备件材料要求:

0402电阻 (0R、51R、10K、4.7K、);

0402电容 (0.1uF、1uF)

二. 维护要求

1、更换芯片时要注意操作方法。更换任意配件后,PCB板无明显变形。检查更换零件及周边零件是否有缺件、断路、短路现象。

2、维修人员必须具备一定的电子知识,一年以上维修经验,精通BGA/QFN/LGA封装焊接技术。

3、修复后算力板必须测试两次以上全部OK才能通过!

4、检查工具、测试治具是否能正常工作,确定维修站测试软件的参数、测试治具的版本等。

5、维修更换芯片的测试,需要先对芯片进行测试,通过后再进行功能测试。功能测试必须保证小散热片焊接OK,大散热片安装到位(每块导热胶必须涂抹均匀,然后安装大散热片),并且冷却风扇全速运转。使用机箱散热时,应同时放置两块算力板,形成风道。生产的单面测试还要保证风道成型(重要)

6. 测量信号时,辅助4个风扇散热,风扇保持全速运转。

7、算力板通电时,先连接电源负极铜线,再连接电源正极铜线,最后插入信号线。拆卸时,安装顺序必须相反。首先拆下信号线,然后拆下电源正极铜线,最后拆下电源负极铜线。如果不按照这个顺序,很容易造成U1和U2损坏(不是所有芯片都能找到)。在测试Pattern之前,修复后的算力板必须先冷却后再进行测试,否则会导致测试PNG。

8、更换新芯片时,刷引脚和焊膏,确保芯片预镀锡,然后焊接到PCBA上进行修复。

9、维护侧的测试治具均在Test_Mode模式和扫码模式下进行测试。测试通过后,生产方将从第一个测试站开始精简,正常安装老化(按同级安装)。

三.测试治具制作及注意事项

测试治具应满足操作板的散热,以利于信号的测量。

1.获取零件号:ZJ0001000001测试夹具

2、首次使用19系列测试治具SD卡刷程序更新测试治具控制板的FPGA。解压后复制到SD卡中,并将卡插入测试治具卡槽;上电后等待约1分钟,等待控制板指示灯双闪3次,更新完成;(如果不更新,可能会导致测试时某个芯片报坏)。

蚂蚁矿机D7算力板维修指南

3、根据要求制作测试SD卡,单面散热片检测芯片,直接解压压缩包制作SD卡;PT1无需扫码;软件版本是蚂蚁矿机D7算力板维修指南. 将以下文件复制到SD卡中,制作完成。

蚂蚁矿机D7算力板维修指南

4、按照要求制作测试SD卡。双面散热片8x Pattern测试需要制作SD卡,如下图;PT2测试需要插入码枪和网线。软件版本为蚂蚁矿机D7算力板维修指南,将以下内容复制到SD卡即可完成制作;

蚂蚁矿机D7算力板维修指南

5、生产端、后端销售端、外包维护端使用双面8x Pattern测试时,需要配套的扫码器和串口工具。详细内容请参考D7测试指导文档。

四.原理概述

1、D7​​算力板工作结构:

D7算力板由70颗蚂蚁矿机BM1764 芯片组成,分为35个域,每个域由2个ASIC芯片组成;D7算力板使用的BM1764芯片工作电压为0.3V;升压电路U238输出的20V电压经线性稳压器(U295 U16 U14 U307 U310 U313)输出为29、30、31、32、33、34组(共6组)提供1.8V,为LDO提供1.8V供电,将1.8V给LDO(U294 U15 U13 U306 U309 U312 U187 U188 U190 U191 U193 U194)输出0.8V。第28组-第1组和第35组由VDD 13V通过LDO提供1.8V、1.8V再通过线性稳压器提供0.8V,域电压约为0.3V。如图所示:

第 28 组 – 第 1 组和第 35 组

蚂蚁矿机D7算力板维修指南

第 29-34 组

蚂蚁矿机D7算力板维修指南蚂蚁矿机D7算力板维修指南

2、BXD34601算力板升压电路:

升压由电源13V供电,转为20V,如图。

蚂蚁矿机D7算力板维修指南蚂蚁矿机D7算力板维修指南

3、D7芯片信号方向:

(1) CLK(XIN)信号流由Y2 25MHZ晶振产生,从01号芯片传输到70号芯片;电压约为0.9V;

(2)RST、CI信号流从J3的第3脚(3.3V)进入,经过电平转换IC U1-U3-U4转换,然后从01号芯片传输到70号芯片;

(3)RX(RI、RO)信号流向是从70号芯片流向01号芯片,经U2返回信号线端子8脚,再返回控制板;

(4)BO(BI,BO)信号流向,从01号芯片到70号芯片;

4. 整个矿机的结构:

整机主要由3块算力板、1块蚂蚁矿机D7控制板、APW12电源、4个散热风扇组成,如图:

蚂蚁矿机D7算力板维修指南

Ⅴ. 算力板常见问题及排查步骤

现象一:单板测试检测到芯片为0(PT1/PT2站)

第一步:先检查功率输出,请检查下图中圈出部分的电压。

蚂蚁矿机D7算力板维修指南蚂蚁矿机D7算力板维修指南

第二步:检查电压域的电压输出

每个电压域的电压约为0.3V,13V电源一般都有该域电压。优先测量算力板供电端的输出,以及MOS是否短路(测量1、4、8脚之间的电阻值)。如果13V供电但无域电压,继续检查。

蚂蚁矿机D7算力板维修指南

第三步:检查PIC电路

测量U6的11脚是否有输出(3.3V)。如果是,请继续排查问题。如果没有,请检查测试治具电缆与算力板的连接是否正常,并重新烧写PIC。

蚂蚁矿机D7算力板维修指南蚂蚁矿机D7算力板维修指南

PIC编程步骤:

(1)烧写算力板的PIC程序。

下载编程工具:PICkit3.5编程器,PICkit3电缆的1脚对应PCB板上J3的1脚,需要连接到1、2、3、4、5、6脚。

蚂蚁矿机D7算力板维修指南

(2)烧录软件:

① 打开MPLAB IPE,选择器件:PIC16F1704;

②点击Power,选择供电方式,然后点击Operate;

③ 选择文件找到要烧录的.HEX文件;

④ 点击连接,连接正常

⑤ 单击“程序”按钮

⑥ 完成后,点击Verifiy,提示验证完成,证明刻录成功。

蚂蚁矿机D7算力板维修指南蚂蚁矿机D7算力板维修指南

第四步:检查升压电路的输出,测试下图中的C69,可测到电压为20V。

蚂蚁矿机D7算力板维修指南

第五步:检查各组LDO 1.8V或PLL 0.8V输出。

第 28 组 – 第 1 组和第 35 组

蚂蚁矿机D7算力板维修指南

第 29-34 组

蚂蚁矿机D7算力板维修指南

第六步:检查芯片信号输出(CLK/CI/RO/BI/RST)

参考信号方向描述的电压值范围,如果测量遇到电压值偏差较大,可以与相邻组的测量值进行比较。

蚂蚁矿机D7算力板维修指南

当测试治具液晶屏显示EEPROM NG时,检查U10是否焊接正常;

蚂蚁矿机D7算力板维修指南

当测试治具液晶屏显示PICsensor NG时,表示测试读数温度异常。请按照以下步骤进行故障排除:

a) 检查四个电阻R214、R215、R1071、R1076是否焊接异常;

b) 检查U5、U7、U8、U9温度传感器芯片的焊接是否正常,温度传感器位置如图所示,还需要检查温度传感器芯片的3.3V电源是否正常;检查温度传感器与小散热片连接的芯片的焊接质量,大散热片材料的变形会导致芯片散热不良,影响温差。

蚂蚁矿机D7算力板维修指南

现象二:单板检测缺芯片(PT1/PT2站)

a) 当测试治具液晶屏显示ASIC NG:(0)时,先测量测量域总电压及升压电路20V正常,然后用短路探头短路RX测试点和1号和2号之间的1V8测试点,然后运行程序。查看串口日志,如果此时仍然发现0个chip,则属于以下情况之一:

a-1) 用万用表测量1V8、0V8测试点电压是否为1.8V、0.8V。如果不是,可能是该域的1.8V、0.8V LDO电路异常,或者是该域的两块ASIC芯片没有焊接好,大部分是0.8V、1.8V的短路造成的贴片滤波电容(测量计算与测力台相关的贴片滤波电容的阻值)。

a-2) 检查U1、U2、U5电路是否异常,如电阻虚焊等。

a-3) 检查第一个芯片是否有引脚未焊好(维修时发现,引脚从侧面镀锡,但拆下芯片后发现引脚根本没有镀锡) 。

b) 如果在步骤a)中能找到一个芯片,则说明第一个芯片和前面的电路都是好的,后面的芯片以类似的方式检查。例如,将第38、39芯片之间的1V8测试点和RO测试点短接。如果日志可以找到38个芯片,则前38个芯片没有问题;如果仍然找到0个芯片,首先检查1V8是否正常。如果正常,说明38以后的芯片有问题,继续二分,直到找到有问题的芯片。假设第N个芯片有问题,那么当第N-1个和第N个芯片之间的1V8和RO短路时,可以找到N-1个芯片,但是第N个和第N+1个之间的1V8和RO短路可以找到芯片。当发生短路时,就无法找到整个芯片。

c) 当LCD显示ASIC 69:(报告69)时,表示算力板可以在500M频率下检测到69个芯片;通过短路法找到对应的芯片位置后,首先检查测试结果是否相同,如果相同则说明芯片坏,需要更换芯片;

d) 维修方法:采用二分法,通过短接探头,将第38、39号芯片之间的1V8测试点和RX测试点短路。如果日志可以找到38个芯片,那么前38个芯片没有问题;如果47个芯片短路,日志报46个芯片,说明检测不到第47个芯片,外观检查没有问题。一般可以更换47号芯片(也可以将46和47互换,如果互换后,如果46芯片短路并报45,则可以确定是芯片问题,应更换46号芯片);

e) 当液晶显示ASIC NG:(固定报告某个芯片)时,可分为以下两种情况:

第一种情况:通常每次测试报告时芯片的值不会改变。这种情况,可按照正常测量信号电压的维修方法进行维修。

现象3:回复nonce数据不完整(PT2站)

PS:需要特别注意的是,asic的编号是从0、000-069开始的

蚂蚁矿机D7算力板维修指南

现象4:测试芯片测试正常,PT2功能显示PLUG OFF BEFORE TEST OVER。

这是因为测试时软件设置了延迟,测试仪在电压降到0之前拔掉了电缆,需要重新启动治具才能测试。

PT2测试环境要求: PT2测试环境温度应在20℃至30℃之间。当环境温度超过35℃时,软件将停止测试。

PT2测试电源要求:当PT2测试治具电源负载1500瓦时(测试单板的情况),实际输出电压不能低于配置文件中设定的0.03V。(例如配置文件要求试产15V,那么电源在1500瓦负载时输出电压不能低于14.97V)

Ⅵ. 控制板问题会导致以下问题

1、整机不工作

7007控制板

(1)检查几个电压输出点的电压是否正常,3.3V短路可以先断开U8,如果还是短路,可以拔掉CPU进行测量。对于其他电压异常,一般更换相应的转换器IC。

(2) 如果电压正常,请检查DDR/CPU的焊接情况(生产端X-RAY检查)

(3)尝试用SD卡更新Flash程序;

如果控制板卡刷卡的矿机需要正常启动,需要执行以下两个步骤:

a) 刷卡成功后,绿色LED指示灯常亮,关闭电源重新启动;

b) 再次上电后等待30秒(开启OTP的时间过程)

c) OTP(One Time Programable)是MCU的一种存储器类型,意思是一次性可编程:程序烧录到IC后,不能再次更改或清除;

防范措施:

(1)OTP开启过程中突然断电或时间未达到30s会导致控制板无法开启OTP功能,控制板无法启动(未联网),U1(控制板主控IC FBGA)需要更换。U1不能再用于D7系列;

(2)如果控制板带OTP功能,U1不能在其他系列机型上使用;

蚂蚁矿机D7算力板维修指南

半导体控制板

如果无法进入网页,可能是控制板没有烧录,先使用镜像文件和加密文件烧录,烧录后升级IM或OM进行测试。

2、全机找不到IP

大概率是由于运行异常导致找不到IP。故障排除请参考第 1 点。

检查网口、网络变压器T1、CPU的外观及焊接情况。

3.整机无法升级

检查网口、网络变压器T1、CPU的外观及焊接情况。

4、整机无法读取操作板或链缺失

A. 检查电缆连接。

B、检查控制板上与链条对应的部分。

C、检查排座引脚的波峰焊接质量和插件接口周围的电阻。

蚂蚁矿机D7算力板维修指南

Ⅶ. 整机故障现象

1、整机初步测试

参考测试工艺文件,一般问题是组装工艺问题和控制板工艺问题。

常见现象:检测不到IP、检测到风扇转速异常、检测到链条异常。如果测试过程中出现异常,应根据监控界面和测试LOG提示进行修复。整机初次测试和老化测试的修复方法相同。

蚂蚁矿机D7算力板维修指南

2、老化测试:老化测试时,应根据监控的接口测试进行维护,如;

1)风扇显示异常:我们需要检查风扇工作是否正常,与控制板的连接是否正常,控制板是否异常。

2)少链条:少链条是指3块板少了1块板。大多数情况是算力板和控制板之间的连接有问题。检查电缆是否有断路。如果连接正常,可以测试PT2的板子,看是否可以测试。如果可以测试,基本可以确定是控制板;如果测试失败,则使用PT2的修复方法。

3)温度异常:一般是温度较高。我们的监控系统设定的最高PCB温度不能超过90°C。如果超过90℃,矿机就会报警,无法正常工作。一般是环境温度过高,风扇运转异常也会造成温度异常。

4)找不到所有芯片(同样可以开启,但算力是正常值的2/3或1/3),芯片数量不够:如果芯片数量不够,则可以参考PT2进行测试和修复。

5)运行一段时间后,没有算力,矿池连接中断,检查网络;

蚂蚁矿机D7算力板维修指南

6)正常好的矿机老化测试状态:

蚂蚁矿机D7算力板维修指南

7)单板测试正常,但整机组装测试后,有一块板算力较低:第一块板运行约3分钟后算力没有。

具体分析方法如下:

① 先测试一下板子PT2,看板子是否OK。如果测试芯片没有全部检查完毕,则修复板子。如果测试后齿轮正常,则单独取出板子,用测试治具固定。工具运入Debug主控芯片程序进行挖矿,风扇转速调试至100%。电压和频率调整为整机工作电压和频率。让矿工挖矿,看看矿工是否损失算力。

② 如果矿机仍然损失算力,则将频率降低至400M,其他条件不变。让矿机挖矿看看是否会丢算力,算力板是否会打X,如果还是打X丢算力,则可以拆掉算力板散热片进行挖矿,等待算力下降,测量域电压是否正常。一般情况下,问题域的域电压会出现异常。然后测量RI信号,看RI信号是否断线。如果RI信号缺失,基本上是芯片短路或镀锡后损坏。

Ⅷ. 其他注意事项

维护流程图

蚂蚁矿机D7算力板维修指南

1、例行检查:首先对待维修的算力板进行目视检查,看是否有PCB变形、烧焦的情况。有的话必须先处理;零件是否有明显的烧痕、零件撞击偏移或缺件等;其次,目视检查没有问题后,可以先测试各个电压域的电阻值,检测是否存在短路或开路的情况。如果发现,必须首先处理。再次检查各域电压是否在0.32V左右。

2、例行检查OK后(一般例行检查的短路检查是必要的,避免上电时因短路烧毁芯片或其他材料),可以用测试进行芯片检查夹具,根据测试夹具的测试结果确定定位。

3、根据测试治具的显示结果,从故障芯片附近开始,检查芯片测试点(CO/NRST/RX/XIN/BI)和VDD0V8、VDD1V8等电压。

4、根据信号流向,RX信号反向传输(芯片70到1),其中几个信号CLK CO BO RST正向传输(1-70),异常故障点通过供电时序可以找到。

5. 找到故障芯片后,需要重新焊接芯片。方法是在芯片周围添加助焊剂(最好是免清洗助焊剂),将芯片引脚的焊点加热至溶解状态,促使芯片引脚和焊盘重新磨合、合锡,从而达到达到有效的复镀锡效果。如果重新焊接后故障仍然存在,则可以直接更换芯片。

6、算力板修复后,测试治具测试时,必须通过两次以上才能判定为良品。第一次,更换零件后,等待算力板冷却,使用测试夹具测试通过,冷却前放置一旁。第二次,等待几分钟,让算力板完全冷却后再进行测试。

7、算力板修复后OK。需要做好相关维修/分析记录(维修报告要求:日期、SN、PCB版本、标签号、故障原因、故障责任归属等)。准备反馈到生产、售后、研发。

8、烧录完成后安装到完整矿机中进行定期老化。

9、生产端修复好的产品应从生产第一站开始精简(至少外观检验和PT1/PT2测试站)。

10、修复后的算力板必须把大散热片拆掉,重新刷导热胶才可以精简!

© 版权声明

相关文章

暂无评论

暂无评论...