蚂蚁矿机S19XP算力板如何维修?

蚂蚁矿机10个月前发布 YKK
3.6K 0 0

一、维护平台/工具/设备准备要求

1、平台要求:

防静电维修工作台(工作台需接地),维修人员必须佩戴防静电手腕带。

2、设备要求:

(1)恒温烙铁(350C°-380C/662F°-716F),尖头烙铁头用于焊接贴片电阻、电容等小芯片。

(2)热风枪和加热平台(350C-400C)。

(3)BGA维修工作台适用于芯片/BGA拆装和焊接。

(4)万用表(推荐使用Fluke 17B+  )配有焊接钢针和热缩套管,方便测量。

(5) 示波器( 推荐使用UTD2102CEX+示波器)。

(6)网线(要求:连接互联网、网络稳定)。

3、测试工具要求:

(1)使用APW12电源(APW1212V-15V和电源适配器线)搭建测试平台:电源正负极使用粗铜线,然后连接PSU和算力板。算力板供电建议使用长度小于60cm的6AWG铜线。

(2)使用V2.1010控制板的测试治具(型号为ZJ0001000001),测试治具电源正负极需加装放电电阻,建议使用25欧姆及100W以上水泥电阻。

4、修复辅助材料:

锡膏千柱M705、助焊剂、洗板水、无水酒精、导热凝胶、植球钢网、吸锡丝、锡球(球径建议0.4mm)

(1)电路板清洗液用于清理维修后的助焊剂残留物

(2) 在维护后的芯片表面涂抹导热胶(规格:FujipolySPG-30B)。

(3)更换芯片时,需要先在芯片引脚上植锡,然后再焊接到算力板上。将导热胶均匀涂抹在芯片表面,然后安装大散热片。

5、维修辅助工具:

(1)扫描枪:推荐ZD2200有线扫描枪

(2) 转接板 RS232/TTL转接板 3.3V

(3)自制短路探头采用针线焊接,需加热缩套管,防止探头与小散热片短路。

6、常用维修备件材料要求:0402电阻(0R、51R、10K、4.7K)、0402电容(0.1uF、1uF)。

二. 工作要求

1、维修人员必须具备一定的电子知识,一年以上维修经验,精通BGA/QFN/LGA封装焊接技术。

2、维护后算力板必须测试两次以上且结果为0K,才能通过!

3、更换芯片时要注意焊接工艺。更换任何配件后,PCB板不会变形。检查更换的部件及周围是否有缺件、断路、短路等情况。

4、对于芯片维修更换的测试,需要先对芯片进行检测,合格后再做功能测试。功能测试必须保证小散热片焊接良好,大散热片安装到位(大散热片安装前必须将每种导热胶涂抹均匀)。并且冷却风扇全速运转。要利用机箱散热,必须同时放置两块算力板,形成风道。生产的单面测试还必须保证风道的形成(重要)。

5、算力板通电时,必须先连接电源负极铜线,再连接电源正极铜线,最后插入信号线。拆卸时,安装顺序必须颠倒,先拆信号线,再拆电源正极铜线,最后拆电源负极铜线。如果不按照这个顺序,很容易造成U1和U2损坏(不是所有芯片都能找到);在测试图案之前,修复后的算力板必须先冷却后再进行测试,否则会导致测试PNG。

6、确定维修站对象及相应的测试软件参数和测试治具。

7、检查工具和测试治具是否能正常工作。

8、风扇在测量信号时起到冷却作用,需要保持4个风扇全速运转。

9、更换新芯片时,应先清洁引脚并涂上锡膏,确保芯片在焊接前已涂锡。

三.测试治具的制作及注意事项

1、夹具型号:ZJ0001000001测试夹具。

2、首次使用19系列测试治具SD卡刷写程序更新测试仪FPGA控制板,解压后复制到SD卡上,将SD卡插入治具卡槽:上电约1分钟,等待控制板上的红绿指示灯连续闪烁3次,则更新完成(如果不更新,可能会导致测试时固定芯片报缺陷)。

蚂蚁矿机S19XP算力板如何维修?蚂蚁矿机S19XP算力板如何维修?

3、按照要求制作SD卡。当算力板仅安装单面散热片并检测芯片时,直接解压压缩包制作SD卡;

蚂蚁矿机S19XP算力板如何维修?

4、按照要求制作SD卡,双面散热片,8次Parrer测试,需要制作如下图所示的SD卡:

蚂蚁矿机S19XP算力板如何维修?

四.算力板原理及结构

1、S19 XP算力板工作结构:

S19 XP算力板由110颗BM1366芯片组成,分为11个域,每个域由10个ASIC芯片组成。

蚂蚁矿机S19XP算力板如何维修?蚂蚁矿机S19XP算力板如何维修?

3、S19 XP芯片信号方向:

1)CLK(OUT)信号流向,由Y1 25M晶振产生,从芯片01传输到芯片110;(0.6-0.7V)

2)TX(CI、CO)信号从IO接口的7脚(3.3V)流入,经过电平转换IC U10后从芯片01传输到芯片110;未插I0线时电压为OV,工作电压为1.2V;

3)RX(RI,RX)信号从芯片110流向芯片01,通过U2返回到信号线端子的第8脚,最后返回控制板;IO线未插时电压为0.3V,运行时电压为1.2V:

4)BO(BI,BO)信号流向,从芯片01到芯片110;

5)RST信号的流向从IO接口的3脚进入,然后从芯片01传输到芯片110;无IO线或待机时电压为0V,工作时电压为1.2V;

4、机器结构:

整机主要由3块算力板、1块控制板、1个APW12电源、4个散热风扇组成。

蚂蚁矿机S19XP算力板如何维修?

Ⅴ. 蚂蚁S19 XP算力板常见故障及排除步骤

1、现象:单板测试检测到芯片为0(PT1/PT2模式)

第一步:检查电源输出;

步骤2:检查电压域的电压输出;

每个电压域的电压约为0.36V。如果有14V供电,一般有域电压,先测量算力板电源端的输出;如果有14V供电但无域电压,继续往下检查。

第三步:检查升压电路的输出;

测试下图中的CE5,可以测出18V_19V的电压。

蚂蚁矿机S19XP算力板如何维修?蚂蚁矿机S19XP算力板如何维修?

第四步:检查每组LDO(线性稳压器)1.2V或PLL(锁相环)0.8V输出。

蚂蚁矿机S19XP算力板如何维修?

第五步:检查芯片的信号输出(CLK/CI/RI/BO/RST)

参考信号趋势描述的电压值范围。如果测量的电压值太大,可以与相邻组的测量值进行比较来判断。

PS:如果算力板没有按照测试顺序上电或者断电,导致U2和U10烧坏,测试芯片时会报0;

第六步:当测试治具液晶屏显示EEPRXM NG时,检查U6是否焊接正常;

步骤7:温度传感器位于芯片侧面,电阻位于PCB正面。检查温度传感器IC的焊接情况,附近电阻是否损坏,温度传感器3.3V供电是否正常;检查与温度传感器连接的芯片。大散热片的材料变形会导致芯片散热不良,影响温差。

蚂蚁矿机S19XP算力板如何维修?

2、现象:单板检测芯片不完整(PT1/PT2模式)

(1) 当显示 ASICNG=(0) 时:先测量域总电压,19V 升压电路正常,然后用短路探头短接 1 号和 1V2 测试点之间的 RX 测试点和 1V2 测试点。 1号和2号芯片。然后运行检查芯片程序,查看串口日志。如果此时仍然发现0芯片,则属于以下情况之一:

①用万用表测量1V、0V8测试点电压是否为1.2V、0.8V。如果不是,则可以判断该域的1.2V和0.8V LDO电路异常,或者该域的两块ASIC芯片没有焊接好,或者0.8V和1.2V贴片滤波电容短路。断路,或该域LDO电路IC虚焊/虚焊/材质损坏;

②检测U1、U2电路是否有异常,如电阻虚焊等;

③用万用表测量R8或R9的电阻是否在10欧姆以内,读数不会乱跳。如果不是,则更换两个电阻;

④检测第一颗芯片的管脚是否虚焊(返修过程中从侧面看管脚有锡,但拆下芯片后发现管脚没有沾锡);

⑤ 检查R1104至升压电路的电容是否断开。

(2)如果在步骤(1)中可以找到1个芯片,则说明第一个芯片和之前的电路都是好的。用类似的方法检查后续芯片。例如,将第38和第39芯片之间的1V2测试点和RX测试点短接。如果日志可以找到38个芯片,则前38个芯片没有问题;如果仍然找到0芯片,则检查1V2是否正常,如果正常,则说明38号以后的芯片有问题。继续用二进制方法检查,直到找到有问题的芯片。假设第N个芯片有问题,当第N-1个芯片与第N个芯片之间的1V2和RX短路时,可以找到第N-1个芯片;但当N和N+1芯片之间的1V2和RX短路时,就无法找到完整的芯片。

(3)当显示ASICNG时:(固定上报某位芯片),有以下两种情况:

①第一种情况:(一般每次测试报出的芯片值都不会改变),这种情况很可能是第X个芯片的前后CLK、CI、BO焊接异常造成的,所以重点关注这6个电阻。小概率是X-1、X、X+1这三个芯片中,芯片的以下管脚虚焊异常;

蚂蚁矿机S19XP算力板如何维修?

②第二种情况:信号间微短路(0-百欧),是芯片引脚电阻值太小造成的,先用热风枪焊接一下看看是否可以;

3、现象:PT1测试时,当chip为整数时,如10/20/30/40/50/60/70/80/90/100。

(1)报整数时,需要检查Level shift小板是否焊接良好,检查小板上的元件是否有虚焊。如果存在虚焊,则需要重新焊接。如果有损坏,需要测量电阻值是否正常。异常更换相应元件,检查PCB上焊接的小板;小板如下图所示。

蚂蚁矿机S19XP算力板如何维修?

(2)当确认小板后芯片仍然报整数时,首先检查RX信号是否正常,同时测量芯片点1.2V和0.8V是否正常,如果不正常,确认是否是连接如果是焊接问题,则重新焊接,如果是芯片坏,则需要通过调换来确认。

4、现象:单板测试显示PatternNG,即回复nonce数据不完整(PT2模式)

PatternNG是由于该芯片与其他芯片的特性差异较大造成的。如果芯片损坏,通常只需更换芯片即可。

根据日志信息,替换规则为:

(1)检查导热胶的印刷质量;

(2)如果芯片外观没有损坏,只需更换各域响应率最低的芯片即可;

(3)将回复较高的和回复较低的交换。更换完成后,再次测试算力板,检查ASIC芯片的回复是否正常。如果不正常,测量该域电压是否低于正常值。测量芯片焊盘引脚电阻值是否与正常相同,如果不一样,检查旁边的小电阻阻值是否太大,如果太高则更换即可;

如下图所示,是日志测试之一。从日志中可以看出asic[70][71][78][79]这四个芯片的响应率较低。78和79在同一个域,70和71也在同一个域,所以将78、79和其他正常域(比如第一个域)交换一下。如果还是PNG,则更换芯片。

PS:特别注意domain和asic的编号是从0开始的。

蚂蚁矿机S19XP算力板如何维修?

5、现象:检查芯片测试OK,PT2功能测试串口不停止(长距离运行)

修复方法:PT2测试时,查看串口打印日志,然后在串口开始长距离运行时,用短路探头短接RX和1.2V测试点,开始短接从第一个芯片开始。如果短路后串口停止长距离运行,则说明第一块芯片正常。按照这种方法,找到芯片短路后长距离运行后仍然失效的芯片。一般是芯片损坏造成的,更换即可;

6、现象:PT1检查芯片测试OK,PT2功能测试固定报某芯片NG

修复方法:检查外观,测量前面的贴片电容或电阻,一般是芯片焊接不良或贴片电容或电阻损坏或阻值不正常造成的;

7、现象:B-AXPCS(X芯片响应不足)

修复方法一:测量复位低芯片域的域电压是否低于正常域,如果低,则测量复位低芯片的引脚电阻是否高于正常芯片的引脚电阻。如果是,则需要更换芯片;如果不是,测量旁边电阻的阻值,阻值太大则更换;

修复方法二:调换响应高的芯片和响应低的芯片;

蚂蚁矿机S19XP算力板如何维修?

六.控制板常见故障及排除步骤

1、整机不运行

(1)检查几个电压输出点电压是否正常。如果3.3V短路,可以先断开U8。如果短路现象仍然存在,可以拔掉CPU并重新测量。其他电压异常一般更换相应的电压转换IC。

(2) 电压正常,请检查DDR/CPU的焊接状态。

(3) 尝试用SD卡更新Flash程序。

如果控制板被刷机的矿机需要正常启动,需要执行以下两个步骤:

①刷卡成功后,绿色LED指示灯常亮,此时关闭电源并重新启动;

② 再次上电后等待30秒(开启OTP的时间过程);

③ OTP(0neTimeProgramable)是MCU的一种存储器类型,意思是一次性可编程。程序烧入IC后,不能再次更改和清除。

防范措施:

(1)突然断电或者开启OTP过程中不到30s会导致控制板无法开启OTP功能,控制板无法启动(未连接互联网)。需要更换U1(控制板主控IC FBGA),更换后的U1不能在蚂蚁19系列矿机上使用;

(2) 对于开启OTP功能的控制板,U1不能用于其他系列型号。

蚂蚁矿机S19XP算力板如何维修?

2、全机找不到IP

(1)大概率是由于运行异常找不到IP,参考第1点排查;

(2) 检查网口、网络变压器T1、CPU的外观及焊接情况。

3.整机无法升级

检查网口、网络变压器T1、CPU的外观及焊接情况。

4、整机读算力板失败或者链少

A、检查电缆连接状态;

B、检查控制板上与链条对应的部分;

C、检查插针及插件接口周围电阻的波峰焊质量。

蚂蚁矿机S19XP算力板如何维修?

七.整机故障现象

1、整机初步测试

(1)显示风扇异常:检查风扇工作是否正常,与控制板的连接是否正常,控制板是否异常。

(2)少链:指三个算力板中缺少一个。这种情况下,大部分问题都是由算力板和控制板之间的连接引起的。检查电缆是否有断路。如果连接没有问题,可以对单板进行PT2测试,检查测试是否能够通过。如果能通过,很可能是控制板故障。如果测试失败,则使用PT2维修方法进行修复。

(3)温度异常:我司监控系统设定的PCB最高温度不能超过90C/194T。如果超过90C,矿机就会报警,无法正常工作。一般是环境温度过高造成的。另外,风扇运转异常也会引起温度异常。

(4)找不到所有芯片:(矿机可以运行,但算力是正常值的2/3或1/3)芯片数量不够,可以参考PT2进行测试修复。

(5)运行一段时间后,没有算力,矿池连接中断。检查网络。

蚂蚁矿机S19XP算力板如何维修?

(6)单板测试正常,但组装成完整矿机测试后算力较低。

如下图所示,第一块算力板运行约3分钟后没有算力。

蚂蚁矿机S19XP算力板如何维修?

① 具体分析方法如下:首先进行单板PT2测试,检查算力板性能是否正常。如果测试芯片没有完全检测出来,则需要对板子进行维修。测试后如果正常,则单独取出算力板,使用测试治具携带进Debug主程序进行挖矿,并将风扇转速调至95%。

a) 将电压和频率调整至整机工作电压和频率,让矿机进行挖矿,并检查算力是否有下降。

b) 如果矿机仍降低算力,则将频率降低至200M,其他条件不变。让矿机进行挖矿,看看算力是否有下降,算力板是否会显示X。

c) 若算力板仍显示X,算力降低,可拆下算力板散热片进行挖矿。当算力降低时,测量域电压是否正常。一般来说,问题域的域电压会出现异常。然后测量 RI 信号,看看 RI 信号在哪里中断。如果RI信号消失,基本可以确定芯片短路或上锡后损坏。

②另一种修复方法:通过“Putty”软件登录该IP,检查算力板域工作电压是否正常,nonce返回是否正常,根据“Putty”软件上的日志信息进行修复腻子”软件。

a) 打开“Putty”软件,输入问题矿机的IP,点击“打开”。

蚂蚁矿机S19XP算力板如何维修?

b) 输入用户名、密码和测试命令,查看NONCE返回状态和电压域状态。如果NONCE和域电压出现异常,可以根据打印的异常芯片进行修复。帐号密码有两种:一种帐号是RXot,密码是admin;一种是RXot,密码是admin;另一个账户是miner,密码是miner。本软件可与调试软件同时使用。

蚂蚁矿机S19XP算力板如何维修?

Ⅷ. 其他注意事项

维护流程图:

蚂蚁矿机S19XP算力板如何维修?

1、常规测试:

①首先目视检查算力板,看PCB是否有变形、烧毁的情况。如有现象,必须先处理。

②目视检查是否有明显的零件烧焦、零件撞击偏移或零件缺失等迹象。

③目视检查无误后,可检测各电压域的阻抗,以检测是否存在短路或开路。如果发现,必须首先处理。

④ 检查各域电压是否在0.36V左右。

2、例行检查OK后(一般例行检查的短路检测是必要的,以免通电时因短路而烧坏芯片或其他材料),即可用测试治具对芯片进行测试,并可根据测试治具的测试结果进行判断和定位;

3、根据测试仪的显示结果,从故障芯片附近开始,检查芯片测试点(CO/NRST/RX/XIN/BI)和VDD0V8、VDD1V2等电压。

4、根据信号流向,除RX信号反向传输(110号到1号芯片)外,其他几个信号CLK CO BO RST均为正向传输(1-110),查找异常故障点通过电源顺序。

5、当定位到故障芯片后,需要重新焊接芯片。方法是在芯片周围添加助焊剂(最好是免清洗助焊剂),将芯片引脚的焊点加热至溶解状态,使芯片引脚和焊盘重新磨合并收锡,从而达到重新镀锡的效果。如果重新焊接后仍然存在同样的故障,可以直接更换芯片。

6、修复后的算力板需要用测试治具进行测试,必须通过两次以上才能判定为良品。第一次,更换配件后,等待算力板冷却,使用测试夹具进行测试,通过后,将其放在一侧,然后冷却。第二次,等待算力板完全冷却后再进行测试。

© 版权声明

相关文章

暂无评论

暂无评论...