比特大陆S19j pro无PIC铝算力板如何维护?

蚂蚁矿机1年前 (2023)发布 YKK
5.5K 1 0

1. 平台要求

需要有接地的防静电维护工作台,维护人员必须佩戴防静电手腕带。

2、设备要求

(1)恒温烙铁(350°C-380°C / 662°F-716°F)和尖头烙铁,用于焊接SMD电阻、电容等小贴片。

(2)热风枪、加热台(350℃-400℃)和BGA返修台,用于芯片和BGA拆焊和焊接。

(3)万用表一台(推荐使用福禄克),带有焊接钢针和热缩套管,方便测量。

(4)示波器。

(5)网线(要求:稳定的Internet网络)。

3. 测试工具要求

使用APW12电源搭建测试平台(推荐使用APW12 12V-15V V1.2和电源适配器线):

(1)使用粗铜线连接电源和算力板的正负极。建议使用长度小于60cm的4AWG铜线(仅用于PT1和维护测试),可用于给算力板供电。

(2)使用V2.2010控制板测试治具(型号ZJ0001000001),电源正负极需加装放电电阻。100W以上建议使用20欧水泥电阻;或者您也可以使用PicoBT多功能测试夹具

4、修复辅助材料及工具要求

(1)SENJU锡膏M705、助焊剂、算力板清洁剂、无水酒精、导热胶、植球钢网(6*6芯片尺寸)、吸锡丝、锡球(建议直径0.4mm)。

(2)电路板清洗剂,用于清洗维修后的助焊剂残留物;

(3)维护完毕后,在芯片表面涂抹FujipolySPG-30B导热硅脂;

更换新芯片时,需要先对芯片的引脚进行植锡,然后将其焊接到算力板上,并在芯片表面均匀涂抹导热硅脂,最后安装大散热片。

(4) ZD2200有线扫描仪

(5)TTL转RS232串口模块

(6)自制短路探头(焊接时采用大头针接线,需热缩套管,防止探头与小散热片短路。)

5、常用维修备件材料:

0402电阻:0R、33R、51R、10K、4.7K

0402电容:0.luF、luF

二. 操作要求

1、维修人员必须具备一定的电子知识,一年以上维修经验,精通BGA/OFN/LGA封装焊接技术。

2、修复后的算力板必须通过两次以上测试才合格。

3、更换芯片时,要注意操作规范,保证更换零件后PCB板不变形,并检查更换零件周围是否有缺件、断路、短路现象。

4. 要测试更换的芯片,请先测试芯片,然后再进行功能测试(PT2)。确保小散热片焊接良好,大散热片安装到位(大散热片安装后,每块导热胶必须涂抹均匀)。并且冷却风扇全速运转。使用机箱散热,需要同时放2块算力板形成风道,这对于生产的单面测试也是需要的(也是重要的)。

5. 算力板通电时,将正负极铜线按顺序放好,最后插入信号线。拆卸必须按相反的顺序进行,即:先拆信号线,再拆电源正负极铜线。不按此顺序可能会导致U1、U2损坏(无法完整找到芯片)。图案测试前,修复后的算力板必须先冷却后再进行测试,否则会导致测试PNG。

6. 确认需要维修的矿机、相应的测试软件参数和测试夹具。

7、检查工具、夹具是否能正常工作。

8. 测量信号时需要使用风扇进行散热,因此需要保持4个风扇全速运转。

9、更换新芯片,清洁引脚并涂上锡膏,确保芯片在焊接前涂锡。

三.夹具设置及注意事项

1.夹具型号:ZJ0001000001

2、首次使用S19j pro系列,用测试治具SD卡刷卡程序完成治具控制板的FPGA更新,解压并复制到SD卡,将存储卡插入治具卡槽。上电约1分钟,等待更新完成后控制板指示灯双闪3次(更新失败可能会导致测试时报坏芯片)。

比特大陆S19j pro无PIC铝算力板如何维护?

3、不带散热器的SD卡设置:使用REPALR的程序修复,如下截图说明该程序不需要扫码。测量时,需要对PCBA进行散热,以防止测试、测量过程中电路板过热。

比特大陆S19j pro无PIC铝算力板如何维护?

4. 不带散热器的 SD 卡设置:双面散热器 8 x Pattern 测试需要 SD 卡的设置,如下所示。将文件名“congfig ini-BHB42631-PT2”更改为“config ini”。无需插入扫码器,只需插入网线即可进行PT2测试。散热请参考散热工具的设置(要点:板卡插入机箱,电源锁螺丝,风扇需全速运转,环境温度小于30℃)。

比特大陆S19j pro无PIC铝算力板如何维护?

四.算力板原理及结构

1.S19j pro算力板工作结构

算力板由126块BM1362芯片组成,分为42个域,每个域包含3个ASIC芯片。S19J Pro算力板使用的BM1362芯片工作电压为0.32V。

第42、40、38、36组(共4组)由升压电路U238输出的20V给LD0(U308、U305、U306、U307)供电,使这4个域的LDO输出1.2V和0.8V。其余域 LDO 由 VDD15V 输入供电,使其输出 1.2V 和 0.8V。

注意:PT2测试,我们可以在后端日志页面查看,从asic0开始计数,如下图:

比特大陆S19j pro无PIC铝算力板如何维护?

测试日志中的电压域是从0开始计数的,即domain0,如下图:

比特大陆S19j pro无PIC铝算力板如何维护?

2、S19j pro算力板升压电路,将电源从15V升压到20V。如图所示:

比特大陆S19j pro无PIC铝算力板如何维护?比特大陆S19j pro无PIC铝算力板如何维护?

3、S19J PRO芯片的信号方向。

(1)CLK(XIN)信号流:由Y125M晶振产生,从芯片01传输至126;电压约为0.5V-0.6V

(2)RST信号流向:从IO口3脚,然后从芯片01传送到126。

(3) CI 信号流程:从 IO 口引脚 7 开始,然后从芯片 01 传输到 126。

(4) RX(RI)信号流向:从芯片126到01,再经U2返回到IO口8脚。

(5) BO(BI)信号流程:从芯片01传输到芯片126。

比特大陆S19j pro无PIC铝算力板如何维护?

4、整机架构:

该机主要由3块算力板、1块控制板、一块APW12 1215电源和4个散热风扇组成。

比特大陆S19j pro无PIC铝算力板如何维护?

五、算力板常见故障及排除步骤

1. 问题:单板测试报“ASIC=0”错误(PT1/PT2模式)

步骤一:排除电源输出故障

第二步:检查电压域电压输出

每个电压域都有0.32V左右的电压,15V电源一般都有域电压。应优先测量算力板电源端子输出。

第三步:检查升压电路的输出

测试图中,C29电容可以测量19-20V的电压。

比特大陆S19j pro无PIC铝算力板如何维护?比特大陆S19j pro无PIC铝算力板如何维护?

第四步:检查每组LDO1.2V或PLL0.8V输出。

比特大陆S19j pro无PIC铝算力板如何维护?比特大陆S19j pro无PIC铝算力板如何维护?比特大陆S19j pro无PIC铝算力板如何维护?

第五步:检查芯片信号输出(CLK/CI/RI/BO/RST)。

根据信号方向参考所描述的电压值范围,如果测量时电压值出现较大偏差,则与相邻组的测量值进行比较即可确定。

比特大陆S19j pro无PIC铝算力板如何维护?

2.问题:单板测试显示芯片不完整(PT1/PT2模式)

(1) 当显示 ASICNG =(0) 时:测量域和升压电路总电压 20V,然后用短接探针将第一、第二芯片中间的 RX 测试点和 1V2 测试点短接。运行找到芯片程序,查看串口日志。如果找到0芯片,可能与以下情​​况之一有关:

a-1) 用万用表测量电压,检查1V、0V8测试点是否为1.2V、0.8V。如果不是,则可以确定域中的1.2V、0.8V LDO电路出现异常,或者域中的两个ASIC下巴没有焊接好,或者是0.8V和1.2V贴片滤波器短路引起的问题电容,或域内LDO电路IC不足/虚焊/材料损坏。

a-2) 检测U2电路是否异常,如电阻焊接不足。

a-3) 检测第一颗芯片是否有引脚未焊(修复时引脚有侧面有锡的情况,但拆下芯片后发现引脚未上锡)。

(2) 如果能找到步骤(1)中的芯片,则说明第一个芯片和前面的电路是好的,同理,检查后面的芯片。例如,将23号芯片和24号芯片之间的1V2和RX测试点短接。如果日志可以找到 23 个芯片,则前 23 个芯片是好的。如果还是找到0个芯片,则需要先检查1V2是否正常,如果正常,则说明38#芯片以下的芯片有问题。继续用二分法检查,直到找到有问题的芯片。假设第N个芯片出现问题,那么当第N-1个芯片与第N个芯片之间的1V2和RX短路时,我们可以找到N-1个芯片,但如果N个芯片之间的1V2和RX短路,我们就无法找到所有芯片。 N+1芯片短路。

(3)当显示ASIC=125时:即可以找到125个芯片,说明算力板在115200波特率下可以检测到126个芯片,但在12M波特率下只找到125个芯片,没有找到1个芯片12M 波特率。

修复方法:采用二分法,短接探头,短接1.2V/RX。

示例:将第46、47脚之间的1V2测试点和RX测试点短接,如果日志显示读取46个芯片,则前46个芯片没有问题;如果第47和48芯片之间的信号点短路,日志仍然显示读取46下巴,并且无法检测到第47下巴。外观检查没问题,一般只需更换47号芯片即可。

比特大陆S19j pro无PIC铝算力板如何维护?

(4)当显示ASICNG时:(不断上报固定编号的芯片),有以下两种情况:

①第一种情况:(一般每次测试时报出芯片的值都不会改变),这种情况可以按照测量信号电压的正常维修方法进行维修。(芯片附近也可能有一个电阻)。

比特大陆S19j pro无PIC铝算力板如何维护?

②第二种情况:测试时间大约是好板的两倍(每次测试X的值会有变化,有时X=0);

通常log会显示以下信息(其中红色数字不一定是13,取决于线路连接的是哪个测试):

测试时,假设异常位置前面的所有域的域电压几乎都小于0.32V,而后域的域电压几乎都高于0.32V,这种情况是由于未焊接造成的。芯片,通常是1.2V、0.8V,RXT和CLK焊接不好。建议直接测量域电压来定位问题所在。在第(1)节中。1V8与RO短路同样方法定位异常。

3.问题:单板测试报“Pattern NG”错误,即nonce数据不完整(PT2模式)。

Pattern NG是由于该芯片与其他芯片的特性差异较大造成的。破损的芯片通常只需更换即可。

根据日志信息,替换规则如下:

(1)检查导热胶印刷的质量。

(2) 如果芯片外观没有损坏,则更换各域响应率最低的芯片。

(3) 将响应率较高的芯片与响应速度较低的芯片交换,看是否跟随芯片,如果跟随则更换芯片,如果不跟随则测量域电压是否低于正常值,是否芯片焊盘管脚电阻值与正常管脚电阻值相同,如果不一样,检查小电阻值是否偏高,如果是则更换。

PS:请注意域名和asic编号都是从0开始的。

比特大陆S19j pro无PIC铝算力板如何维护?

4.问题:B_AXPCS(X芯片回复不足)

修复方法:将这些芯片更换为其他领域响应高的芯片,看看是否有效。如果无效,请更换这些芯片;比如下图中的asic116(第117个):

比特大陆S19j pro无PIC铝算力板如何维护?

5.问题:芯片测试正常,PT2功能测试时串口不停止(长时间运行)

修复方法:在PT2测试中,查看串口打印日志,如果串口开始长时间运行,用短路探针将第一颗芯片的RX&1.2V短路。如果短路后串口长时间停止运行,说明第一块芯片是好的。用此方法可以找到短路后仍存在长期运行故障的芯片。通常是由于芯片损坏造成的。代替它;

PT2测试环境要求:PT2测试环境应在20至30度。当环境温度超过35度时,软件将停止测试。测量时需要散热。以下散热平台可用于PT1测量并运行DEBUG固件。

比特大陆S19j pro无PIC铝算力板如何维护?

PT2测试的电源要求:在1500瓦负载下(测试一块板子),PT2测试治具实际输出的电压不能低于配置文件设定的0.03V。(比如配置文件要求试运行15V,那么当电源负载1500瓦时,输出电压不能低于14.97V)。

6、芯片地址错误(PT2)

修复方法:更换报错的芯片。

比特大陆S19j pro无PIC铝算力板如何维护?

7. LEVEL100+:个别芯片无法满足测试标准

修复方法:根据日志RESULT修复。

比特大陆S19j pro无PIC铝算力板如何维护?

Ⅵ. 主控板常见问题及处理步骤

1、整机不运转

(1)检查多个电压输出点电压是否正常。如果出现3.3V短路,首先断开U8,如果仍然短路,拔掉CPU,然后再测量。其他电压异常一般更换相应电压IC。

(2)电压正常,请检查DDR/CPU的焊接情况。

(3) 尝试用SD卡更新Flash程序。

如果机器需要正常启动,需要执行以下两个步骤。

a) 刷卡成功后,绿色LED指示灯常亮,断电重启。

b) 重新上电后等待30秒(打开OTP的时间)。

c) OTP(OneTimeProgramable)是MCU的一种存储器类型,意思是一次性可编程。程序不会被更改和清除

烧录IC后再次进行。

注意事项:

– 突然断电或者开启0TP过程中时间小于30秒会导致控制板无法开启OTP功能,控制板无法启动(未联网)。需要更换U1(控制板主控ICFBGA)。更换后的U1不能用于ANTMINER 19系列矿机。

-对于已启用OTP功能的控制板,U1不能用于其他型号系列。

比特大陆S19j pro无PIC铝算力板如何维护?

2、整机找不到IP。

很有可能是操作异常导致找不到IP,参考第1点排查

检查网口、网络变压器T1、CPU的外观以及焊接情况。

3、整机无法升级。

检查网口、网络变压器T1、CPU外观及焊接情况

4、整机读算力板失败或链数少。

A、检查线路接线连接情况。

B、检查控制板上与链条对应的部分。

C、检查管脚的波峰焊质量和插件接口周围的电阻。

比特大陆S19j pro无PIC铝算力板如何维护?

 

七.机器级故障

1、整机初步测试。

风扇显示异常:需要检查风扇工作是否正常,与控制板的连接是否正常,控制板是否有异常。

2、少链:共有三块算力板,但少了一块算力板,多是算力板与控制板链路故障造成的。检查线路是否有断路,如果连接为0K,可以用单板进行PT2测试,检查是否能通过测试。如果是,则故障可能会锁住控制板,如果不是,则采用修复PT2的方法进行修复

3.温度异常:我们的监控系统设置的最高PCB温度不能超过90℃/194°F。如果超过90℃,机器会报警并且无法正常工作。一般是环境温度过高造成的。另外,风扇运转异常也会引起温度异常。

4. 找不到所有芯片:(机器可以运行,但哈希值是正常值的2/3或1/3)芯片数量不够。测试和维护请参考PT2。

5、运行一段时间后无哈希,矿池连接中断,需要检查网络。

比特大陆S19j pro无PIC铝算力板如何维护?

6、板子测试OK后组装成整机。

出现低哈希:如下图所示,第一块板运行3分钟左右没有哈希。

具体分析方法如下: 首先,进行单板PT2测试,看单板性能是否正常。如果测试芯片不完整,则需要对板子进行维修。测试后如果正常,单独取出板子,用测试治具运载Debug的主板程序进行挖矿,并将风扇风速调至95%。将电压和频率调整为整机的工作电压和频率,以便机器进行挖矿并检查是否有算力丢失。如果有,将频率降低到200M,其他条件不变。让机器挖矿,看是否有算力损失,算力板是否可以执行X。如果仍然出现X和算力下降,请拆下算力板的散热器来挖矿。如果发生哈希丢失,测量域电压是否正常,一般有问题的域,域电压都会异常。测量 Rl 信号以查看 RI 信号在何处中断。如果RI信号消失,基本可以断定芯片短路或连续焊锡后损坏。

比特大陆S19j pro无PIC铝算力板如何维护?

 

Ⅷ. 其他注意事项

维护流程图:

比特大陆S19j pro无PIC铝算力板如何维护?

1、日常检查:

(1)首先目视检查算力板是否有PCB变形或烧毁的情况。如有,必须先处理。

(2)目视检查零件是否有明显烧痕、零件撞击偏移或缺件。

(3)目视检查后,可检测各电压域的阻抗,检查有无短路或断路。如有,必须先处理。

(4) 检查各域电压是否在0.32V左右。

2、常规检测OK后(对于一般常规检测,需要进行短路检测,避免上电时因短路烧毁芯片或其他材料),即可使用测试治具进行芯片检测,判断定位即可

根据测试夹具检测结果制作。

3、根据测试治具的显示结果,从故障芯片附近开始检测芯片测试点(CO/NRST/RX/XIN/BI)电压及VDDOV8、VDD1V2等。

4、根据信号流向,除RX信号外,均反向传输(芯片126到芯片1)。正向发送几个信号CLK/CO/BO/RT(1-126),通过供电时序发现异常故障点。

5、当定位到故障芯片时,需要重新焊接芯片。方法是在芯片周围添加助焊剂(最好不用清洗助焊剂),将芯片引脚的各个焊点加热至溶解状态,使芯片引脚与焊盘磨合纳锡,从而达到重新去锡的效果。 -镀锡。如果重新焊接后仍然存在同样的故障,可以直接更换芯片。

6、修复后的算力板必须经过两次以上测试才可判定为良品。第一次,更换零件后,等待算力板冷却,使用测试治具进行测试,然后放在一边冷却。第二次,等待算力板完全冷却后再进行测试。

© 版权声明

相关文章

1 条评论

  • togss@live.com
    togss@live.com 读者

    这么好的网站,关注了,希望能学到更多知识

    美国
    回复