蚂蚁S11算力板维修指南
版本日期:2019.1.26
文件类别:维护计划
本卷内容:主要讲述S11各种故障的排除,以及如何使用测试工具进行准确定位。
※ 本文版权归Bitmaintech Pte. Ltd所有。(比特大陆)。转载、摘录或以任何其他方式使用该文章须经版权人许可。如有转载或引用需求,请联系比特大陆官方客服。
一、维护平台要求
1、恒温烙铁(350-400℃)。烙铁头用于焊接贴片电阻、电容。
2、散热烟囱用于芯片拆焊,注意不要长时间加热,以免PCB起泡。
3、算力板测试测量使用APW8电源(输出10V—11V,160A Max)和电源转接线(自产)。
4、Fluke 15b+万用表、镊子、V9算力板测试治具(注意部分治具不支持稳压功能,不能用于S11算力板测试)((有条件可配置示波器)。
5、助焊剂、无水酒精清洗面板水;清洗面板水用于清洗维护后的助焊剂残留物和外观。
6. 镀锡治具、BM1387镀锡工具、锡膏;更换新芯片时,必须对芯片进行镀锡。
7.修复后使用导热胶(93461)重新粘贴散热片。
维修S11矿机的工具是必不可少的。但当你的矿机出现故障时,可能还需要更换一些损坏的部件,比如矿机的散热风扇、算力板上的芯片散热片、蚂蚁矿机电源线等。
二. 维护操作要求
1、维修人员必须具备一定的电子知识,一年以上维修经验,掌握QFN封装焊接技术。
2、修复后,算力板必须经过两次测试,确认OK才可以通过!
3、更换芯片时要注意操作方法。更换任何配件后,PCB板无明显变形,检查更换的配件及其周围是否有断路、短路现象。
4、确定维修站对象及相应的测试软件参数和测试治具。
5、检查工具、夹具是否能正常工作。
三.原理及结构
1、原理概述
1.1 S11由28个电压域串联组成。每个电压域有3颗BM1387芯片,整板上有84颗BM1387芯片。
1.2 S11使用的BM1387BF芯片是低压芯片,因此整机功耗比S9系列有很大改善。
1.3 S11时钟是25M单晶振,从第一个芯片串行传输到最后一个芯片。
1.4 S11每个芯片的正反面都有独立的小散热片。正面的小散热片是SMT贴片,背面的小散热片经过初步测量后通过导热胶固定在IC的背面。维修更换的芯片测试合格后,需要在IC表面均匀涂抹黑色导热胶并加热固定。
笔记:
在维修过程中,更换电路板元件或芯片时,为了减少吹气枪的高温对PCB板和芯片的损坏,需要先将故障元件附近的小散热片拆掉。以及更换前PCB板的背面。PCB芯片表面有测试点。制造和维修时,如果PCB芯片上没有贴散热片,可以使用芯片表面的测试点;对于成品维修(售后维修),由于PCB的正反面均被散热片覆盖,因此需要通过PCB芯片表面的测试点来定位故障。可以使用特制的细长测试引线探查散热片间隙进行测量。然而,
![修复S11算力板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/72006-16277038475336958.jpg)
图1 信号方向
2. 要点分析
2.1 下图为S11算力板的信号方向:
CLK信号的流向由Y1 25M晶振产生,从芯片01传输到芯片84;待机和计算时电压为0.9V。
TX(CI、CO)信号从IO口1脚流出电平转换为IC,然后从芯片01传输到芯片84;未插IO线时电压为0,计算时工作电压为1.8V。
RX(RI、RO)信号从84号芯片流向01号芯片的28号引脚,通过电平转换IC返回到信号线端子控制板的12号引脚;未插入IO信号时电压为1.8V,计算时电压为1.8V。
B(BI、BO)信号从芯片01流向芯片84,降低电平;未插IO线和待机时电压为0V,计算时有0.3左右的脉冲信号。
RST信号从IO口的15脚流出,然后从芯片01传输到芯片84;无IO信号插入和待机时电压为0V,计算时电压为1.8V。
2.2 S11算力板正面关键电路如图3所示。
2.2.1 芯片间测试点(放大后如下图):图2
![修复S11算力板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/f3774-16277038887935774.jpg)
图2 之间的测试点
维护时根据测试治具提示的LOG信息粗略判断不良范围。测试芯片之间的测试点是最直接的故障定位方法。S11算力板的测试点排列为:
第1行和第3行14个电压域的顺序(红框):CLK、CO(TX)、RI(RX)、BO、RST。
信号:
第2行和第4行(黄框)14个电压域的顺序颠倒:RST、B0、RI(RX)、C0(TX)、CLK。
![修复S11算力板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/edbf4-16277039506721922.jpg)
图3 S11算力板正面关键电路
2.2.2 电压域
整板上有28个电压域,每个电压有3个芯片。同一电压域的三个芯片并联供电,并联后与其他电压域串联。电路结构如下图4所示:
![蚂蚁矿机S11算力板维护 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/3ea63-16277039709456419.jpg)
电压域单片机原理分析(见下图5、图6):
![蚂蚁矿机S11算力板维护 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/eac8c-16277039973142438.jpg)
图5 BM1387电路图
![蚂蚁矿机S11算力板维护 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/ad368-16277040243246946.jpg)
图6 BM1387BF芯片引脚
信号说明
![蚂蚁矿机S11算力板维护 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/4ae55-16277074368957228.jpg)
•以上是BM1387BF芯片各引脚的功能。
维修时,主测试芯片前后10次测试(芯片前后5次:CLK、CO、RI、BO、RST);核心电压;LDO-1.8V,PLL-0.8V,DC-DC输出,升压13V电压。
检测方法:
插上IO线,未按下测试按钮时,DC-DC和Boost无电压输出。按下治具的测试按钮后,PIC开始工作。此时,DC-DC输出PIC治具测试程序设定的电压,并在工作时升压。然后jig输出WORK,计算后返回NONCE。此时各测试点的正常电压应为:
时钟脉冲:0.9V
CO:1.6-1.8V,治具刚送入WORK时,由于CO为负,直流电平会降低,瞬时电压约为1.5V。
RI:1.6-1.8V,当计算过程中电压异常或过低时,算力板会异常或算力为零。BO:0V 没有运算时,运算时会有0.1-0.3V之间的脉冲跳变。
NRST:1.8V。每次按下夹具的测试按钮时,都会重新输出复位信号。
当上述测试点状态或电压异常时,请根据测试点前后电路判断故障点。
•从上面的列表可以看出:
CLK信号:从芯片24脚进入,从6脚出,跨电压域连接时,从6脚出,通过100NF电容送到下一个芯片24脚。
TX信号:从芯片27脚进入,从5脚出;
RX信号:从芯片4脚返回,从28脚退出;
BO信号:从芯片30引脚进入,从2引脚退出;
RST信号:从芯片32引脚进入,从1引脚退出。
如下图7所示:可以测量各芯片的信号电压、CORE电压、LDO-1.8O、PLL-0.8等电压:
CORE:0.4V —该电压异常时,一般是该电压域的芯片CORE短路。
LDO-1.8:1.8V —该电压异常时,芯片LDO-1.8O短路或开路,或者外围滤波电容短路。
PLL-0.8:0.8V —该电压异常时,电压域内某芯片的PLL-08短路或LDO-1.8异常。
![芯片周围的测试点 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/30d5f-16277074994279249.jpg)
图7 芯片周围的测试点
根据治具打印窗口的信息,判断算力板的运行状态、芯片的算力、温感等。
3.IO口
IO由2X9间距2.0 PHSD 90度直插双排组成。
各引脚定义如下图8所示:
![IO口各引脚定义 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/e4fd4-16277075467563612.jpg)
图8 IO口各引脚定义
如上图:
引脚 1、2、9、10、13、14:GND。
Pin 3、4(SDA、SCL):DC-DC PIC 的 I2C 总线,连接控制板和 PIC 之间的通信。控制板可以读写PIC的数据来控制算力板的运行状态。
Pin 5(PLUG0):算力板的识别信号。该信号从操作板上的10K电阻拉至3.3V。因此,当IO信号插入时,该引脚应为高电平。
引脚 6、7、8(A2、A1、A0):EEPROM 地址信号。
引脚11、12(TXD、RXD):通过电平转换IC,将算力板的TX(CO)和RX(RI)信号电平从1.8V转换为控制板的3.3V。
引脚15(RST):复位信号的3.3V端。经过电阻分压后,变成1.8V RST复位信号。
引脚 16 (D3V3):为算力板提供 3.3V 电源。3.3V由控制板提供,主要为PIC提供工作电压。如下图9所示,分压前后IO各引脚电压及分布。
![S11算力板维修手册 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/3f8a3-16277075869700590.jpg)
![S11算力板维修手册 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/78de4-16277075944223218.jpg)
图9 IO信号分压器电压
4. 13V升压电路
它负责将DC-DC(9.8-11V)升压至13V。原理是通过U2 SGM3750开关电源将9V电压升压至14V。U2产生的开关信号通过L2给储能电感,然后D2对C23进行充放电,对整流二极管进行升压,从而得到C23正极的13V电压。如图11和图12所示:
![S11算力板维修手册 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/1bcf6-16277076329380751.jpg)
图11 13V升压示意图
![13V升压PCB图 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/a21f9-16277076559607756.jpg)
图12 13V升压PCB图
需要注意的是,升压电路电压异常升高很容易导致算力板后7个电压域的LDO损坏,也可能造成芯片损坏。
5. 直流-PIC
它由 dsPIC33EPXXGS202_ESS 和 EEPROM 组成。如图13、图14所示:
存储算力板芯片的频率信息和温度传感信息的设备,通过它控制算力板的DC-DC输出。
![原理图,示意图 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/2575b-16277077136164091.jpg)
图13 示意图
![S11算力板维修手册 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/773ee-16277077418033415.jpg)
图 14 图片
PIC工作时,需要每分钟控制发送一次心跳信号。如果没有心跳信息,PIC将在工作一分钟后关闭。PIC在S11板中主要起到检测电压和控制DC-DC输出的作用。
6、DC-DC开关电路
它由7002和4个CMOS管组成。当PIC_EN输出高电平时,7002作为开关,控制MOS管达到导通状态,如图15、图16所示:
![S11算力板维修手册 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/19291-16277078379673124.jpg)
图15 示意图
![S11算力板维修手册 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/6671d-16277080566550947.jpg)
![DC-DC开关电路 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/b0479-16277080756836042.jpg)
图16 DC-DC开关电路
7.25M时钟
它由Y 25MHZ有源晶振和1.8V电源组成:如图17和图18所示。
![25M时钟电路 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/400a7-16277081341285749.jpg)
图17 25M CLK电路
![25M CLK原理 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/90020-16277081723185422.jpg)
图18、25M CLK原理
正常情况下,R648对地电压约为1V。如下图19、图20所示:
LN1134A18MR的第1、3脚为输入,第5脚为1.8V输出;
需要说明的是,后6个电压域的1.8V LDO供电来自13V升压电路;其他电压域的1.8V LDO是由最后7个电压域的CORE电压叠加的(7*0.4V=2.8左右)。
PLL-08 电压由 LDO-1.8 除以两个电阻获得。
![1.8V电路 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/18d8f-16277082286239622.jpg)
图19 1.8V电路
![1.8VLDO电路 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/7817d-16277082647794737.jpg)
图20 1.8V LDO电路
8.温度传感电路
温度传感器有两组,一组由温度传感器U5和计算芯片U39组成,一组由U7和计算芯片U66组成;各温度传感器组的原理:是内置温度传感器组(BM1387的第15、16脚)和温度传感器,采集这两个温度传感参数,最后通过BM1387的17、18脚,返回通过RI控制板的FPGA。原理如图21所示:
![修复S11算力板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/75f71-16277083086228086.jpg)
![专业维修S11算力板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/71bca-16277083288962584.jpg)
图21 温度传感示意图
四.整机故障排除
1.登录监控界面(WEB)
此类故障大部分是算力板故障,也有少数是运行环境、风扇、外网、固件等原因造成的。以下是针对各种常见现象的处理:
1.1 算力接口无配置信息。如下图22所示:
治疗方法:
![专业维修S11算力板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/7139d-16277083877820005.jpg)
图22 无配置信息截图
◂ 首先检查矿机指示灯。如果矿机红灯闪烁,则说明矿机状态不正常。可以先检查矿机网络,将矿机网线插到电脑上,检查是否可以ping通矿机矿池。
◂ 指示灯状态是否正常。很有可能是矿机的三块计算板出现问题,矿机的算力板损坏。
◂ 矿机固件损坏,可通过升级接口将固件升级至最新固件。注意风扇是否异常(这种现象也可能是不转或转速低造成的)
1.2 无GH/S(RT)算力,红灯闪烁。如下图23所示:
![无实时算力 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/19bee-16277084218181044.jpg)
图23 无实时算力
上述现象中,矿机已运行7天,GH/S(AVG)下降幅度不大,说明矿机已经很长时间没有出现故障了。双风扇的转速很低,8号板的TEMP(CHIP)很低。这是不久前刚被下架的一块板子。出现此类现象,矿机重启后即可正常。此类现象与矿机的运行环境,尤其是环境温度有很大关系;例如,在北方的冬天,如果突然降温,矿工很可能会出现这种现象。
另外请检查矿机的网络是否连接到矿池?外部网络不稳定时也会发生这种情况。如果重启后系统无法正常运行,请使用测试工具将矿机的三块算力板作为单板进行测试,检查算力板是否异常。
更新至最新固件。
1.3 掉线、缺板、掉屑。如下图24、图25、图26所示:
![算力板芯片 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/29034-16277084817778944.jpg)
图24 算力板芯片
![错过一个算力板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/adaf2-16277085459963026.jpg)
图25 矿机漏掉一块算力板
![矿工 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/bb5d8-16277085947836622.jpg)
图26 矿工
上述现象是由于矿机算力板故障引起的。在图23中,8板算力板上仅找到34个芯片。请使用治具对第8板进行单板检查,找出故障原因。在图24中,找不到第6块板。请检查第6板对应的IO线,电源线是否接触良好。如果没有问题,请使用测试工具对6板进行单板测试;图25中找不到第1块板,第2块板只有19个芯片,无法运行,请检查1号板的IO和电源线,并使用单板测试治具在第一块和第二块板上进行测试。
1.4 无GH/S(RT)算力、GH/S(AVG)算力降低、芯片XX现象、红灯闪烁。如图27所示:
![芯片显示 XX 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/ba769-16277094929235182.jpg)
图27 芯片全部显示XX
上述现象中,GH/S(RT)为0,GH/S(AVG)算力降低,芯片全部显示XX,红灯闪烁。这种现象多是矿机受到干扰后控制面板操作异常造成的。请检查架子、即插即用矿机的接地情况、矿机的220V电源线和AC-DC电源的接地情况以及环境的静电情况。
如果没有静电问题且接地良好,请升级最新固件并使用治具对算力板进行单板测试。
1.5 无GH/S(RT),无GH/S(AVG),红灯闪烁。如下图28所示
![升级最新固件 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/18ff3-16277096952051908.jpg)
图28 只有一个
这种现象甚至没有温度。从上图可以看出,只显示了一个风扇。原因是矿机只检测到一个风扇并对其进行保护。请检查两个风扇的插头线,或者找一个正常的风扇更换。
1.6 有GH/S(RT),GH/S(AVG)低,芯片全部显示X。如图29所示:
![29 GH/S(平均)算力 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/90508-16277100592943036.jpg)
图 29 GH/S(平均)算力
运行4小时内,HW已达到15万。出现这种现象,首先用测试治具对每块算力板进行测试。如果算力板没有问题,请将配置更新到最新固件。
1.7 GH/S(RT) 超高。如图30所示:
![30 GH/S(avg)算力高 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/5ec65-16277101381143476.jpg)
图30 GH/S(avg)算力较高
从上图可以看出,3号板的算力已经达到了4791T。这个值肯定是错误的,因为3号算力板的一些信号不正确,控制板收到了错误的信息。请使用测试治具对3号算力板进行单板测试。如有必要,请进行压力测试,与550M算力板进行对比,用600M频率进行测试,找到算力较低的芯片,然后更换。
1.8 无GH/S(RT)算力,红灯闪烁并报警。如图31所示:
报警现象:环境温度异常或风扇异常。从上图可以看出,第三块板的温度已经超过Temp(芯片)上限并报警。遇到这种情况,请检查矿井风道的风量。风道是否有堵塞?风扇是否损坏?散热片之间的缝隙是否有灰尘?
![无 GH/S (RT) 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/24d89-16277106454253431.jpg)
图31 无GH/S(RT)时,红灯报警
2、无法登录监控界面(WEB)
包括找不到矿机和IP。
这种现象大多是由于控制板,特别是固件问题引起的。遇到这种情况,先恢复出厂设置看是否可以正常登录后台,如果可以,请升级固件。
S11的控制板有两种,恢复出厂设置的方法是一样的。
一是Xilinx 7010控制板,如图32所示;另一种是Xilinx 7007控制板,如图33所示。
![7010 控制面板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/901b9-16277107129632338.jpg)
图 32 Xilinx7010 控制面板
![7007 控制面板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/a3a7c-16277107405439542.jpg)
图 33 Xilinx7007 控制面板
![控制板 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/5a56d-16277107916823271.jpg)
图 33 XILINX 控制面板
控制面板恢复出厂设置的方法是开机时按住IP Report按钮5秒以上,红绿灯闪烁时松开,开始恢复出厂设置。
如果恢复出厂设置无效,请进入控制板维护流程。
四.日常维护流程
![维修流程 蚂蚁矿机S11算力板如何维修?](http://www.bitnav.cc/wp-content/uploads/2023/09/62e3a-16277108255415922.jpg)
1、例行检测:首先对待修复算力板进行目视检查,是否有位移、变形、小散热片烧毁等情况?如果出现这种现象,必须先进行处理;如果小散热片移位,请先将其取下,然后清除黑色粘合剂,修复后重新粘合。
其次,目视检查确认没有问题后,可以先检测各电压域的阻抗,以检测是否存在短路或开路。如果发现,必须首先处理。
接下来检查各个电压域的电压是否达到0.4v,电压域之间的电压差不得超过0.05。如果某个电压域的电压过高或过低,则相邻电压域的电路一般都会出现异常现象,需要首先查找原因。
2、例行测试确认没有问题后(例行测试需要进行短路检测,避免上电时因短路烧毁芯片或其他材料),可以使用测试盒进行芯片检测,并可根据测试盒的检测结果来判断位置。
3、根据测试盒检测结果,从故障芯片附近开始,检测芯片测试点(CLK IN OUT/TX IN OUT/RX IN OUT/B IN OUT/RST IN OUT)电压)和 VDD VDD0V8 VDD1V8。
4、根据信号流向,反向传输RX信号(第84到第1芯片),并正向传输几个信号CLK CO BO RST(1-84),通过电源找到异常故障点供应顺序。
5. 定位到故障芯片后,需要重新焊接芯片。方法是在芯片周围添加助焊剂(最好是免清洗助焊剂),将芯片引脚的焊点加热至溶解状态,轻轻上下左右移动,压紧芯片;推动芯片引脚重新接合焊盘,收集锡,以便再次上锡。
如果重新焊接后故障相同,可直接更换芯片。
6、算力板修复后,必须对测试箱进行两次以上检查。两次测试的时间:第一次,更换部件后,算力板需要冷却;测试通过后,先放在一边。第二次,几分钟后算力板完全冷却后,进行测试。虽然两次测试每次都只持续几分钟,但并不影响工作。将修复好的板子放在一边,修复第二块板,修复完第二块板后,放置冷却,然后测试第一块板。方式上,修复是错开的,总时间长度没有延迟。
7、对于修复后的单板,首先需要对故障进行分类,并记录所更换部件的型号、位置、原因,反馈给生产、售后、研发。
8、烧录完成后,安装整机进行正常老化。
五、故障类型
S11常见故障类型:
1、散热片掉落、移位、变形
算力板芯片背面PCB板上的散热片在通电前不允许移位或碰撞,特别是不同电压的散热片。不同电压域的散热片接触意味着不同电压点存在短路的可能。
并且确定算力板上的各个散热片导热良好且固定牢固。
更换或重新安装散热片时,应清除散热片及芯片上残留的粘合剂,然后重新涂抹。残留的黑色胶可以将吹枪温度调到150度左右,用小刀刮掉。导热胶可用无水酒精清洗。
2、各电压域阻抗不平衡
当某些电压域的阻抗偏离正常值时,表明异常电压域存在开路、短路现象。一般来说,芯片是最有可能引起的。但每个电压域有3个芯片,出现故障时往往只有1个芯片出现问题。查找问题芯片的方法可以检测并比较各个芯片测试点的接地阻抗,从而找到异常点。
如果出现短路,首先拆下同电压芯片上的散热片,然后观察芯片引脚的锡是否连接。
如果从外观上找不到短路点,可按电阻法或电流切断法寻找短路点。
3、电压域电压不平衡
当某些电压域的电压过高或过低时,通常会在异常电压域或相邻电压域内出现异常IO信号,导致下一个电压域工作异常,电压不平衡。通过检测各测试点的信号和电压可以发现异常点,有的需要通过比较各测试点的阻抗来发现异常点。
请注意,CLK 信号和 NRST 信号是最有可能导致电压不平衡的两个信号。
4.缺乏芯片
缺芯片是指在检查测试盒时,并没有检测到所有的84个芯片,而且往往实际上并没有检测到所有的芯片。实际丢失的(未检测到的)异常芯片不在显示位置。这时就需要通过测试来准确定位异常芯片。
定位方法可以采用TX截止的方法来查找异常芯片的位置。即将某个芯片的TX信号接地,例如电压域第50个芯片的TX输出接地后,理论上如果前面所有芯片都正常,测试盒上应该显示50个芯片都正常检测到。如果未检测到全部50个芯片,则说明异常发生在第50个芯片之前;如果检测到50个芯片,则说明异常芯片在第50个芯片之后。利用这个二分法找出异常芯片所在的位置。
5.断链
断链与缺筹码类似,但在断链中,并不是所有找不到的筹码都是异常的,而是异常筹码之后的所有筹码都因某个筹码异常而失效。例如,某个芯片本身可以工作,但它不会转发其他芯片信息;这时,整个信号链就会突然中断,丢失很大一部分,称为断链。
一般情况下,断链可以通过测试盒显示出来。例如,测试盒检测芯片时,仅检测到14个芯片。如果测试盒中没有检测到预设的芯片数量,则不会运行,所以只会显示检测到了多少个芯片,此时根据显示的数字“14”,通过检测即可发现问题第14颗芯片前后各测试点的电压和阻抗。
6. 禁止跑步
不运行表示测试盒检测不到算力板芯片信息,但显示NO算力板;这种现象最为常见,涉及的故障范围也较广。
1)在一定电压域内电压异常导致不运行;通过测量各个电压域的电压就可以发现问题。
2)芯片异常引起的异常可以通过测量各个测试点信号来发现。
CLK信号:0.9V;信号从芯片01输出到芯片84。当前版本只有一个晶振。只要有一个CLK信号异常,后续的所有信号都会异常。根据信号传输方向进行搜索。
发射信号:1.8V;该信号通过01、02、、、、、84芯片传输,当二进制方法中的某一点出现异常时,可以向前检测。
接收信号:1.8V;该信号由84、、、、、、02、01芯片返回,通过芯片信号趋势确认故障原因;当S7、S9算力板不运行时,该信号优先级最高,首先搜索该信号。
BO信号:0V,当芯片检测到RI返回信号正常时可将该信号拉低为高电平,否则为高电平。
RST信号:1.8V;算力板上电插入IO信号后,信号从01、02、、、、、84传输到最后一个芯片。
3)芯片VDD引起
通过测量各电压域之间的电位差是否正常,一般情况下,当VDD电压为0.4V时,其他电压域中各测试点的正常电压也是0.4V,以保证各电压域之间的平衡。
4)芯片引起的VDD1V8电压异常
通过测量各电压测试点来判断VDD1V8电压是否正常。一般来说,IO电压决定了每个测试点的电压。当IO电压为1.8V时,其他电压域各测试点正常电压也是1.8V
5)降压电路、升压电路异常引起
直接测量算力板左上角C13电容输出两端电压是否有电压输出(输出电压多少与治具设置有关)。若无电压输出,需确认PIC是否有开关信号。
确认直流电压正常后,检查U2是否有13V电压输出,未检测到外围器件及U2本身。
7.算力低
低算力可分为:
1)测试治具进行测试时,盒子收到Notce不足,算力不足,显示NG。出现这种现象,可以直接通过测试盒的串口打印信息从各个芯片返回的Noce数量来判断。一般情况下,对于返回Nonce数小于设定值的芯片,应进行故障排查,排除伪焊及外围原因。直接更换芯片。
2)测试夹具时,矿机安装后算力是否较低。这种情况大多与芯片的散热条件有关。特别要注意的是每个芯片的小散热片的粘合情况以及整机的通风性能。
8. 芯片NG
通过测试盒进行测试时,测试盒的串口信息提示某芯片返回Nonce不足或为零。除了消除伪焊和外围元件的问题外,还可以直接更换芯片。
六.保养说明
1、维修时,维修人员必须熟悉各测试点的功能和流向、正常电压值和对地阻抗值。
2、必须熟悉芯片焊接,以免造成PCB发泡变形或引脚损坏。
3、S11使用的BM1387芯片不能与S9、T9+混用(该芯片为低功耗芯片)。芯片两侧16个引脚均已封装。焊接时极性和坐标必须对齐,不得错位。
4、更换芯片时,必须清理芯片周围的导热固定胶,避免IC焊接时悬挂或散热不良造成芯片二次损坏。
●注意:
1、由于芯片背面的散热片与芯片相连,因此必须使用专用的细长测试引线来检测测试点信号;表笔除了接触端裸露的金属外,其余部分必须用热缩管密封,以防止表笔同时接触散热片和测试点。特别是上下两排电路电压压差较大,在不同电压域接触地(散热片)和测试点时会造成芯片损坏,需特别注意。
2、焊接时,由于芯片背面靠近PCB有小散热片,导热快。因此,焊接时需要采用底部辅助加热(200度左右),这样可以提高效率,减少对PCB板的损坏。如果没有底部加热装置,请在更换芯片前将芯片背面PCB上的小散热片拆掉。
如有新的故障类型,请及时联系我公司工程部。我们将不断分析和更新此内容