一、维护平台/工具/设备准备要求
1、平台要求:
维修工作台( 工作台需接地)、防静电手腕带、接地线。
2、设备要求:
恒温烙铁 (350℃-380℃)、尖头烙铁头用于贴片电阻、电容等小贴片的焊接;便携式拆焊枪 和BGA返修台用于芯片/BGA拆焊;使用带焊钢针和热缩T型套管的万用表方便测量(推荐使用Fluke 15B+);示波器 (推荐FNIRSI)、网线(要求:互联网连接、网络稳定)
3、测试工具要求:
APW12电源 (APW12_12V-15V_V1.2和电源适配器线(自制:使用粗铜线连接电源正负极和算力板。建议使用4AWG铜线,长度60cm或更少)用于算力板。
使用V2.2010控制板的测试治具。测试治具正负极需安装放电电阻。建议使用25欧姆、100W以上的水泥电阻。
4、维修辅助材料/工具要求:
锡膏柱M705、助焊剂、 无水酒精电路板清洗液;返修后用洗板水清理焊锡残渣;修复后使用导热胶涂抹 芯片表面;
镀锡工具钢网、除锡丝、焊球l(球径建议0.4mm);更换新芯片时,需要将芯片管脚镀锡,然后焊接到算力板上,在芯片表面均匀涂抹导热胶后,锁住大散热片。
1)条码扫描枪
2)端口转接板 RS232/TTL转接板 3.3V
3)自制短路探头(用针线焊接,需要热缩T型套管,防止探头与小散热片短路)
5、常用维修备件材料要求:
0402电阻(0R、51R、10K、4.7K、);0402电容(0.1uf、1uf)
二. 维护要求
1、更换芯片时要注意操作方法。更换任何配件后,PCB板应无明显变形。检查更换件和周围部件是否有开路和短路问题。
2、维修操作人员必须具备专门的电子知识,一年以上维修经验,精通BGA/QFN/LGA封装焊接技术。
3.修复后算力板必须测试两次以上才OK才可以通过!
4、检查工具和算力板测试仪是否 可以正常工作,确定维修站测试软件参数、测试治具版本等。
5、维修、更换芯片时,需先对芯片进行测试,合格后再进行功能测试。
功能测试必须保证小散热器焊接合格。安装大散热片时,芯片表面必须均匀涂上导热胶,散热风扇应全速运转。使用机箱散热时,应同时放置2块算力板,形成风道。
6. 测量信号时,使用4个风扇辅助散热,风扇应保持全速运转。
7、算力板通电时,必须先连接电源负极铜线,再连接电源正极铜线,最后插上信号线。拆卸时,安装顺序必须相反。首先拆掉信号线,然后拆掉电源正极铜线,最后拆掉电源负极铜线。如果用户不按照这个顺序,很容易对R89、R90、U2、U4造成损坏(不是所有芯片都能找到)。另外,在测试花样之前,修复后的算力板必须先冷却;否则可能会导致PNG测试。
8、更换新芯片时,需要印刷引脚和焊膏,以确保芯片预焊并焊接到PCBA上进行维修。
三.算力板测试仪制作及注意事项
算力板测试仪的支撑夹具应满足算力板的散热并便于信号的测量。
1、首次使用19系列算力板测试仪SD卡刷卡程序更新算力板测试仪控制板FPGA,解压后复制到SD卡上,然后将卡插入算力板测试仪卡槽;开机约1分钟,等待控制板指示灯双闪3次,则更新完成;(如果不更新,可能会导致测试时某个芯片坏)
图3-1
2、根据要求制作测试SD卡,直接解压单面散热片检测芯片压缩包制作SD卡;
图3-2
3、测试SD卡会根据要求制作,双面散热片8次Patter测试需要制作一张SD卡,如下图;
1)解压后删除原来的config文件;
2)将原Config.ini-NBS1902-PT2文件命名为Config.ini;
图3-3 图3-4
图3-5
四.原理概述
1、S19+算力板工作结构:
算力板由80颗BM1398AC芯片组成,分为10个域,每个域由8个IC组成(如图4-1和图4-2所示);S19+算力板使用的BM1398AC芯片工作电压为1.34V-1.4V;对于第十个域,有两组LDO,分别为1.8V和0.8V。1.8V LDO 由 VDD_14V 输出的 14V 供电,输出 1.8V。该域的 1.8V 输出通过 LDO 提供 0.8V。第九域——第一域,LDO由后面域的VDD供电,输出1.8V。域 1-9 共有三组 0.8V LDO。下一个域的 VDD 通过 LDO 提供 0.8V。0.8V-1 用于一个域的第一和第二 ASIC;0.8V-2用于一个域的第三至第五ASIC;0.8V-3 用于一个域的第六至第八 ASIC。每退一域的电压就减少1。
图4-1
图4-2
图4-3
图4-4
2. S19+测试点和温度IC:
顶部测试点:
底部测试点:
底部温度IC:
3、S19+芯片信号趋势:
1)CLK(XIN)信号流向,由Y1 25M振荡器产生,从芯片01传输到芯片80;电压0.7V-1.3V;
2)TX(CI、CO)信号流向,从IO口七个引脚(3.3V)经过电平转换进入IC U4,然后从芯片01传输到芯片80;未插入IO信号时电压为0V,工作时电压为1.8V;
3)RX(RI、RO)信号流向,从芯片80流向芯片01,通过U2返回信号线端子8脚再返回控制板;未插入IO信号时电压为0.3V,计算时电压为1.8V;
4)BO(BI,BO)信号流向,从芯片01到芯片80;Fluke 15B+万用表测量值为0V;
5)RST信号流从IO口的3脚开始,然后从芯片01传输到芯片80;如果没有插入IO信号且设备处于待机状态,则计算时电压为0V、1.8V;
4. 整个矿机架构:
整机主要由3块算力板、1块控制板、APW12电源、4个散热风扇组成,如图4-5所示。
图4-5
五、算力板常见故障及处理方法
现象一:单算力板测试检测芯片为0(PT1/PT2站)
第一步:检查VDD_14V的电压输出及电压域
每个电压域的电压约为1.34V-1.4V。如果有14V电源,一般都有域电压。如果没有VDD_14V,请检查PSU的输出;如果正常,则检查PIC电路(按照以下步骤检查PIC电路)。如果14V有电源但无域电压,继续检查。
图5-1
检查PIC电路:
测量U4第11脚是否有输出,电压约为3.3V;如果是,请继续排查问题;如果没有3.3V,请检查算力板测试线和算力板的连接状态是否正常,并重新烧写PIC。
图5-2图5-3
图5-4
PIC编程步骤:
1、算力板上PIC程序编程。
程序:20200101-PIC1704-BM1398-V89.hex
下载编程工具:PICkit3;PICkit3电缆的引脚1对应PCB上J2的引脚1,需要连接引脚1、2、3、4、5和6。
图5-5
2、编程软件:
打开MPLABIPE,选择器件:PIC16F1704,点击power选择供电模式,然后点击operate。第一步:选择文件找到要烧写的.HEX文件;第二步点击正常连接;第三步是单击程序按钮。完成后点击验证,提示验证,证明编程成功。
图5-6
第二步:检查升压电路输出
测试图5-7中的D1可以测量14V电压。
图5-7
第三步:检查每组LDO 1.8V或PLL 0.8V的输出
第四步:检查芯片信号输出(CLK/CI/RI/BO/RST)
1、参考信号趋势描述的电压值范围。如果测量遇到电压值有明显偏差,可以与相邻组的测量值进行比较来确定。
PS:如果算力板没有按照测试顺序上电或者断电,导致R89、R90、U2、U4烧坏,芯片会报0;
2、算力板测试仪液晶屏显示EEPROM NG时,检查U10焊接是否正常;
3、如果算力板测试仪液晶屏显示PICsensor NG且测试读取温度异常,则按照以下步骤排查:
1)检查R71~R77 4个电阻是否焊接异常,检查U4的PIN2、3焊接是否规范;
2)检查四个温度传感器U7、R78、R80、R81是否正常;U8、R83、R84、R88;U9、R92、R94、R95;U11、R96~R98、匹配电阻焊接异常,温度传感器位置如图5-8所示,温度传感器全部位于PCB背面,电阻位于正反面PCB的情况,温度敏感的3.3V电源是否正常;检查热敏芯片和小散热片的焊接质量。大的散热片材料的变形会导致芯片散热不良,影响温差。
图5-8
现象二:单算力板检测芯片不完整(PT1/PT2站)
1、LCD显示ASICNG:如果(0),先测量测量域总电压,升压电路14V正常,然后用短路探头将RO测试点与1V8测试点之间短路第一和第二芯片,然后运行程序找到芯片。查看串口日志,如果此时仍然发现有0芯片,那么就会是以下情况之一:
1)用万用表测量1V8和0V8测试点电压是否为1.8V或0.8V。如果不是,说明该域的1.8V或0.8V LDO电路异常,或者该域的两块ASIC芯片没有焊接好;大部分是0.8V、1.8V贴片滤波电容短路造成的(测量PCBA正反面相关贴片滤波电容的阻值)。
2)检查U2、U4电路是否有异常,如阻焊等。
3)用Fluke 15B+万用表测量R89或R90的阻值, 检查是否在10欧姆以内,且读数不会乱跳。如果不是,请更换这两个电阻。
4)检查第一个芯片的管脚是否焊接好(维修时发现从侧面观察管脚有镀锡,但拆下芯片后管脚根本没有沾锡)。
2、如果在步骤1)中能找到一个芯片,则说明第一个芯片和前一个电路是好的。用类似的方法检查后续芯片。例如,将第38和第39芯片之间的1V8和RO测试点短路。如果日志可以找到38个芯片,则前38个芯片没有问题;如果还是发现0个芯片,先检查1V8;如果正常,说明38以后的芯片有问题。继续用二分法排查,直到找到有问题的芯片。例如,假设第N个芯片出现问题,当第N-1个和第N个芯片之间的1V8和RO短路时,可以找到N-1个芯片,但是当第N个和第N个芯片之间的1V8和RO短路时,可以找到N-1个芯片。第N+1个芯片短路,整个芯片找不到。
3. LCD显示ASIC75:(报告75),表示算力板在115200波特率下可以检测到76个芯片,但在12M波特率下只检测到75个芯片,在12M波特率下检测不到1个芯片;
修复方法:采用二分法,通过短路探头将第38、39号芯片之间的1V8测试点和RO测试点短路。如果日志可以找到38个芯片,则前38个芯片没有问题;如果短路47个芯片,但日志报46,说明检测不到第47个芯片,目测没有问题。一般更换47号芯片即可;
图5-9
4. LCD显示ASICNG:(X,某芯片固定),有两种情况:
1)第一种情况:测试时间与好板基本一致(一般情况下每次测试X的值不会改变)(测试时间是指从按下开始测试按钮到得到结果的时间ASICNG:(X) 显示在 LCD 上)。这种情况很可能是第X芯片前后CLK、CI、BO电阻焊接异常造成的,所以用户重点关注这6个电阻。
小概率是由于X-1、X、X+1,即三个芯片中,出现芯片的以下管脚焊接异常情况:
2)第二种情况:测试时间几乎是好板的两倍(有时每次测试X的值都会改变,有时X=0);此时日志通常有以下信息(红色数字不是13,取决于算力板测试仪连接到哪个座席);测试时,假设异常位置前面的所有场的域电压几乎都小于0.3V,而后面的场的域电压几乎都高于0.38V。这种情况是芯片没有焊接好造成的;通常是1.8V、0.8V、RXT、CLK没有焊接好。建议直接测量域电压来定位问题所在。1)节中使用的1V8和RO短路方法也可以定位异常位置;
图5-10
现象三:单算力板Pattern NG,表明响应nonce数据不完整(PT2站)
Pattern NG是由于该芯片与其他芯片的特性存在显着差异造成的。目前发现芯片管芯损坏,只需更换芯片即可。根据日志信息,替换规则如下:
如果芯片外观没有损坏,只需更换各个域中响应率最低的芯片即可。例如下图是其中一份测试日志,从日志中可以看出,四颗芯片asic[36][37][43][75]的响应率较低。这是因为36和37在同一个域中,因此将36和37中的nonce替换为较低的nonce。同时替换43和75。
PS:特别注意域号,asic是从0开始的。
图5-11
现象4:检查芯片测试正常,PT2功能测试串口不停止(长距离运行)
修复方法:PT2测试时,观察串口打印日志。当串口开始长时间工作时,使用短路探头将RO&1.8V短路。短路从第一个芯片开始。如果短路后串口停止长期工作,则第一颗芯片正常。根据这种方法,找到某颗芯片短路后仍然存在长期运行故障的芯片。
一般是某个芯片损坏造成的,更换即可;
图5-12
现象五:PT1芯片测试正常,PT2功能测试总是报某芯片NG;
修复方法:检查外观,测量前面的贴片电容或电阻,一般是贴片焊接不良或贴片电容、电阻损坏或阻值异常所致;
六.控制板问题导致以下问题
1.整机不运行
1)检查几个电压输出点电压是否正常。例如,如果3.3V短路,可以先断开U8。如果仍短路,可拔掉CPU进行测量。对于其他电压异常,一般更换相应的转换器IC。
2)如果电压正常,请检查DDR/CPU的焊接状态;
3)尝试用SD卡更新flash程序;
A。卡恢复成功后,绿色LED指示灯常亮,关闭电源重新启动;
b. 再次上电后等待30秒(开启OTP的时间过程)
C。OTP(One Time Programmable)是MCU的一种存储器类型,意思是一次性可编程:程序烧写到IC后,不能再次更改和清除;
防范措施:
1)OTP过程中突然断电或时间小于30s会导致控制板无法开启OTP功能。对于控制板无法启动(未联网)的问题,用户需要更换U1(控制板主控IC FBGA)。更换后U1不能再在19系列中使用。
2)对于开启OTP功能的控制板,U1不能用于其他系列机型;
图6-1
2、全机找不到IP
可能是操作异常导致找不到IP。故障排除请参考第一点。
检查网口、网络变压器T1、CPU的外观及焊接情况。
3.整机无法升级
检查网口、网络变压器T1、CPU的外观及焊接情况。
4、整机读算力板失败或算力板较少
1) 检查电缆连接状态。
2)检查控制板上与链条对应的部分。
3)检查插件引脚的波峰焊接质量和插件接口周围的电阻。
图6-2
七.整机故障现象
1.整机测试
常见现象:检测不到IP、粉丝数异常、外链异常。如果测试异常,请按照监控界面和测试LOG提示进行维护。
1)风扇显示异常:我们需要检查风扇是否正常工作,与控制板的连接是否正常,控制板是否异常。
2)少链:少链是指3块算力板中缺少1块。大多数情况是算力板和控制板之间的连接有问题。首先,检查电缆是否存在断路。如果连接正常,用户可以测试单板PT2是否可以通过。如果测试通过,基本可以确定问题出在控制板上。如果测试失败,则使用PT2修复方法进行修复。
3)温度异常:一般是由于温度过高造成的。我们的监控系统设定的PCB温度不能超过90度。如果超过90度,矿机就会报警,无法正常工作。所以矿机无法正常工作通常是由于环境温度过高、风扇运转异常等原因造成的。风扇运转异常也会引起温度异常。
4)找不到所有芯片(开机可以操作,但算力是正常值的2/3或1/3)。所以芯片数量不够:如果数量不够,可以参考PT2进行测试和修复。
图7-1
5)运行一段时间后,没有算力,矿池连接中断;然后检查网络;
图7-2
6)正常矿机测试状态;
图7-3
7)某块算力板算力较低:针对这种情况,可以通过Putty软件登录该IP,观察该算力板的域工作电压是否正常,NONCE返回是否正常。然后根据Putty LOG提示进行修复即可。
8)如何使用腻子?具体操作如下:
A。打开Putty,输入相关矿机的IP,然后点击打开。
图7-4
b. 输入用户名、密码和测试命令,检查NONCE响应状态和电压域状态。如果NONCE和域电压异常,用户可以根据打印的异常芯片进行测量和维修。
图7-5
八.其他注意事项
维护流程图
● 例行检查:首先目视检查待修复的算力板,观察PCB是否有变形、烧焦的情况。如果是,则必须先处理;零件是否有明显烧焦痕迹、偏移零件或缺失零件等;其次,目视检查通过后,可以先测试各电压域的阻抗,检测是否存在短路或开路的情况。如果发现,必须首先处理。进一步检查各域电压是否在0.36V左右。
● 例行测试通过后(一般例行测试中的短路测试是必要的,避免上电时因短路而烧毁芯片或其他材料),即可进行芯片测试。算力板测试仪。可以根据算力板测试仪的测试结果来确定定位。
● 根据算力板测试仪检测显示的结果,从附近故障芯片处,检查芯片测试点(CO/NRST/RO/XIN/BI)和 VDD0V8、VDD1V8 等电压。
● 从信号流程来看,除 RX 信号反向传输信号(从 76 号芯片到 1 号芯片)外,包括 CLK CO BO RST 在内的几个信号都是正向传输(1-76),并且通过供电时序可以找到异常故障点。
● 找到故障芯片后,需要重新焊接芯片。方法是在芯片周围添加助焊剂(最好是免清洗助焊剂)并将芯片引脚的焊点加热至溶解状态,促使芯片引脚、焊盘重新磨合并收锡,以达到效果再次镀锡。如果重新焊接后故障依旧,可以直接更换芯片。
● 使用算力板测试仪进行测试时,修复后的算力板通过两次以上即可判定为良品。首次更换部件后,请等待算力板冷却,使用算力板测试仪进行测试,测试通过后,放置一边冷却。然后,第二次,几分钟后,当算力板冷却时再次测试。