本维修指南主要用于介绍芯动A10算力板的维修流程。
![A10算力板测试流程图 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/3b8da-16608141412528852.jpg)
请注意:电源板测试OK后才能使用电源板进行链测和贴后测试。由于电源板底部没有绝缘,请在绝缘垫上测试。
电源板测试:
1、准备1-2个金色样品,如下,用0Ω电阻短接R307(红色标注),并贴上散热片,因为这个样品要长期测试,这个样品专门作为电源板测试样品。
![电源板R307测试点 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/a5de6-16608141803532728.jpg)
2、测试前请先检查电源板是否接锡或连接器焊接不良,然后用固定输出12V电源将金色样品插入待测电源板,如下,并连接电源和控制板(控制板选型请参考步骤3),使用电源板测试程序进行测试。若报“√”,即电源板测试正常;如果报告“X”,请修复。
![金色样品插入电源板 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/d6013-16608141982790189.jpg)
3、控制板选型
方法一:使用T1控制板,只有一个风扇接口。
![控制板只有一个风扇连接器 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/bf476-16608142194416166.jpg)
方法二:使用T2T系列控制板,有两个风扇接口,但需要短接R394。
![带有两个风扇连接器的控制板 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/f0d53-16608142281020429.jpg)
![控制板R394位置 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/69dc7-16608142413435636.jpg)
测试链条的测试:
测试链测试的电源板样品必须使用已经通过电源板测试的电源板进行测试。
方法一:
将8个不带散热片的哈希模块插入已测试OK的电源板上。电源板无需进行任何操作。检查各哈希模块是否插紧。使用链测试程序进行测试。如果显示“√”,则说明测试正常,安装好散热器,然后进行贴后测试。如果测试结果显示“X”,则表示有故障,需要修理。
方法二:
插入一个或多个哈希模块进行测试,但电源板需要将未插入哈希模块的电源板插座的pin2和pin4短接。例如:如果待测试的哈希模块插在电源板的第1位,则需要将第2位连接器的pin2&pin4短接;如果待测试的哈希模块插在电源板的第1位和第2位,则需要将第3位连接器的pin2和pin4短接;
后贴测试
贴好后用最新的测试程序(版本号v2.16.3)进行测试。下图是一般连接图,供参考。
1个电源连接1个算力板和1个控制板进行测试。算力板需要放置在绝缘垫上进行测试,对应1个散热风扇;或者在矿箱中测试(矿箱中最好放1块算力板进行测试)。粘贴后最快测试时间约为9分钟,请尽量同时测试多个测试架。
电源板上的编号与芯片标签编号一一对应,如下:
![芯片位置 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/99b26-16608143022744871.jpg)
贴后测试一般有3种测试结果:“F”、“X”、“√”。其中,以显示结果为“F”的情况最多。
显示结果“F”的处理方法:
当测试结果界面显示“F”时,说明部分芯片正常,报错的芯片需要重新测试。
1、在报错芯片的散热片上贴上可移除的美工胶,并写入相应的错误代码。例如错误如下:
![错误代码 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/51858-16608143512581449.jpg)
芯片4、芯片5、芯片6、芯片7、芯片8需要重新测试。请将美术胶粘贴到相应的芯片上,并写入错误代码。没有报错的芯片1、芯片2、芯片3即可确定是好的。
2. 拆除哈希模块并重新安装哈希模块链接
测试人员将贴好美工胶的哈希模块从贴好后的电源板上取下,并将取下的报错哈希模块集中放置。如果确定哈希模块是好的,则将其留在电源板上。最后可以和其他也被判定为好的哈希模块进行组装,组装好的可以直接组装老化。
3. FA分析
在集中报错哈希模块中,将对E3/E15/E16/E19错误码进行FA分析和修复。E3 E15和E16可以重组在一起组成贴后板(8块),哈希模块可用于贴后复测分析,E19不需要复测。等待分析结果。
显示结果“X”的处理方法:
如果测试结果界面显示“X”,则需要对整板进行分析:
![测试结果X 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/e9e16-16608143837845137.jpg)
E0:X—链条故障
如果八个哈希模块测试链报告E0:X,一般是因为第X个芯片有问题。你可以把这个芯片拆下来,换上一块好的算力板来验证。
如果确定这块算力板有问题,可以使用修复程序单独测试这块算力板,进行如下分析:
①测量电压:用小电源板测量给A10芯片供电的Vcore(0.8V左右)是否正常,VDDQ(1.35V)和三个LDO电压(两个1.8V,一个0.8V)是否正常。如果0.8V、1.35V不正常,可以先测量EN脚是否为3.3V,然后分析DCDC模块是否异常;如果LDO无1.8V和0.8V输出,则LDO异常;
②测量时钟信号:两个晶振驱动的5个通道是否都是50M;
③ 测量控制信号:Reset/Start是否均为1.8V;
④测量SPI信号:示波器测量socket的输入端是否有sck_I、cs_I、sdi_I、sdo_I;测量sck_O、cs_O、sdi_O、sdo_O输出是否异常。如果不正常,则测量插座后面SPI信号所连接的47Ω电阻是否异常。
![链条故障测试点 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/644e8-16608144191094724.jpg)
![电压测量原理图 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/3314a-16608144358354490.jpg)
![测量控制信号 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/541a3-16608144501566587.jpg)
![测量 SPI 信号 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/25939-16608144587693937.jpg)
E3:X—芯片工作全部错误
可以用贴后程序对板子进行单独测试,进行如下分析:
①测量Vcore电压和纹波,电压需要0.8~0.85V,纹波在35mv以内;
②使用4G后贴程序查看是否还报E3,如果还报E3则转步骤3;
③ 联系我们寻求分析帮助。
E4:X—PLL解锁
如果确定这个Hash模块有问题,可以使用修复程序单独测试这块板子,进行如下分析:
①测量时钟信号:两个晶振驱动的5个通道是否都是50M;
②测量提供给四个颗粒的Vcore、VDDQ电压是否正常;
③ 联系我们寻求分析帮助。
E14:X—核心字节错误
如果确定这个hash模块有问题,可以使用修复程序单独测试这块板子,进行如下分析:
①查看日志,观察Sub_good_core数量是否大于390,测量Start信号是否为1.8V;
②测量时钟信号:两个晶振驱动的5个通道是否都是50M;
③测量提供给四个颗粒的Vcore、VDDQ电压是否正常;
④ 联系我们寻求分析帮助。
E15:X—写错了
①测量时钟信号:两个晶振驱动的5个通道是否都是50M;
②测量提供给四个颗粒的Vcore、VDDQ电压是否正常;
③ 联系我们寻求分析帮助。
E16:X—DDR训练错误
可以用贴后程序对板子进行单独测试,进行如下分析:
①查看日志,是否是4G训练错误或者超频后训练错误。如果是4G训练错误,进入步骤2。如果超频后训练错误,需要运行三四次检查稳定性。如果有时OK有时不OK,且稳定性高,则可以作为普通板使用,如果一直不OK,则可以作为维护板使用;
② 检查日志哪一侧训练失败,然后测量该侧的电源 VDDQ 和时钟信号。如果正常,则需要更换该侧的粒子进行验证;
③ 联系我们寻求分析帮助。
E17:X—Dag准备错误
可以用贴后程序对板子进行单独测试,进行如下分析:
①查看日志,观察Sub_good_core数量是否大于390,测量Start信号是否为1.8V;
②测量提供给四个颗粒的Vcore、VDDQ电压是否正常;
③ 联系我们寻求分析帮助。
显示结果“√”的处理方法:
如果测试结果界面显示“√”,则可以直接锁紧螺丝,然后进行组装和老化。
![测试结果 √ 芯动A10算力板维修指南](http://www.bitnav.cc/wp-content/uploads/2023/09/5c458-16608145231036222.jpg)
芯动A10常见错误代码及其对应的处理方法:
测试环节 | 检测结果 | 错误代码 | 错误代码说明 | 原因 | 方法 |
电源板测试 | X | E0:1 | 链条故障 | 1.用于电源板测试样品不良、断线或未回环; 2、被测电源板故障,12V或3.3V无输出。 | 维修 |
E18 | 电源板无法稳压(新) | 编程失败 | 重新编程或更换DAC芯片 | ||
√ | 没有任何 | 好产品 | |||
粘贴前测试 | X | E0:1 | 链条故障 | 1. 测试治具问题:接触不良或电源板样品不良 2. 测试的哈希模块失败 | 维修 |
√ | 没有任何 | 好产品 | |||
粘贴后测试 | X | E0/E1~E13 | 与BTC相同的错误代码 | 需要 FA 分析 | 整板(包括8个哈希模块)送FA维修。修复后整板送至生产线重新进行后贴测试。 |
E14 | 核心双轨故障(新) | 1、控制信号Start-EN没有拉高 2、芯片不良 | |||
E18 | 电源板无法稳压(新) | 编程失败 | |||
F | E3 | 单片机错误率100% | 分析后给出处理方法 | 粘贴报错哈希模块对应的错误码,拔掉报错哈希模块,发送给FA进行分析。不报错的hash模块直接组装老化(贴前后无需测试) | |
E15 | 3G chace写错 | ||||
E16 | 10G DDR训练失败 | ||||
E17 | dag 生成失败 | ||||
E19 | 3G DDR训练失败 | ||||
√ | 没有任何 |