文 | 邱吉洲(南京能利芯VP | 专注AIDC电源与光互联技术)
光纤缺陷率5%到10%。不是一条产线的数据——是整家公司,从光无源器件到光模块,从光通信零组件到子系统,所有产品线共同的痛点。
这个问题存在了数年。从CTO到技术总监,从工程到品质,所有人都认为这是人为操作问题——光纤又细又长,从Pigtail到光模块整个流程根本无法完全自动化,手必然要接触。所以解决方案就是加强培训、让操作员更小心。
后来我花了几个月时间,不是去否定这个前提——光纤确实必须人手操作——而是重新回答了另一个问题:所有被判定为"缺陷"的痕迹,到底哪些真的会出问题?哪些只是看起来吓人?
当年就帮这家美资光通信上市公司省了500到1000万。更没想到的是,多年以后,这套分类方法和标准化体系被老同事们带到了整个光通信行业。
一个系统性灾难
先说清楚这到底是个什么问题。
光纤有三层:最内层的Core(纤芯)传输光信号,Cladding(包层)约束光,最外层的Buffer Coating(涂覆层)负责保护。Buffer Coating的材料是聚丙烯酸酯——轻、薄、脆弱。
脆弱到什么程度?人的手指甲划过去,就能留下一道痕。
![]()
光纤结构示意图
![]()
AIDC数据中心广泛应用的光纤
全球光纤市场的主要参与者包括康宁(Corning)、古河电工(Furukawa)、藤仓(Fujikura)等。国内方面,长飞光纤(601869)是全球最大的光纤预制棒及光纤光缆制造商之一,亨通光电(600487)、中天科技(600522)、烽火通信(600498)也是光通信产业链的核心企业。这些公司覆盖了从光纤预制棒、拉丝到光缆、光器件的全产业链。
而光纤制造有一个无法绕开的现实:从Pigtail组装到镀膜、准直器、隔离器、WDM、光开关、光环行器,直到最后的Transceiver——数十个产品系列、上百道工序,每一道都需要人手接触光纤。光纤又细又长,哪怕盘成圈,操作起来也必须手介入。你想做全自动化?在那个年代的工艺条件下,做不到。
一旦光纤被判定为"缺陷",只有一个结局:报废。没有返修,没有降级使用。整根报废。
而这5%到10%的报废率,横跨了几十个产品系列——每一个环节都在为它买单。
从光纤器件到光模块到子系统,所有人都认为:这就是人为操作问题
这个问题不是没人管。恰恰相反,全公司都在管——管得越来越狠。
为什么所有人都觉得是人为操作?因为在当时的条件下,这个判断逻辑上站得住脚:
第一,光纤确实是人手在操作的。手工工序太多,接触不可避免。这是物理事实。
第二,一个更深层的担忧——也是推动报废标准越来越严的真正原因——大家真心相信:哪怕现在看起来只是一道轻微的皮伤或皮裂,随着时间推移、温度变化和机械应力,这个微小的损伤会逐步扩展、恶化,最终导致整个Coating层脱落、包层裸露,造成可靠性的灾难性失效。
基于这个假设,逻辑链条是这样的:人手必然接触光纤 → 接触必然产生痕迹 → 痕迹必然扩展恶化 → 最终必然导致可靠性失效。在这个逻辑链里,"加强培训让操作员更小心"是唯一能做的事。
于是各产品车间层层加码。目检不够上20倍显微镜,20倍不够上40倍——任何微小的表面痕迹都可以被判废。检验成本飙升,lead time无限拉长,而报废率依然没人敢算清楚。
更根本的问题是:没有人有一套成型的标准化体系来系统性地处理这件事。对光纤缺陷的管理,全公司上下只有一条规则——"有痕就判"。粗糙,但没有人知道更好的做法。
一件"不是我的事"
当时我的本职是下游产品的产品工程师,兼元器件工厂的系统工程师。按常理说,我只要把下游的检验标准加严,确保从我这里出去的产品不出问题,把压力传回上游就行了。
但那个时间点,我看着每个车间都在"20倍不够就40倍"地往上加码,看着报废品堆得越来越多,心里越来越不舒服。我跟自己说了一句话:
这不是一个部门的事。这是一件值得有人站出来管的事。
然后我就去管了。
第一步:统一语言—定义问题
第一件事,不是查资料、不是拉数据——是去梳理"语言"。
走访各个车间的时候,我发现了一个比报废率更根本的问题:同样一道痕迹,在A车间叫"光纤破皮",在B车间叫"光纤皮伤",在C车间叫"光纤皮裂"。不同的人、不同的线、不同的经理,看到同一个东西,描述完全不同。
我把所有车间关于光纤缺陷的描述词全部收集起来,梳理分类,去掉重复和模糊的说法,归成几大类。每一类有统一的名称、统一的定义、统一的图示。
这不是咬文嚼字。如果连"这是什么问题"都没有共识,后面所有的讨论都是在打空气。
第二步:不是所有缺陷都一样——分类体系
统一语言之后,真正的工作才开始。我对不同类别的缺陷,逐一做了三件事:
第一,溯源成因——这道痕迹是在哪个工序、因为什么原因产生的?是操作动作不可避免的正常接触,还是夹具设计不合理刮出来的,还是走线路径本身有问题?
第二,判断严重性——这种损伤对光纤性能与长期可靠性到底有没有影响?
第三,匹配方案——如果确实有风险,该改的是标准,是工艺,还是管理?如果没有风险,为什么还要报废?
拆完之后,真相浮出来了:
第一类缺陷:Buffer Coating表面轻微划伤——皮裂、皮伤、轻微掉皮,但包层(Cladding)完好无损,没有裸露。
这是最多的一类。在40倍显微镜下看得一清二楚,很吓人。溯源发现,其中相当一部分就是Fiber handling过程中无意刮擦造成的——聚丙烯酸酯的脆弱程度决定了这类接触痕迹几乎无法根除。
但关键问题是:它会恶化吗?全公司最深的恐惧就是——这些微小的表面损伤,会不会随时间扩展,最终导致整个Coating层脱落?
从光纤结构及每一层结构的材料及功能用第一性原理进行分析,Buffer Coating的损伤应该不会造成光纤的功能性损伤的。
我知道自己在公司人微言轻。我需要一个外界的声音。所以我直接发邮件联系了他们的Specialist,并跟他们探讨Buffer Coating表面损伤,在长期使用中会不会扩展并导致可靠性失效的问题。
Corning的专家给出了明确的结论:Typical Buffer Coating defect不会随时间扩展恶化。聚丙烯酸酯涂层对光纤性能的保护,并不依赖于表面的完整性。这些研究Corning自己做过了一些研究的。
![]()
康宁单模光纤轴
这意味着什么?意味着全公司过去几年报废标准所依赖的核心假设——"Buffer Coating defect会扩展并最终导致失效"——是错的。这不是一个"降低标准"的问题,这是一个根本性的认知纠偏。
在这个科学依据的基础上,我们对这类缺陷光纤逐批做了拉力试验和高温高湿(85°C/85%RH)可靠性实验,跑了1000小时。结果与Corning的结论完全一致:插损不变,反射不变,断纤率不变。
结论:这一类缺陷不影响光纤的性能和长期可靠性。可以被接受。
第二类缺陷:包层裸露,或Coating脱落导致玻璃纤维直接暴露。
这一类确实有风险。但往下追溯成因发现,它也不是简单的"操作员不小心"。很多时候,是特定工序的夹具夹持位置不对、力度未校准,是光纤在某个工位上的走线路径存在不合理的设计。
这一类不能接受——但它的解决方案不是在惩罚层面加码,不是在培训上反复说教。而是在工艺层面和管理层面做改进:优化夹具设计、调整走线路径、标准化关键参数。
还有一类介于两者之间的——Coating有较深的划伤但未到包层,且处于后续要经历高应力工序的位置。这一类需要根据缺陷的具体位置和最终应用场景,分级判定。
三类的核心逻辑是同一句话:不同类别,不同成因,不同风险等级,不同处理方式。一刀切地"有痕就判",不是一个标准——是一个偷懒。
三类问题,三种逻辑,三套方案。三张牌全摊开之后,所有人都能看到:过去几年那一刀切的"有痕就判",判对了多少、判错了多少、漏了多少。
第三步:两件事并行
分类体系建立之后,接下来的不是"改标准"一件事,是两件事并行:
一、对不影响可靠性的轻微Buffer Coating损伤——停止判废。
这不是"降低标准"。这是基于Corning的材料科学结论和本公司可靠性实验数据,纠正一个长期存在的错误假设。在一个错误的标准上越查越严——20倍不够上40倍——不是在提升质量,是在加速浪费。
二、对真正有风险的缺陷——改工艺,改管理。
既然光纤的手工操作不可避免,既然无条件追求"零接触"不切实际,那就要接受这个物理前提,然后在这个前提下建立一套有据可依的标准化体系:哪些工序是高风险点、夹具参数怎么设、走线路径怎么排、检验标准怎么定。操作员本身不是问题的根源,没有成型的标准化体系才是。
两件事同时做:不该报废的不报废,该优化的去优化。一个做减法,一个做加法。
第四步:拉联盟,推落地
方案有了,但真正难的是让整个公司接受这个分类逻辑。我当时的职位和资历不足以让技术体系听从我的判断。
Corning的科学结论帮我解决了第一道坎——这不是一个下游产品工程师的主观看法,这是行业最权威的材料科学判断。内部没有人能在技术上推翻它。
第二道坎,我拉上了品质工程、制造部门及市场技术部门的核心成员,成立了跨职能项目小组。把"你部门的问题"和"我部门的问题",变成"我们一起解决的问题"。人是需要同盟的——不是技术上需要,是在推动组织变革的时候需要。
结果:省了500到1000万,但不止于此
新体系推行之后,当年的光纤相关报废大幅下降。第一类轻微损伤不再判废,第二类真风险通过工艺和管理改进消除,第三类中间态按分级标准逐案判定。可制造性、合理性和可靠性第一次被同时纳入了一套框架。一年节省的成本在500万到1000万之间。
更长远的影响是:多年以后,参与过这个项目的同事们去了光通信行业的各个角落——有人做技术负责人,有人做品质经理,有人做了厂长——他们把这套缺陷分类方法、判定标准、以及对应的工艺标准化体系带到了新公司。带到了同行,带到了上下游。
如今,这套方法的影子,已经散布在整个光通信行业里了。
这件事教会我的四样东西
第一,挑战一个共识之前,先确认它背后隐藏的假设是什么。
所有人都说"这是人为操作问题"——这句话本身没错,光纤确实是手在操作。真正的问题是藏在后面的假设:"人为操作产生的痕迹一定会扩展并导致失效。"而从第一性原理进行材料功能分析,这个假设不成立。找到那个隐藏的假设,然后问它到底对不对——这是破局的关键。
第二,把问题分类,比找答案更重要。
把一团乱麻拆成几类——每一类有自己的成因、自己的风险、自己的方案——你才能知道该打哪里、该放哪里。一刀切的"有压痕就判"不是标准,是偷懒。
第三,在无法消除人为因素的领域,标准化体系比"加强培训"管用一百倍。
如果手工操作是不可避免的,那你的工作不是要求操作员变成机器人——是在这个前提下建立一套科学的标准。工具怎么设计、参数怎么设定、检验怎么判定,把对人的依赖降到最低。
第四,推动组织变革需要两样东西:外部的权威影响,和内部的同盟。
Corning的结论是"权威"层面的保障,没人能和你争。品质工程及制造和市场技术核心的结盟是"推动"层面的保障,没人孤立你。缺一个,事情都落不了地。
![]()
DMAIC方法论
最后
你不需要在光通信行业工作,也能从这件事里借鉴有用的东西。
如果你在公司里看到一个老问题,所有人都认定了原因,解决方案也很明确——但你隐隐觉得,那个"原因"背后藏着一个从未被验证过的假设。如果你的职位和资历看起来不够格去挑战。
想一想这件事。
全公司从CTO、技术总监、品质总监到工厂管理管理人员及工程技术人员一致认定的逻辑链条,里面可能有一个环节是错的。而找到那个环节的人,未必是级别最高的。往往是最想解决问题的那个。
本文侧重于方法论而不是行业分析。







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论