人工智能 (AI) 似乎无处不在,应该可以帮助解决很多问题。但它也适用于线束行业吗?
在2022年11月30日,美国OpenAI发布了ChatGPT, ChatGPT是基于AI的自然语言处理工具。
我们先看一下最近几个月的AI发展历程:2023年3月14日,斯坦福大学发布了一款大语言模型,叫Alpaca-7B。性能跟GPT3.5旗鼓相当。 几乎是同时,出身清华的中国AI公司智谱AI,也发布了一款AI应用,叫ChatGLM-6B。 紧接着,3月15日,GPT-4上线。 3月16日,Pytorch2.0发布。这是干什么的?这是一款AI训练工具,你可以把它当成是,调教AI的老师。 同是3月上旬,微软发布的Microsoft 365 Copilot。你可以把它当成是,一套搭载了GPT-4的office。 当然,中国公司这段时间也没闲着。比如3月16日,百度召开了文心一言的发布会。 3月21日晚上,英伟达的GTC开发者大会,直接把主题定为,切勿错过AI的决定性时刻。而英伟达的CEO黄仁勋,在大会上不止一次说,这是AI的iPhone时刻。也就是,AI将像当年的iPhone一样,迎来大爆发。
说到这,就引出一个特别老生常谈,但又不得不问的问题。那就是,照这个速度发展下去,AI会抢人类的饭碗吗?AI也适用于线束行业吗?
员工与线束厂的意愿
我们经常与线束工厂的员工交流,然而,与员工的谈话表明,他们几乎看不到对人工智能的需求。相反,他们更希望规范,标准的自动化来减轻耗时的日常任务。对他们来说,日常工作的“唾手可得的劳动果实”比那些花里胡哨的高科技应用更重要。
这个答案一开始让人感到惊讶,但这是合乎逻辑的。毕竟,与人工智能相比,基于标准的自动化(也称为Robotic Process Automation机器人流程自动化,RPA)实施起来更容易、成本更低,而且对线束厂来说也有更高的短期收益。
图 1:人工智能 (AI) 与RPA的对比(复杂度,成本,短期收益)
什么是人工智能?
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。
我们有必要先了解一下 AI 本身。只有当你了解人工智能及其局限性,也认识到自己的应用可能性时,人工智能才会从所谓的“炒作”变成现实的“希望”。
首先,并不是所有的人工智能都是一样的。例如,它使用许多不同的文件格式作为输入数据,这意味着它在应用程序中通常看起来不一样。例如,销售预测基于数字,质量控制依赖于图像,某些自动化流程处理文本。而且,人们对人工智能的概念并不总是相同的。
这并不奇怪,因为 AI 中有不同的子领域,具有不同的应用领域。
图 2:AI 和重要的子领域
AI 的一个子领域是机器学习 (ML),其中数据在第一阶段用于开发模型(模型创建,参见图 3 中的步骤 1 到 4)。这个阶段包括对业务问题的理解以及相关数据的理解和准备。如果模型充分解决了问题,则在第二阶段将其用于日常操作,如有必要,还可以对其进行持续优化(步骤五和六)。
图 3:基于 CRISP-DM 的人工智能试点项目流程
没有人工智能,我们是否会出局
以往,客户会向线束厂发送需求,并附上所需线束的图纸和电线清单,而线束厂会在几周内计算出成本。
如今,客户提交初始指示性报价的截止日期要比以往短得多。如果线束厂不快速提交报价以适应客户的需要,太慢的话,可能在报价流程开始时就已经被淘汰了。
线束行业知名的线束厂家Leoni做过相关的测试,将AI技术用于线束工厂的前期报价当中。
在Leoni的试点项目中,Leoni只关注一个耗时的成本因素,即生产线束的劳动时间。为了解决这种监督机器学习回归问题,需要两个数据输入来创建模型:劳动时间(目标)及其影响因素(特征,参见图 4)。
作为影响因素,定义了与预测劳动时间相关且可快速获得的线束数据——例如电线的数量和长度、连接器的数量等。在从旧项目中选择和收集这些特征后,我们现在需要从正常(完整)计算过程中添加正确的劳动时间来完成训练数据。
在机器学习过程中,特征(影响因素)和目标(劳动时间)之间的关系(模型参数)随后被“学习”。这仅仅意味着在训练数据上尝试不同的数学模型(ML算法),以找到将模型预测和实际劳动时间之间的误差最小化的最佳模型。如果模型足够准确,它可以给出回答新请求的建议。所需要的只是影响因素。
图 4:使用监督式机器学习(回归)估算劳动时间创建模型的过程
实际效果如何?
在Leoni的案例中,在训练阶段使用了过去大约 200 个线束的数据,从各种模型中选择最佳模型。
然后,我们为这个模型提供了大约 50 个其他过去的线束项目的数据,然后测试了它的准确性。在此验证阶段,模型仅根据学习到的训练数据进行预测,无需人工干预。
以下是结果:
对于验证数据集,AI 模型预测的平均绝对误差为 4.1 分钟的劳动时间(平均真实劳动时间约为 58 分钟)。对于大型线束,这已经相当不错了。另一方面,对于小型线束,模型仍需要改进,因为小型线束的百分比误差会增加。 在使用八个线束的新请求数据进行的单独测试运行中(平均劳动时间 237 分钟),平均百分比误差约为 10%。仅对于真实劳动时间超过 400 分钟的一条线束,预测就偏离了 20% 以上。其原因在于模型的训练数据:训练期间没有出现相对较大的线束。
在模型开发和使用过程中,我们意识到了有关 AI 的几个方面:
如果第一阶段模型开发的训练数据很差,那么第二阶段的模型预测也会很差。 如果第一阶段的训练数据与第二阶段新请求的数据相差很大,人工智能的结果也可能不可靠。 RPA 和 AI 相互受益。在使用 RPA 的地方,过程数据可以自动保存并用于模型训练(RPA,数据收集器)。相反,人工智能通过其自身的能力扩展了 RPA 的(纯粹基于规则的)范围,从而扩展了可以自动化的流程数量,例如通过“理解”电子邮件。 如果想提高 ML 模型的准确性,拥有更好和更多的数据通常比无数次调整模型更能发挥作用。通过收集新的数据集,可以为模型提供越来越大的数据池。 建议从一个简单且易于管理的试点应用程序开始。
替代线束行业?
根据OpenAI的说法,AI会不会替代人类工作?答案是,一定会。这种影响几乎横跨所有行业,只是程度不同。其中,学历越高,收入越高,可被AI替代的部分就越大。比如,律师、会计师、金融分析师等等。
简单说,就是这一轮AI,特别擅长跟脑力劳动者抢饭碗。
人工智能对未来有什么好处?这很难预测。
也许在线束行业,前期与计算机相关的脑力劳动,AI可以发挥一定的价值。
那么,有无法被AI替代的工作吗?有。据说,OpenAI自己列出了34种不被AI影响的工作,普遍是体力劳动。包括,农业设备操作员、管道工助手、洗碗工、运动员与体育竞赛者、屋顶工人助手,等等。你看,这么看下来,是不是还是有那么点扎心的?好多人都说,万万没想到,读了一辈子书,最后还是得靠膀子力气吃饭。
而线束行业是典型的劳动力密集型产业,很多工作需要操作员工在现场进行手工操作,是典型靠膀子力气吃饭的工作。
人工智能的下一步是什么?
我们考虑了很多应用,既基于数字,用于不同类型的预测,也基于图像数据,例如质量控制。另一方面,Leoni线束也在考虑使用Large Language Models。例如,Leoni要求内置于微软 Bing 搜索引擎中的 OpenAI 的 GPT-4 模型为前面提到的劳动时间用例生成模型生成和评估所需的软件代码。
令人惊讶的是,GPT-4 确实生成了 Python 代码。当然,应该谨慎使用。人们应该清楚人工智能生成的文本或代码的结果可能存在哪些缺陷和差距。
现在确实有机会使用 AI 生成 AI 代码——比以前快得多。
至少在线束行业,我们能够发现AI使用的地方。