揭开机器学习的核心

更新于: April 2025

机器学习或ML是人工智能的子集,它可以通过识别模式并根据其做出决策来训练数据上的算法。与传统的编程(在机器中编写代码的情况下,ML系统都会从经验中学习,并通过开发正确的模式从经验中学习,并随着时间的流逝而变得更好。它是ML的方面之一,它使算法在不同领域都非常有效和均匀。机器学习的目的(ML)是根据给定数据产生输出。通过数据中的模式检测,这种机器学习技术为系统提供了不断学习和变得更好的机会,这与传统软件不同,这些软件给出了每种情况的固定规则。

ML可用于医疗保健,金融,运输和零售等各种行业。在自动驾驶汽车中,机器学习用于运输,零售业,它可以推动客户体验,库存优化和定价。在医疗保健中,它用于医学图像分析,预测分析或药物发现。在金融领域,它为信用评分,欺诈检测和自动交易的算法提供动力。

历史发展

机器学习历史的特征是快速增长和较慢的增长期。机器学习从基本的系统到统计学习和深度学习方法。最早的算法旨在为未来的神经网络研究和理论建立模式和基础。机器学习灵感来自统计理论和数学。建立在统计和概率领域的早期工作以及优化(增量改进)的基础上,已使机器学习的后续进步。机器学习和自然语言处理是通过创建基于变压器的模型(例如GPT-3(生成预训练的变压器))的。这些模型在巨大的数据集上进行了广泛的预培训使各种应用程序(包括文本生成和代码完成)成为可能。

1950年至1980年代

机器学习的概念可以追溯到1950年代初,艾伦·图灵(Alan Turing)和约翰·麦卡锡(John McCarthy)等先驱奠定了AI的基础。此外,弗兰克·罗森布拉特(Frank Rosenblatt)创建了PERCEPTRON,这是第一个神经网络的形式,即早期模型,它可以“学习”以能够对输入进行分类。 1960年代和1970年代开发了第一个算法,例如线性回归和感知器。 1980年代看到了神经网络的出现,其反向传播算法使网络可以更有效地学习。

正是在1980年代,杰弗里·辛顿(Geoffrey Hinton)提出了神经网络的想法,如果没有明显的ML突破,这是不可能的。

1990年代至2010年代

1990年代推出了更复杂的模型,例如支持向量机(SVM)和随机森林。这些在许多任务中的表现比早期算法更好,在1990年代越来越受欢迎。大型数据集和增加的计算能力(由于图形处理单元或GPU)是这次爆炸的主要驱动因素,从而可以训练更大,更精确的模型。 Alexnet的成功,Alexnet是一个深层的神经网络,通过大大降低图片分类中的错误率赢得了2012年Imagenet竞争,标志着至关重要的转折点。深度学习涉及在2000年代培训许多层次的神经网络。

2010年代要出席

2010年代标志着基于变压器的模型等GPT的兴起,GPT彻底改变了自然语言处理。在2012年,深度学习在Imagenet竞争中取得了成功,取得了突破,从而大大改善了图像识别任务。如今,ML是自主系统,生成AI等创新的核心。像Siri和Alexa这样的语音助手,Netflix和Spotify等推荐引擎,甚至是特斯拉等自动驾驶汽车,只是几个例子,说明了如何将机器学习和人工智能纳入许多日常生活的各个方面。深度学习项目现在占全球ML研究的70%。

现在,包括机器人技术,医疗保健和金融在内的许多部门现在都取决于机器学习技术。计算能力的不懈进展以及扩展数据访问为未来的创新和科学探索创造了前所未有的机会。机器学习是通过推动生成AI,自主系统和自然语言处理的进度来发展技术进步的关键组成部分。根据《财富商业见解》的报告,机器学习市场预计将从2021年的21亿美元增长到2029年的209亿美元,复合年增长率(CAGR)为38.8%。

新兴的创新和未来的方向

生成的AI

Generative AI是基于某些数据集的机器学习的子组,旨在创建新内容,例如图像,文本,音乐甚至视频。在生成的AI模型中,有OpenAI的GPT-3用于连贯且与上下文相关的文本生成和DALL·e,它将文本提示转换为图像。这项技术正在改变各种行业的范式,包括娱乐,营销和内容生成,使机器有能力帮助执行以前被认为是人类唯一领域的任务。根据《财富商业洞察》的估计,到2032年,生成的AI预计将达到9676.6.5亿美元。

为了找出数据的基本分布,生成模型的培训是基于庞大的数据集的,例如,经过数百幅画的生成模型将根据构图,配色方案,刷子技术和所学的样式创建新的原创绘画。训练后,生成模型能够生成完全原始的内容。这可能包含全新的图片,文字,音乐,甚至是独特的电影,但与他们训练的原始材料非常相似。

生成的AI也改变了医疗保健行业。例如,它使用基于AI的模型来创建合成医学图像,以培训和数据增强,同时保护患者隐私免于披露。在娱乐行业中,AI为眼睛和耳朵创造了特殊的新效果,甚至有助于编写脚本。

错误的信息,知识产权问题和深层创作引起了极大的关注。生成AI的扩散尚待解决棘手的问题,其中最大的是严格的负责使用法规。

边缘AI和Tinyml

Edge AI表示直接在包括智能手机,IoT传感器和可穿戴设备在内的本地设备上执行机器学习算法,而不是依赖云服务器处理。从这种方法中出现了几种优势,例如减少延迟以及减少带宽费用并改善隐私,因为敏感信息仍然是本地的,而无需任何外部服务器处理。

Tinyml代表了Edge AI的一个独特的分支,该分支集中于在资源有限的极小设备上实现机器学习模型。 Tinyml算法达到了出色的效率,因为这些设备通常具有受限的处理能力以及有限的记忆和能源资源。 Tinyml技术在工业机器预测维护以及通过可穿戴设备和智能家居自动化系统进行健康监测中找到了应用。根据2025年eBay的数据,预计将在边缘处理75%的企业数据,这强调了这种趋势的重要性。

人工智能治理和道德

机器学习变得越来越融入人们的日常生活中,从而使人们对其道德意义的担忧变得容易。算法偏见,数据隐私和透明度的问题带来了有关ML系统治理的问题。有针对道德AI和各种组织的框架,世界各地的几个政府都在提出指导方针,以确保AI系统被公平和负责任地使用。财富业务洞察力说,到2026年,嵌入AI风险管理将提高组织成果的75%。

例如,欧盟已经制定了《欧盟AI法》,并试图规范高风险的AI应用,例如面部识别和生物识别监视,以确保它们在尊重基本权利的同时安全透明。同样,美国一直在制定自己的AI道德准则,而Google和Microsoft等公司投资开发更透明和无偏见的AI系统。

区域视角:机器学习的采用,挑战和进步

北美

北美仍然是通过机器学习和AI技术的全球领导者。美国占全球AI投资的40%。该国是Google,Microsoft和Apple等主要科技巨头的所在地,这些巨头继续推动机器学习的研发界限。尤其是硅谷,已经看到与AI和ML相关的投资激增,重点是量子计算,自主系统和生成的AI。神经(神经信息处理系统会议),计算机视觉和模式识别会议(CVPR)和机器学习国际会议是北美举行的一些主要会议。这些会议帮助全球著名的人获得有关新发明或发现的信息。

加拿大在AI研究方面也脱颖而出,多伦多和蒙特利尔等城市成为AI创新的枢纽。加拿大政府通过诸如Pan-Canadian人工智能战略等计划积极支持AI,该策略旨在加强AI研究并确保道德AI实践。

工业和学术界的许多重要贡献,机器学习都可以看作是北美技术进步和增长的主要来源。该地区是一些影响人工智能和机器学习方向的领先学术机构,研究机构和科技公司的所在地。在机器学习的增长方面,北美可能会继续成为领先的大洲之一,但是有一些问题,例如道德,人才和法规,需要解决以获得更大的成功。

欧洲

欧洲对AI采取了独特的方法,重点关注调节,并确保AI是负责任地透明地使用的。欧盟提出了《欧盟AI法》,这是对AI进行调节的第一个法律框架,重点是高风险AI应用程序,例如生物识别识别和关键基础设施。德国一直领导AI研发,特别是在工业自动化领域。强大的学术机构,创意初创公司,成熟的科技公司和政府的努力都为欧洲的崛起促成了该行业的突出。
AI研究实验室已由众多技术业务和研究机构在整个欧洲建立。由Facebook AI Research(Fair)和DeepMind(现在是Google的一部分)等公司进行的大量研究操作。欧洲学习和智能系统实验室(ELLIS)是整个欧洲的最高ML研究人员的一个例子,它是区域AI研究网络的一个例子。欧洲在数据库(ECML PKDD),良好的全球峰会和欧洲AI联盟的机器学习和原理和知识发现实践的会议只是在欧洲举行的重要机器学习和人工智能会议和竞赛中的一些重要。这些聚会为网络,解决问题和研究共享提供了论坛。

德国的行业4.0倡议将AI纳入制造业,以提高生产率,降低浪费并提高产品质量。同时,英国是世界上一些领先的AI研究机构的所在地,例如DeepMind和Cambridge大学。由于进行了各种政府计划,学术组织和商业业务,欧洲的机器学习正在不断增长和扩展。欧洲在人工智能领域处于独特的地位,重点是道德和法律框架的创新。欧洲正在努力创建一个负责任,可持续的AI生态系统,以实现机器学习的扎实未来发展和创新。

亚太地区

亚太地区是AI和ML的快速增长地区,中国领先于AI采用。由于政府已经建立的机构和工作场所中,机器学习和人工智能的使用量增加了机器学习和人工智能的使用。该地区的位置是全球机器学习生态系统中的关键参与者,因为它强调了包括医疗保健,金融,制造业和电子商务在内的行业中的AI,以及在智能城市计划中对AI的日益增长的使用。即使亚太地区随着新发现和发明的出现,亚太面临某些挑战,但该地区在技术上是相当先进的。

中国已成为AI创新的全球强国,在全球范围内提交了60%以上与AI相关的专利。该国设定了雄心勃勃的目标,通过大量投资于AI研发和开发,成为AI的世界领导者。在各种亚太国家,AI监管和确保适当使用机器学习的适当使用仍在进行中。中国已经发布了对AI技术安全和负责任的标准,而新加坡和日本等国家则专注于为道德AI使用,数据保护和隐私制定框架。

另一方面,印度专注于低成本的AI服务和研究,并利用其强大的技术劳动力来推动AI在医疗保健,教育和农业等领域的采用。随着许多专注于AI技术的企业和学术机构的引入,印度正迅速成为AI和机器学习创新的中心。在包括金融,医疗保健和IT服务在内的行业中,诸如Infosys,Tata咨询服务(TCS)和Wipro等公司都率先使用AI和ML。机器学习研究是由印度的几个AI研究设施驱动的,包括印度理工学院(IIT)和印度科学研究所(IISC)。

中东和非洲

在中东,在金融科技,石油和天然气以及医疗保健等领域,AI的采用正在迅速上升。阿联酋和沙特阿拉伯等国家正在大力投资AI,以推动其经济多元化计划。例如,阿联酋已任命人工智能部长指导该国的AI战略。根据《财富商业洞察》的估计,预计到2028年,中东和非洲AI市场的复合年增长率为29.7%。

政府在机器学习和人工智能的发展和技术增长中发挥着重要作用,例如对无人驾驶汽车,AI驱动的智能城市以及基于AI的服务的投资。迪拜AI和Smart Dubai等倡议已专门用于迪拜专门使用机器学习技术来增强市政业务,医疗保健,运输和治理。

在机器学习的帮助下,促进经济多元化并加强各种行业的公共服务,包括金融,能源,智能城市和医疗保健,使该地区成为世界各地不断崛起的强国。无论与数据保护有关的某些问题,与人才和道德的持续障碍有关,该地区仍在这个技术驱动的世界中占据一席之地。这为AI和ML在各个私营和公共部门中的AI和ML的不久的将来打开了大门。

大陆的数字革命不断增长,导致机器学习的迅速增长(ML)和非洲迷人的领域。缺乏资源,基础设施中的差距以及对更合格的工人的需求,并没有停止机器学习和人工智能(AI)技术的增长,并且他们仍在获得流行和资金。由于许多国际合作,政府进行的几项计划和公司的发展,非洲正在将自己确立为全球AI和机器学习场景中的著名参与者。在非洲,AI的采用仍处于早期阶段,但增长潜力很大。 AI正在医疗保健中用于提高诊断准确性和农业,以优化农业实践。

机器学习的技术进步和发展

量子计算

量子计算有望通过解决目前超出传统计算机范围的问题来彻底改变ML。量子机使用Qubits,可以同时存在于多个状态中,从而使它们能够更快地执行某些类型的计算。量子计算的ML应用包括优化问题,药物发现和密码学。因为量子计算可以更快地处理,更好的优化和增强的学习能力,从而为机器学习的未来带来了激动人心的机会。但是,在可以广泛使用量子机器学习之前,仍然存在许多算法和技术障碍。机器学习与量子计算之间的联系正在迅速开发,这有可能完全改变包括医疗保健,银行业和物流在内的广泛领域。持续的研发肯定会继续推动创新。

2023年,量子技术的全球投资达到19亿美元,IBM,Google和Microsoft等科技巨头在开发量子计算机方面取得了长足的进步。尽管量子计算仍处于起步阶段,但它具有加速机器学习算法和创建新的ML解决方案的巨大潜力。

联合学习

Federated Learning是一项新兴技术,允许多个分散设备在培训机器学习模型的情况下协作而无需共享数据。这种方法在医疗保健和金融等行业中特别有用,那里的隐私问题至关重要。联合学习使ML模型可以在驻留在各种设备上的数据(例如智能手机或IoT传感器)上的数据,同时保持数据的隐私。
中央服务器从多个来源接收数据,并使用它以标准的机器学习技术来训练模型。然而,在联合学习中,培训程序分散在几种设备(或“客户”)中。这些客户包括Edge计算机,智能手机和物联网设备,使用自己的数据训练本地模型,然后仅将模型更新(例如权重或梯度)发送到中央服务器。将这些更新组合在一起后,服务器改进了全局模型。

到2024年,预计超过40%的医疗保健系统将采用联邦学习,因为它们使他们能够在不违反隐私法的情况下利用来自多个来源的患者数据。

神经形态计算

神经形态计算旨在模仿人脑的结构和功能,以创建更有效和强大的ML模型。神经形态芯片旨在以类似于生物神经元的工作方式处理信息,从而使它们能够以更高的能效执行ML任务。这项技术仍处于早期阶段,但它有可能改变机器人技术,自主系统和实时分析等领域。随着越来越多的公司投资于开发脑启发的技术,到2032年,神经形态计算市场预计将增长到85.8亿美元。

神经形态计算通过模仿大脑的体系结构来代表机器处理信息的重大飞跃。它具有彻底改变AI,机器人技术和神经科学的潜力,再加上其能源效率和处理复杂的实时处理的能力,使其成为研究和发展的有前途的领域。尽管它在硬件,软件和可扩展性方面面临挑战,但神经形态计算可能会成为智能系统未来的基础技术。

汽车和无代码AI

 汽车(自动化机器学习)平台旨在自动化选择,培训和调整机器学习模型的过程。这些平台旨在使非专家可以使用ML,从而使几乎没有编码经验的人可以构建和部署机器学习模型。无代码AI平台的兴起,使用户能够通过简单的拖放界面创建AI应用程序,从而进一步使技术民主化。到2028年,NOCODE AI市场预计将达到450亿美元,因为越来越多的企业寻求采用AI解决方案而无需深入的技术专业知识。

工业应用

卫生保健

机器学习通过实现早期疾病检测,个性化治疗和改善患者预后,在医疗保健中发挥了变革性的作用。 ML算法用于医学图像分析中,以检测诸如癌症和基因组学等疾病以发现新药和治疗。此外,由ML模型提供支持的预测分析可以帮助医疗保健提供者预测疾病暴发并优化治疗计划。根据《财富》业务见解,预计到2028年,医疗保健AI市场预计将达到10020亿美元。

  • 患者预后的预测分析:机器学习有助于评估患者的病史,这反过来又有助于医生就已诊断出的病情做出更明智的选择。
  • 药物发现:机器学习还可以通过预测可作为疗法有用的化合物的类型来帮助创建药物。 AI已被诸如DeepMind之类的企业用于预测蛋白质折叠,这对新药的创建产生了影响。
  • 医学成像:使用机器学习算法分析医学图片(X射线,MRI,CT扫描),以发现肺炎和癌症等异常和疾病。例如,放射科医生可以在Google Health的AI乳腺癌筛查等系统的帮助下检测肿瘤。

金融

在金融中,机器学习正在彻底改变欺诈检测,信用评分和算法交易。 ML算法可以分析大量金融交易,以实时检测欺诈活动。他们还比传统方法更准确地评估信用风险,从而使贷方能够做出更好的决定。算法交易使用ML来分析市场数据并在最佳时期执行交易。到2030年,AI每年可以为银行业产生1万亿美元。

  • 欺诈检测:机器学习算法用于检测与数据交易有关的任何类型的非同寻常的活动。 PayPal的欺诈检测系统等系统使用机器学习来实时评估交易风险。
  • 信用评分:银行通过检查过去的财务数据和其他行为模式来对借款人的信誉度进行评估。例如,FICO提供了改善贷款选择的AI驱动信用评分工具。
  • 客户服务:机器学习使客户更容易,因为有不同的聊天机器人和虚拟助手提供全天候客户服务。来自美国银行的AI驱动的虚拟助理Erica为客户提供了交易,帐户信息和财务指导。

零售

在零售业中,机器学习可以通过个性化,预测分析和供应链优化来帮助企业增强客户体验。 AI驱动的个性化最多可将零售收入提高15%。 ML算法分析客户行为以提供个性化建议,而需求预测有助于零售商优化库存管理并减少浪费。

  • 推荐系统:为了增加客户的参与度和销售产品,亚马逊,Netflix和Spotify等零售商使用ML算法来根据用户的行为和偏好来制作产品,电影和音乐建议。
  • 客户情绪分析:零售商利用机器学习(ML)来检查评论,社交媒体帖子和客户评论,以确定公众对其商品和服务的看法。这有助于产品开发和营销。
  • 需求预测:企业可以通过使用机器学习算法来预测未来产品需求,从而优化库存并最大程度地减少库存或库存的量。 ML被沃尔玛和Target等企业使用,以优化其供应链。

制造和运输

机器学习被广泛用于制造中,以进行预测性维护,质量控制和供应链优化。在运输中,ML为自动驾驶汽车提供动力,使自动驾驶汽车和卡车可以安全行驶。此外,ML优化物流公司的路线和时间表,降低成本并提高效率。预计到2028年,预计自动驾驶汽车市场将达到5560亿美元。

  • 预测性维护:企业可以通过使用机器学习模型来检查机器中的传感器数据并在设备可能破裂时进行预测,从而执行维护。通用电气(GE)使用此方法来关注和维护工业机械。
  • 质量控制:为了在生产过程中发现任何质量问题并保持高标准,使用机器学习算法来实时检查产品缺陷。为了在生产过程中进行视觉检查和缺陷检测,西门子等企业采用机器学习。

采用机器学习中的挑战

机器学习的采用充满了困难,从涉及数据和模型的复杂性到道德和法律困境的技术范围。但是,通过仔细的准备,基础设施和人才投资可以克服这些困难,并强调道德问题。成功克服这些障碍的组织将处于强大的位置,可以随着机器学习技术的发展并变得越来越广泛。

数据质量和偏见

ML采用的最大挑战之一是确保用于训练模型的数据具有高质量。数据质量差会导致预测不准确,这可能会产生严重的后果,尤其是在医疗保健和金融等领域。据报道,数据质量问题每年造成1,290万美元。另一个问题是算法偏见,其中ML模型无意间永久存在数据中的偏见,从而导致不公平或歧视性结果。

计算成本和环境影响

培训大规模的ML模型需要大量的计算能力,这可能是昂贵且对环境征税。与GPT-3这样的训练大型模型相关的能耗引起了人们对AI的环境影响的担忧。寻找减少ML计算成本同时保持准确性的方法是一个关键挑战。

熟练专业人士短缺

在ML领域,全球缺乏熟练的专业人员,这为许多希望采用该技术的组织造成了障碍。在新兴经济体中,这种技能差距尤为明显,在新兴经济体中,获得教育和资源的机会可能受到限制。超过40%的全球组织报告了AI技能差距。

机器学习的未来:机会和技术进步

随着预期的几个领域的进步,机器学习具有光明的未来。 ML将继续重塑和重塑行业和日常生活,从更好的隐私和个性化到创建道德框架以及量子增强AI的可能性。关注ML技术的负责发展至关重要,确保它们最大程度地减少风险和偏见,同时仍使社会受益。 AI,量子计算,保护隐私的方法和以人为本的创新可能会在未来十年内结合使用,改变技术进步的面貌。

与新兴技术的收敛

机器学习的未来在于它与其他新兴技术(包括量子计算,区块链和AR/VR)的融合。量子计算可以实现ML模型速度和效率的指数改进,而区块链技术可以为培训AI模型提供分散且安全的数据共享平台。

全球包容性

预计机器学习将在新兴地区获得更多的采用。特别是非洲和南亚,将在AI应用中经历显着增长,尤其是在农业,医疗保健和教育等领域。到2030年,预计超过70%的AI创新将从亚太地区出现。

ML生态系统的愿景

机器学习的未来将以关注可持续性,公平性和可扩展性来塑造。随着技术的不断发展,确保AI系统具有道德和透明是必不可少的。

我们的客户

yamaha
mckinsey&company
deliote
daikin
duracel
nvidia
fizer
hoerbiger
abbott
stallergenesgreer
novonordisk
hitachi
american express
bosch
google
sony
samsung
ups
ey