创新7分钟阅读

企业起点:数据科学和人工智能

越来越多的人工技术选择给企业高管带来了一个艰巨的挑战:从哪里开始? Toptal高管分享了对人工智能和数据科学之间区别的看法, 以及为什么后者是大多数公司的最佳起点.

Toptal研究

快速扩张的人工智能和数据科学领域为希望挖掘其潜力的公司提供了一份令人生畏的选择清单. 机器学习, 深度学习, 自然语言处理, 神经网络, 机器人过程自动化, 还有许多更深奥的变体充斥着头条新闻和白皮书.

即将实现神奇的计算能力, 这些技术要求高管们采用它们，否则他们的公司很快就会被那些采用这些技术的公司超越. 对于少数几个公司来说整个部门都致力于人工智能在美国，将这种技术定制为用例是日常业务. 但对于绝大多数人来说，知道从哪里开始并不那么简单.

在本文中, Toptal管理人员分享了人工技术相关解决方案在常见业务需求中的实际应用.

佩德罗•诺盖拉, 机器学习和数据科学方面的专家, 为新公司提供新鲜的消息:第一个解决方案通常很简单, 成本相对较低, 而且经济上也会增长. 补充Nogueira的观点, Toptal企业团队强调了机器人过程自动化的最新趋势, 它能帮助公司简化日常工作流程.

机器人过程自动化和人工智能:不同任务的工具

来框定诺盖拉分享的建议, 了解机器人过程自动化(RPA)和人工智能(AI)之间的区别以及每种方法最适合处理的数据类型是有帮助的.

RPA和AI的区别在于它们所执行的工作. 软件机器人, RPA擅长于类似于装配线工人或机器执行的重复性任务. 相反, 人工智能最适合于非结构化的环境, 复制人类判断和决策的基本分析能力.

从定义上讲，这两种方法也是不同的. IEEE标准协会是由行业专家组成的国际组织，定义了他们如下:

RPA:预配置的软件，它使用业务规则和预定义的活动来完成流程组合的自主执行, 活动, 交易, 和任务.

人工智能:认知自动化的结合, 机器学习(ML), 推理, 假设生成与分析, 自然语言处理和有意的算法变异产生的洞察力和分析达到或超过人类的能力.

RPA通常被认为是人工智能的一个子集，它的目标是重复的例程. 关键的区别在于RPA不学习, 而人工智能可以自我修改, 改变其活动以响应不同的环境输入.

结果是, RPA最适合高度结构化的数据, 而人工智能处理非结构化或半结构化数据. 两种数据类型的区别, 总结如下, 对于建立过电子表格数据库的人来说是否容易理解.

适合这种电子表格的数据(如客户联系信息)是结构化的. 不适合的数据——比如自然语言——是非结构化的. 了解这些数据类型之间的差异对于理解哪种形式的AI适合给定的业务案例至关重要.

阻塞和处理业务流程自动化

对大多数公司来说, 利用人工智能最简单、风险最小的起点是业务流程自动化. 由不需要多少智力，甚至可能不需要人力的平凡任务组成, 这些过程证明投资于消除或显著减少人类参与的技术是合理的. 公司和员工将从三个方面受益:

员工将精力集中在高价值的任务和解决问题上.
公司从最小的持续运营成本中实现积极的投资回报率.
由于缺少人为错误，流程质量得到提高.

RPA驱动保险行业的多个工作流

对于那些已经精简了简单内部程序的公司来说费用报销，更复杂的机会拥有高投资回报率的潜力. 在保险行业, 例如, 生成保险报价和处理保险索赔是RPA的完美用例.

在承保保单时，保险公司必须平衡风险和回报. 基本上，平均来说净现值保险单的保费必须超过索赔的保费. 在承销, 保险公司估计这个等式的风险成分, 帮助他们预测未来负债的时间和规模.

承保在历史上一直是一个人工过程, 谁的分析需求是由谁监督的精算师. 现在这样的工作越来越多自动执行在数据科学家的监督下，他们利用新的数据源来更好地预测风险. 例如, 在汽车行业, 保险公司对损失历史进行了历史评估, 哪些是特定司机过去的保险索赔记录. 保险公司开始将司机信用评分纳入他们的风险分析, 认识到高分与安全驾驶呈正相关, 损失也相应降低.

回顾承保的例子, 诺盖拉指出:“当公司认为他们需要人工智能时, 他们通常需要数据科学家.”

对于Nogueira, 保险报价过程在专业和个人层面上都是非常熟悉的. 具有保险行业项目经验的数据科学家, 还有一位摩托车爱好者，他最近游览了葡萄牙, 他分享了一个任何司机或房主都能联想到的轶事:“如果我需要换摩托车, 我喜欢经常做的事, 然后我上网找一些保险公司，通过他们的在线问卷分享我的数据.”

一次提交, 数据输入“一个位于后台某处的模型，根据一个或几个模型分析我的风险概况，然后为我提供报价.在收到这样的报价的几秒钟内, 所有的分析都是自动的, 只有在数据异常值的情况下才会被人为干预覆盖.

自动化还驱动保险客户生命周期中的下游工作流, 特别是在索赔过程中. 当保险客户提出索赔时, 保险公司决定是否全额赔付, 部分支付或拒绝索赔. 该过程通常涉及多个外部方, 包括保险客户, 服务提供者, 例如医疗保健领域的医院, 或者是汽车修理店.

在汽车行业, 索赔裁决取决于核实车辆的损坏情况, 确定维修费用, 选择维修店, 并支付修理费. 对于维修估计，照片在索赔过程中起着关键作用. 理赔员给毁坏的车辆拍了照片, 车间也是如此——维修前后都是如此. 这些照片提供损坏、修理的证据和报销的依据.

从历史上看, 这些照片只能由人来解读, 但现在, 图像识别软件加上基于规则的自动化向理赔员提供关键信息，使维修和保险范围更快.

数据科学是主力军，数据科学家是驱动者

公司必须“定义什么是容易自动化的”, 需要升级到人类决策者,据诺盖拉说. 任何过程都在考虑自动化, 他继续说, “首先看看数据，找出规则.”

尽管他承认数据科学和人工智能领域正在融合, 诺盖拉把这两种情况描述为:

“数据科学是将人工智能应用于现实场景和常见业务需求. 它更多地与理解数据有关, 管理它, 让它随时可用, 易于处理, 并最终, 公司利益相关者的决策指南.”

这样的工作通常意味着清理和整理不同的数据集——这不是一件容易的事——然后应用统计分析, 比如逻辑回归, 推动更好的预测和决策.

相比之下，人工智能更以研究为导向，更适合于非结构化数据分析. “想象一个非常复杂的项目, 一个充满不确定性的世界, 例如，试图建立一个模型，根据步行模式确定有多少人可能会进入超市, 闭路电视视频和传感数据.”

最终, 这个模型可以预测人们如何购物, 他们所寻求的, 以及如何定位产品之间的关系, 优化平面图，使利润最大化. 而这样一个“蓝天”工程, 如果成功, 对零售商来说无疑是有价值的吗, 它还需要一个由多位专家组成的团队，并且很容易花费数倍于基于数据科学的计划. 在零售案例中, 例如，一家公司可能会专注于预测模型的一个或几个最关键的组件, 根据客流量和运营成本优化店铺营业时间.

建立数据科学能力的关键起点是引入合适类型和数量的人才. 幸运的是, 根据诺盖拉的说法, 大多数公司“不需要一个由超级专业开发人员组成的大型团队来完成许多常见的自动化工作, 尤其是当你考虑到 api和sdk 可用.”

虽然这些现成的技术提供了强有力的工具, 至关重要的是，这些权利必须由正确的人来行使. 在这里, Nogueira提出了一个警告:“这些工具实际上可能是一个问题, 因为很多人都在以不应该的方式使用它们, 因为他们不懂.”

的危险, 他指出, 在于“过拟合数据模型”,这是由于将模型应用于数据的方式没有考虑到所有的可能性. 这样对其训练, 他警告说, 的问题，最终会让企业付出极其高昂的代价, 因为在你从未见过的情况下, 这个模型不能很好地泛化, 这可能导致对数据做出错误的决定.”

为了避免这样的陷阱，诺盖拉鼓励公司雇佣有经验的数据科学家. 所有寻求释放客户或运营数据价值的公司“都需要一个对统计学有良好掌握的人, 以及足够的业务敏锐度来理解用例以及价值在业务中的位置.“从资历的角度来看, 一个可靠的数据科学家通常至少有数学或统计学学士学位, 较强的编程能力, 并且可以分析业务用例，以确定数据科学可以提供最大影响的地方.

分开的想法

虽然从风险/回报的角度来看，数据科学提供了一个引人注目的起点, 人工智能技术的广阔前景也值得探索. 企业高管应该将数据科学视为启动有关人工智能的内部对话的集结点.

因为他们实现了业务流程自动化的成功案例, 他们应该考虑扩展范围，以包含更具挑战性的用例, 也许更适合替代人工智能技术. 在后续文章中, insight将探索更广泛的人工智能领域, 帮助高管驾驭一个毫无疑问会带来丰厚回报的领域.

企业起点:数据科学和人工智能

Toptal研究

机器人过程自动化和人工智能:不同任务的工具

阻塞和处理业务流程自动化

RPA驱动保险行业的多个工作流

数据科学是主力军，数据科学家是驱动者

分开的想法

Toptal开发者

Toptal设计师

金融专家

欧博体育app下载

欧博体育app下载

企业起点:数据科学和人工智能

By Toptal研究

机器人过程自动化和人工智能:不同任务的工具

阻塞和处理业务流程自动化

RPA驱动保险行业的多个工作流

数据科学是主力军，数据科学家是驱动者

分开的想法

Toptal开发者

Toptal设计师

金融专家

欧博体育app下载

欧博体育app下载

Toptal研究