全国服务热线:4008-58612
产品中心 Categories
联系我们 contact us
手机:
1395682545
电话:
4008-58612
邮箱:
77807@qq.com
地址:
海南省海口市龙华区中山街道得胜沙路57号
恒达娱乐新闻
当前位置:恒达娱乐 > 恒达娱乐新闻 >
玉函机电设备:数据顾问的经验: 90 %的公司不需
添加时间:2019-01-16

编者注:在掌握一个工具之前,你必须先弄清楚如何使用它。。 机器学习本质上是一种工具,近年来已逐渐发展成为一种趋势。。

美国公司数据项目顾问埃里克·布朗认为,许多公司不顾数据资本和实际问题,匆忙投入机器学习是荒谬的。。 他特别发布了一份文件,表达了他对这一现象的批评和反思。。 雷锋网络 (公众号码:雷锋网络) 编制。

数据咨询师经验之谈:90% 的公司并不需要机器学习

Eric Brown

埃里克·布朗:数据科学家与数据交谈。 从数据来看,你和你的公司不需要机器学习。。

我是认真的。

也许你不同意,那么让我解释一下。“看数据”,我的意思是机器学习( ML )对当今世界上的大多数公司来说既没有必要,也没有好处。大多数公司想用ML来处理的任务都是非常直接的问题——它们可以通过某种形式的回归来完美地解决。后者可能不是你在高中代数课上学到的线性回归,但它仍然是一个回归函数。雷锋得知著名经济学家罗宾·汉森最近表达了同样的观点。他在推特上说:

数据咨询师经验之谈:90% 的公司并不需要机器学习

“一位优秀的计算机专家会说:大多数公司认为他们需要先进的人工智能和ML技术,事实上,他们只需要对干净数据进行线性回归。“

在这句话中,“干净的数据”是关键。这一点非常重要,但很多公司在处理数据时总是忘记或忽略这一点。如果没有合格的数据质量和适当的数据治理、管理流程和系统,你很有可能会落入垃圾数据陷阱—— “模型的输入是垃圾,输出是垃圾。”。像这样的数据项太多,结果就会消失。

数据咨询师经验之谈:90% 的公司并不需要机器学习

我不是数据管理和数据质量方面的专家老师。但是我对这个领域有一定的了解——足以让我知道什么是不合格和不适当的数据管理。此外,我经常遇到这些情况。在我与公司客户合作帮助他们执行新数据项的工作经验中(现在主要讨论ML和深入学习), 我问客户的第一个问题总是: “告诉我你的数据管理流程。“。如果对方不能合理描述这些过程,那么显然ML是不合适的——它们还没有准备好。

在过去五年中,我估计在75 %的情况下,客户对我的数据管理问题的回答是:

“嗯 。我们有一些数据存储在数据库中,其他数据存储在具有合法权限的玉函机电设备文件共享中。”

这不是数据管理,而是数据存储。

如果你或你的公司没有高质量和干净的数据,几乎可以肯定你不适合机器学习(机器学习也不适合你)。数据管理是任何数据项目的第一步。

数据咨询师经验之谈:90% 的公司并不需要机器学习

来到我公司的一小部分组织安排了合格的数据管理工作。他们了解质量、治理和管理对良好数据和良好分析的重要性。如果你的公司也是如此——恭喜你,你已经超过了这一领域的大多数竞争对手。

但是我要给你倒些冷水。仅仅因为你有干净和高质量的数据并不意味着你应该/需要进行机器学习。你当然可以做到,但在大多数情况下,这真的是不必要的。

在我过去五年咨询过的所有公司中,我会说: 他们最初想通过机器学习解决的问题,90 %最终通过普通回归得到了完美的解决。 当我推荐简单的回归来解决客户眼中的“复杂而深刻”的问题时,人们总是感到惊讶(雷锋王:他们决心开发多种ML和DL模型来处理这些问题)。我总是要向他们解释,他们可以走机器学习的道路,并且这样做。 也许 它也很有价值。但是,知道基本建模和回归能为你做什么,以及ML/DL在某些领域是否比基本回归函数更好,这不是一件好事吗

我能说什么? 然后大胆地去做! 没有什么能阻止你一路跋涉到ML和DL的深水地带。毕竟,机器学习有它的用途和阶段。记住: 不要急于进行机器学习,直到你完全理解你的数据,并弄清楚“经典”方法可以采取哪一步来解决你想要解决的问题。

通过埃里克·布朗

相关文章:

自动机器学习将成为人工智能研究的下一个主流? 听听数据科学家说的话

雷锋的版权文章未经授权不得转载。有关详细信息,请参阅重印说明。