Page 1 of 1

您预见到数据科学领域的变化趋势是什么?

Posted: Sun Mar 02, 2025 7:00 am
by tanjimajha12
无论是基于行业还是基于技术领域,数据科学面临的三大问题是什么?
Harshad Khadilkar:

1. 分析现有(内部)数据源,并识别漏洞或差异

2. 将外部变量(天气、社会经济因素、人口统计等)纳入内部预测或预报算法

3. 对自身业务运营建立清晰、量化的理解(很难相信这是一个问题,但你会对公司对自身运营广度的了解程度之低感到震惊)。

对有志于成为数据科学家的人的建议
有志于从事数据工作的人士应该在 智利手机号码数据库 处理混乱、嘈杂的数据时投入多少精力?他们还必须在哪些领域积累专业知识?
Harshad Khadilkar:每个数据从业者都必须处理混乱且嘈杂的数据。这一步是绕不过去的。根据我的经验,如果企业能够获得干净的数据,那么当今企业面临的一半以上的挑战都可以使用非常简单的算法来解决。复杂的分析和机器学习/深度学习技术只是次要的影响因素。

您对新手、数据科学学生或想要在数据分析行业建立职业生涯的从业者有什么建议?
Harshad Khadilkar:

1. 编程和软件技能: R、Python、SAS 或 Excel :Python!Excel 只适合管理类型的工作。

2. 可视化工具: 如果您使用机器学习算法,Tensorboard 是查看 TensorFlow 代码的绝佳工具。

3. 统计基础和应用知识:在进入高级分析之前,要非常非常透彻地了解线性代数、概率和统计学。

4.机器学习:当然,但只有完成步骤(3)之后。
您建议当前的数据分析师如何跟上步伐?
Harshad Khadilkar: 数据科学目前处于初期的狂热阶段,人们认为将更多数据和更多计算投入到问题中是最好的解决方案。从长期来看,这是不可持续的,因为能源消耗量巨大,在技术可行性、成本和生态影响方面都是如此。

我建议未来的科学家和工程师专注于“精益”数据科学技术,以最少的资源创造最大的影响。有时,从 99% 到 99.9% 的准确度所带来的边际收益根本不值得付出计算努力。请记住,在合理的时间和成本内向客户提供净价值是决定成功的关键因素。