生产机器学习系统的一些考虑
就我个人而言,我觉得如果你是一家处于早期阶段的初创公司,你不需要权衡和找出所有这些因素。你总是可以从一个强大的候选工具开始,然后从那里开始。此外,如果你认为收益大于成本,则可以从一开始就使用托管ML服务。 何时开始做机器学习 vs. 机器学习周围的操作 在第一次开始时,最好从一个简单的基线模型开始。从更简单的模型开始可以帮助你调试pipeline中的问题,并帮助你确定更耗时的解决方案是否值得。那么如何建立一个简单的基线模型呢? 首先,“简单”是相对的。在某些情况下,简单实际上意味着一个简单的模型,例如硬编码一些启发式。而在其他情况下,模型本身可能很复杂,但是很容易应用。一些最广泛使用的数据集拥有最先进的模型,这些模型是开源的,列在研究论文或排行榜等地方,斯坦福问答数据集(SQuAD)就有这样一个排行榜。一种方法是查看一些顶级的解决方案,看看你是否能找到附加到相关研究论文的代码。 在早期启动阶段,你可能没有时间立即构建ML流程。通常情况下,你需要专注于让你的投资者和客户很容易就能看到的东西运行起来。调优过程很少出现在他们的脑海中。所以不要担心你最初的部署是否完美,只需要有一个工作成果 —— 一个看得见的最终产品。在基本产品构建之后,你可以更多地担心ML周围的流程,因为通常需要更多的停机时间来对ML流程进行小的、渐进的改进。
相反,如果你是一个代理商,出错的空间就更小,因为你要将完成的产品交付给不同的客户,并试图事先修复所有的bug。在交付一个或一组客户端产品之后,你将转移到下一个客户端合同上,并且通常没有足够的精力来进行进一步的改进。尽管如此,你还是要迅速行动。为了进展得更快,最好有更精细的ML过程。因此,对于代理商模型,从长远来看,也许在优化和自动化上预先花费更多的时间可以节省时间。 (编辑:长春站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |