Google,Uber和Facebook为数据科学和AI开发的开源项目
2020-04-20 来源:raincent
开源正在成为共享和改进技术的标准。世界上一些最大的组织,如谷歌、Facebook和Uber,正在向公众开放他们自己的技术,并将其用于他们的工作流程。
Facebook的开源项目
PyTorch
https://opensource.facebook.com/
PyTorch基本上是数据科学社区中最著名的深度学习库。它拥有一个丰富的生态系统,数据科学家可以用来执行各种任务。一些可用的工具BoTorch贝叶斯优化,AllenNLP设计和使用深度学习模型,自然语言处理,fastai轻松地构建和评估神经网络和skorch一个高层次的接口,提供全scikit学习的兼容性。
Prophet
https://facebook.github.io/prophet/
Prophet是一个开放源代码的时间序列预测库,它具有适用于Python和R 的API 。它被设计为在具有高季节性的时间序列上表现良好,并且能够考虑假日影响。它可以处理丢失的数据和数据中的异常值。时间序列中的一个大问题是缺少数据,因为该数据被认为是顺序数据,一种常见的做法是用均值或中位数(大部分时间不是时间序列中的下注选项)来估算缺失值。
Uber的开源项目
CausalML
https://github.com/uber/causalml
CausalML是uber的开源答案,用于使用机器学习方法进行提升建模和因果推理方法。它允许用户从实验或观察数据估计条件平均治疗效果(CATE)或个体治疗效果(ITE)。
Ludwig
https://uber.github.io/ludwig/
路德维希可能是Uber最著名的开源项目。Ludwig允许用户训练和测试深度学习模型,而无需指定YAML来编写代码 。它建立在Tensorflow之上。有偏好的用户可以使用Python API。
Pyro
https://github.com/pyro-ppl/pyro
Pyro由Uber AI Labs维护,并基于PyTorch进行深度概率编程。它基于通用,可扩展,最小和灵活的原则构建。NumPyro的beta版(带有NumPy后端的Pyro概率编程库)正在构建中,以加快处理速度。
kepler.gl
https://kepler.gl/
Kepler.gl是Uber的开源地理空间分析工具箱,用于按比例缩放大型数据集。它旨在帮助数据科学家使用交互式和数据驱动的方法对位置数据产生影响。它基于Mapbox GL和Deck.gl构建
Google的开源项目
Google Cloud Data Lab
https://opensource.google/projects/datalab
Google Datalab是一个具有IPython后端的交互式视觉探索工具,这意味着它具有熟悉的Jupyter环境,因此定期使用Jupyter的用户应该有宾至如归的感觉。Cloud Datalab可以使用Python,SQL和JavaScript(用于BigQuery用户定义的函数)对BigQuery,Cloud Machine Learning Engine,Compute Engine和Cloud Storage上的数据进行分析,然而如果决定使用VM和云存储等云资源,则需要付出一定的代价。
Tensorflow
https://opensource.google/projects/tensorflow
无需介绍。Tensorflow与PyTorch捆绑在一起,成为数据科学社区中事实上的深度学习框架。Tensorflow引发了许多扩展,以便更好地利用其库从可视化到直接从其命令库生成的生产API。
CausalImpact
https://opensource.google/projects/causalimpact
所述CausalImpact库是用于估计在时间序列所设计的干预的因果效应的R库。该库使用贝叶斯时间序列模型来估计在没有现实世界证据的情况下发生的事件的影响。当随机实验不可用或不可行时,这很有用。
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。