NumPy是一款数字Python开发工具,包含强大的N维数组对象、复杂的(广播)功能,集成C/C++和Fortran代码的工具,有用的线性代数,傅立叶变换和随机数功能。
强大的N维数组
NumPy矢量化,索引和广播概念快速且通用,是当今阵列计算的实际标准。数值计算工具
NumPy提供了全面的数学功能,随机数生成器,线性代数例程,傅立叶变换等。可互操作的
NumPy支持广泛的硬件和计算平台,并且可以与分布式,GPU和稀疏阵列库一起很好地使用。表演者
NumPy的核心是经过优化的C代码。借助编译后的代码,享受Python的灵活性。使用方便
NumPy的高级语法使其可以为来自任何背景或经验水平的程序员访问并提高生产力。开源的
NumPy是在开放的BSD许可下发行的,由一个活跃,响应迅速且多样化的社区在GitHub上公开开发和维护。
NumPy位于丰富的数据科学图书馆生态系统的核心。
典型的探索性数据科学工作流程可能如下所示:
提取,转换,加载: Pandas, Intake, PyJanitor
探索性分析: Jupyter, Seaborn, Matplotlib, Altair
建模和评估: scikit-learn, statsmodels, PyMC3, spaCy
仪表板中的报告: Dash, Panel, Voila
对于高数据量,Dask和 Ray是按比例缩放的。
稳定的部署依赖于数据版本控制(DVC),实验跟 踪(MLFlow)和工作流自动化(Airflow和 Prefect)。
分布式阵列和高级并行分析功能,可实现大规模性能。
兼容NumPy的数组库,用于使用Python进行GPU加速计算。
NumPy程序的可组合转换:区分,矢量化,即时编译到GPU / TPU。
带标签的索引多维数组,用于高级分析和可视化
兼容NumPy的稀疏数组库,该库与Dask和SciPy的稀疏线性代数集成。
深度学习框架可加快从研究原型到生产部署的过程。
机器学习的端到端平台,可轻松构建和部署基于ML的应用程序。
深度学习框架适用于灵活的研究原型和生产。
用于列式内存数据和分析的跨语言开发平台。
具有广播和惰性计算的多维数组,用于数值分析。
开发用于数组计算的库,重新创建NumPy的基本概念。
使API与实现脱钩的Python后端系统;unumpy提供了一个NumPy API。
Tensor学习,代数和后端可无缝使用NumPy,MXNet,PyTorch,TensorFlow或CuPy
由诸如XGBoost, LightGBM和 CatBoost之类的工具实现的ML算法包括称为集成方法的统计技术
Yellowbrick和 Eli5 提供机器学习可视化。
NumPy是迅速发展的Python可视化领域的重要组成部分
其中包括 Matplotlib, Seaborn, Plotly, Altair, Bokeh, Holoviz,Vispy和 Napari等。
NumPy对大型数组的加速处理使研究人员可以可视化远超过本机Python可以处理的数据集。