• Dask
  • 分布式
  • Dask ML
  • 示例
  • 生态系统
  • 社区

入门

  • 安装 Dask
  • 10 分钟了解 Dask
  • 部署 Dask 集群
    • Python API
    • 云
    • 高性能计算机
    • Kubernetes
    • 命令行
    • SSH
    • 附加信息
      • 自适应部署
      • Docker 镜像
      • Python API (高级)
      • 管理环境
      • Prometheus
      • 自定义初始化
      • 部署注意事项
  • 最佳实践
  • 常见问题

如何使用

  • 数组
    • 最佳实践
    • 分块
    • 创建 Dask 数组
    • 重叠计算
    • 内部设计
    • 稀疏数组
    • 统计信息
    • 切片
    • 赋值
    • 堆叠、拼接和分块
    • 广义 Ufuncs
    • 随机数生成
    • API
    • 与 numpy 函数的兼容性
  • Bag
    • 创建 Dask Bags
    • API
  • DataFrame
    • 加载和保存数据
    • 内部设计
    • 优化器
    • 最佳实践
    • API
    • 附加信息
      • Parquet
      • 索引
      • SQL
      • Join 性能
      • Shuffling 性能
      • 分类数据
      • 扩展
      • Hive 分区
  • 延迟
    • 使用集合
    • 最佳实践
  • Futures
  • 机器学习

内部结构

  • 理解性能
  • 调度
  • 任务图
    • 规范
    • 自定义图
    • 优化
    • 高级图操作
    • 自定义集合
    • 高级图
  • 调试和性能
    • 调试
    • 可视化任务图
    • 仪表板
    • 诊断信息 (本地)
    • 诊断信息 (分布式)
    • 计算阶段
  • Dask 内部结构
    • 用户界面
    • 理解性能
    • 计算阶段
    • 顺序
    • 机会性缓存
    • 共享内存
    • 深入了解调度
    • 使用表达式系统进行查询规划

参考

  • API 参考
    • 数组
    • DataFrame
    • Bag
    • 延迟
    • Futures
  • 命令行界面
  • 开发指南
  • 更新日志
  • 配置
  • 操作指南…
    • 连接远程数据
    • 调试
    • 扩展 sizeof
    • 选择集合后端
    • 使用 GPU
  • 演讲与教程
  • 维护者指南
主题由 Executable Book Project 提供

附加信息

附加信息¶

  • Parquet
  • 索引
  • SQL
  • Join 性能
  • Shuffling 性能
  • 聚合
  • 分类数据
  • 扩展
  • Hive 分区

上一页

dask.dataframe.to_timedelta

下一页

Dask Dataframe 和 Parquet

© 版权所有 2014-2018, Anaconda, Inc. 及贡献者。