书栈网 · BookStack 本次搜索耗时 0.031 秒,为您找到 3753 个相关结果.
  • Google Dataproc

    Running Alluxio on Google Cloud Dataproc Overview Prerequisites Basic Setup Create a cluster Customization Next steps Compute Applications Running Alluxio on Googl...
  • RDD actions and Transformations byExample

    RDD actions and Transformations by Example Be Smart About groupByKey What Exactly Is Wrong With groupByKey How Not to Optimize Not All groupBy Methods Are Equal PySpark RDD.group...
  • 导入MySQL数据

    导入MySQL数据 数据集 环境配置 前提条件 操作步骤 步骤 1:在Nebula Graph中创建Schema 步骤 2:修改配置文件 步骤 3:向Nebula Graph导入数据 步骤 4:(可选)验证数据 步骤 5:(如有)在Nebula Graph中重建索引 导入MySQL数据 本文以一个示例说明如何使用Exchange将存储...
  • Linkis-Cli 方式使用

    Linkis-Cli 方式使用 1. 介绍 2. 基础案例 3. 使用方式 4. 支持的参数列表 5. 详细示例 5.1 客户端参数 5.2 添加引擎启动参数 5.2 添加引擎运行参数 5.3 添加标签 5.4 变量替换 5.5 使用用户的配置文件 5.6 输出结果集到文件 Linkis-Cli 方式使用 1. 介绍 Link...
  • hypothesis testing(假设检验)

    假设检测 流式显著性检测 参考文献 假设检测   假设检测是统计中有力的工具,它用于判断一个结果是否在统计上是显著的、这个结果是否有机会发生。spark.mllib 目前支持皮尔森卡方检测。输入属性的类型决定是作拟合优度(goodness of fit )检测还是作独立性检测。拟合优度检测需要输入数据的类型是vector ,独立性检测需要输入数据...
  • 导入ORC文件数据

    导入ORC文件数据 数据集 环境配置 前提条件 操作步骤 步骤 1:在Nebula Graph中创建Schema 步骤 2:处理ORC文件 步骤 3:修改配置文件 步骤 4:向Nebula Graph导入数据 步骤 5:(可选)验证数据 步骤 6:(如有)在Nebula Graph中重建索引 导入ORC文件数据 本文以一个示例说明如...
  • 配置参数

    配置说明 Spark相关配置 Hive配置(可选) Nebula Graph相关配置 点配置 通用参数 Parquet/JSON/ORC源特有参数 CSV源特有参数 Hive源特有参数 Neo4j源特有参数 MySQL源特有参数 Hbase源特有参数 Pulsar源特有参数 Kafka源特有参数 边配置 通用参数 配置说明...
  • Word2Vec

    Word2Vector 1 模型 2 实例 3 源码分析 参考文献 Word2Vector   Word2Vector 将词转换成分布式向量。分布式表示的主要优势是相似的词在向量空间距离较近,这使我们更容易泛化新的模式并且使模型估计更加健壮。分布式的向量表示在许多自然语言处理应用(如命名实体识别、消歧、词法分析、机器翻译)中非常有用。 ...
  • 导入ORC文件数据

    导入ORC文件数据 数据集 环境配置 前提条件 操作步骤 步骤 1:在Nebula Graph中创建Schema 步骤 2:处理ORC文件 步骤 3:修改配置文件 步骤 4:向Nebula Graph导入数据 步骤 5:(可选)验证数据 步骤 6:(如有)在Nebula Graph中重建索引 导入ORC文件数据 本文以一个示例说明如...