示例数据集

现在我们已经了解了基础知识,让我们尝试更真实的数据集。我准备了一份关于客户银行账户信息的虚构JSON文档样本。每个文档都有以下结构:

  1. {
  2. "account_number": 0,
  3. "balance": 16623,
  4. "firstname": "Bradshaw",
  5. "lastname": "Mckenzie",
  6. "age": 29,
  7. "gender": "F",
  8. "address": "244 Columbus Place",
  9. "employer": "Euron",
  10. "email": "bradshawmckenzie@euron.com",
  11. "city": "Hobucken",
  12. "state": "CO"
  13. }

奇怪的是,这些数据是使用 www.json-generator.com 生成的,因此请忽略数据的实际值和语义,因为这些都是随机生成的。

  1. curl -H "Content-Type: application/json" -XPOST "localhost:9200/bank/_bulk?pretty&refresh" --data-binary "@accounts.json"
  2. curl "localhost:9200/_cat/indices?v"

响应:

  1. health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
  2. yellow open bank l7sSYV2cQXmu6_4rJWVIww 5 1 1000 0 128.6kb 128.6kb

这意味着我们只是成功地将1000个文档批量索引到银行索引中。