Pika是什么

Pika是DBA和基础架构组联合开发的类Redis 存储系统,所以完全支持Redis协议,用户不需要修改任何代码,就可以将服务迁移至Pika。Pika是一个可持久化的大容量Redis存储服务,兼容string、hash、list、zset、set的绝大接口兼容详情,解决Redis由于存储数据量巨大而导致内存不够用的容量瓶颈,并且可以像Redis一样,通过slaveof命令进行主从备份,支持全同步和部分同步。同时DBA团队还提供了迁移工具, 所以用户不会感知这个迁移的过程,迁移是平滑的。

与Redis的比较

Pika相对于Redis,最大的不同就是Pika是持久化存储,数据存在磁盘上,而Redis是内存存储,由此不同也给Pika带来了相对于Redis的优势和劣势

优势:

  • 容量大:Pika没有Redis的内存限制, 最大使用空间等于磁盘空间的大小
  • 加载db速度快:Pika在写入的时候, 数据是落盘的, 所以即使节点挂了, 不需要rdb或者oplog,Pika重启不用加载所有数据到内存就能恢复之前的数据, 不需要进行回放数据操作。
  • 备份速度快:Pika备份的速度大致等同于cp的速度(拷贝数据文件后还有一个快照的恢复过程,会花费一些时间),这样在对于百G大库的备份是快捷的,更快的备份速度更好的解决了主从的全同步问题

    劣势:

由于Pika是基于内存和文件来存放数据, 所以性能肯定比Redis低一些, 但是我们一般使用SSD盘来存放数据, 尽可能跟上Redis的性能。

适用场景

从以上的对比可以看出, 如果你的业务场景的数据比较大,Redis 很难支撑, 比如大于50G,或者你的数据很重要,不允许断电丢失,那么使用Pika 就可以解决你的问题。而在实际使用中,Pika的性能大约是Redis的50%。

Pika的特点

  • 容量大,支持百G数据量的存储
  • 兼容Redis,不用修改代码即可平滑从Redis迁移到Pika
  • 支持主从(slaveof)
  • 完善的运维命令

    当前适用情况

目前Pika在线上部署并运行了20多个巨型(承载数据与Redis相比)集群粗略的统计如下:当前每天承载的总请求量超过100亿,当前承载的数据总量约3TB

与Redis的性能对比

配置

  • CPU: 24 Cores, Intel® Xeon® CPU E5-2630 v2 @ 2.60GHz
  • MEM: 165157944 kB
  • OS: CentOS release 6.2 (Final)
  • NETWORK CARD: Intel Corporation I350 Gigabit Network Connection

    测试过程

在 Pika 中先写入 150G 大小的数据,写入 Hash key 50 个,field 1千万级别。Redis 写入 5G 大小的数据。Pika:18 个线程Redis:单线程Pika介绍 - 图1

结论

Pika 的单线程的性能肯定不如 Redis,Pika 是多线程的结构,因此在线程数比较多的情况下,某些数据结构的性能可以优于 Redis。

Pika 部分场景性能概况

Pika vs SSDB (Detail)

110

Pika vs Redis

2

如何从Redis迁移到Pika

开发需要做的

开发不需要做任何事,不用改代码、不用替换driver(Pika使用原生redis的driver),什么都不用动,看dba干活就好

DBA需要做的

  • DBA迁移Redis数据到Pika
  • DBA将Redis的数据实时同步到Pika,确保Redis与Pika的数据始终一致
  • DBA切换LVS后端ip,由Pika替换Redis

原文: https://github.com/Qihoo360/pika/wiki/pika-%E4%BB%8B%E7%BB%8D