立即注册
登录
搜索
前端开发
后端开发
虚幻引擎
U3D引擎
体感研发
数据库
论坛
BBS
本版
帖子
用户
麒麟软控
»
论坛
›
麒麟软控
›
数据库
›
时序数据浪潮下,私募基金该如何进行数据库选型? ...
返回列表
发新帖
时序数据浪潮下,私募基金该如何进行数据库选型?
古月西乡
古月西乡
当前离线
积分
6
1
主题
5
帖子
6
积分
新手上路
新手上路, 积分 6, 距离下一级还需 44 积分
新手上路, 积分 6, 距离下一级还需 44 积分
积分
6
发消息
发表于 2022-12-9 18:29:46
|
显示全部楼层
随着
时序数据
的飞速增长,传统
关系型数据库
越发难以支撑
海量高频
的数据处理。尤其在私募基金行业,面对每日高达
GB
级新增时序数据的
高速读写
、
实时计算
等需求,多家机构开始寻求更好的解决方案来应对新一轮的业务挑战——行情存储,复杂计算,实时交易……
在这场时序数据的浪潮下,作为弄潮人的私募基金究竟该如何进行
数据库选型
?他们关注哪些数据库?又该从哪些维度对数据库进行对比测试?本文摘选 WILLIAM O'NEIL、辰钰资本和睿凝资本三家优秀私募的数据库选型经验,希望为各位读者提供些许参考。
01
WILLIAM O'NEIL:两家争霸,非 Kdb+即 DolphinDB?
下文引述自 WILLIAM O’NEIL 的高级工程师陆强
“之前我们研究中低频数据,主要使用 Python 进行分析计算。当公司有处理
高频数据
的需求时,我们发现这套系统并不能满足对数据处理的理想需求,尤其在
数据分析
方面,这套系统的反应速度非常慢。
于是我们在市面上寻找匹配公司需求的新产品,希望这款产品能够实现
高效处理时序数据
,并且
方便
未来
扩展
。经过一番市场调研与产品性能测试,我们在选型会议上讨论了三套方案。
第一套方案是
Kdb+
。由于 Kdb+
语言
晦涩,
学习成本
过高,这套方案并没有被采纳。
第二套方案是
NoSQL Cassandra
。经过讨论,这套方案需要额外招人进行系统的重构搭建,并且后续需要专人进行
维护
。这会极大增加
成本
,所以并没有采用。
第三套方案是
DolphinDB
。当时是21年初,市面上已经出现了金融行业处理时序数据“非 Kdb+即 DolphinDB”的两家争霸趋势。我在会议上对照 Kdb+的算法例子做了一些 DolphinDB 的
性能测试
,然后展示了同样的例子使用 DolphinDB 语言来写,
脚本
明显会变得更加
简洁
。在一些例子中,DolphinDB 的性能超越了Kdb+。当时基金经理们大多熟悉 Kdb+,我在会议上做完演示后,他们也非常惊讶于 DolphinDB 的优秀性能。
最后在方案表决时,DolphinDB 以压倒性优势胜出。”
更多案例内容点击《DolphinDB 助力 WILLIAM O’NEIL 笑傲股市》
02
辰钰资本:存储大 PK,谁才是处理高频交易数据的专家?
下文引述自辰钰投资董事长李栋、董事陈志凌、数据库工程师苏虎臣
“在使用 DolphinDB 前,我们先后使用过
文件系统
、
MySQL
和
PostgreSQL
存储数据。
之前使用文件系统会先将数据落在本地,然后用 Python 进行计算。但是文件系统在实际应用中存在一些不足。首先,在存储过程中文件系统的
IO
是一个很大的瓶颈。其次,在处理大量数据时,文件系统过于庞大,进行
存储
、
查询
等操作费时且费力。同样地,MySQL 和 PostgreSQL 这两个数据库在实际测试中都非常慢。如果要处理的数据量很大,系统甚至会无法工作。
因此,我们想要搭建一套新的系统。主要考虑的数据库有
MongoDB
、
Kdb+
和
DolphinDB
。
由于 MongoDB 缺乏
函数支持
、旧代码改起来比较费劲,KDB+的
语言
较难
学习
,整体
上手
很慢,所以我们放弃了这两个数据库。
反观 DolphinDB,
性能
比 Kdb+更好,
语言
类 SQL 容易上手,同时提供丰富的
金融函数
。在低频转向高频的过程中,原来的系统无法处理骤然剧增的数据,但 DolphinDB 是这方面的专家,相较之下新系统的
速度
可以
提升10倍
左右。在处理逐笔数据时,相比之前使用过的文件系统,现在的系统效率得到大大提升,并且使用起来也非常方便。此外,DolphinDB 作为
一站式数据库
,综合了分布式存储、编程建模和高性能计算,可以在研究时快速抽取某些特定的数据,这大大
加快
了我们的
研究进度
。”
更多案例内容点击《如何提升量化投研效率?来自辰钰投资的案例分享》
03
睿凝资本:性能之外,我们还应关注哪些方面?
下文引述自睿凝资本 CEO 王睿、CTO Jack
“针对业务需求,我们参考
DB-Engines
的
排名
将
InfluxDB
、
Kdb+
和
DolphinDB
列入选型名单,并且从数据的
批量写入
、
查询
和
实时计算
等方面进行测试对比。根据实际结果来看,DolphinDB 作为当时国内排名第1、世界排名第12(目前排名第8)的时序数据库,性能远远超过其他几家排名更高的数据库。
除了在批量写入、查询和实时计算等方面的性能卓越外,DolphinDB 已经超越了传统数据库简单的存储和查询功能,内置众多量化金融常用的
数据分析函数
,可以充分满足我们
编程建模
的需求。
在
学习成本
方面,DolphinDB 支持类标准 SQL 的语法,脚本语言类似 Python。相比学习 Kdb+晦涩的脚本语言,我们的技术人员尤其是新人可以更快上手 DolphinDB,这大大节省了技术人员的培训成本和使用成本。
在
流计算
方面,DolphinDB 自带优秀的流数据引擎,非常有利于研发的策略在生产环境落地。
在
技术服务
方面,DolphinDB 具有国内专业的技术支持团队,可以及时解答我们的问题,也会配合我们的需求开发新功能。
综合考虑后,我们选择了性能强悍的国产数据库 DolphinDB。”
更多案例内容点击《实时行情难处理?睿凝资本选择 DolphinDB 解决流数据难题》
04
时序数据库到底怎么选?
在数据库选型时,我们不仅要关注数据库在批量写入、查询和实时计算等方面的性能表现,还应该考虑数据库的时序特性与金融属性,同时要了解产品的学习曲线与技术服务。使用一款优秀便捷的数据库不仅可以有效提升团队的研发效率,同时能帮助我们把握更多的投资机会、挖掘更大的投资价值。
上一篇:
数据库日常实践优质文章分享(含Oracle、MySQL等) | 11月刊
下一篇:
SQL经典练习题(openGauss数据库)下
回复
举报
使用道具
分享
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
快速回复
返回顶部
返回列表