Skip to main content

计算方式说明

计算方式由 【功能点】 -【1、2月特殊处理】 - 【数据偏移】组成;

【功能点】:
指数熵自研的数据匹配AI算法,目前包含 相关性-正相关、相关性-负相关、涨跌-同涨同跌、拐点-全拐点这四种计算方式,您可以自由选择计算方式交由数熵AI进行匹配运算;

【1、2月特殊处理】:
由于春节假期不固定性可能会对1、2月数据造成影响,若您的数据会受此影响,为了增强数据的可比性,可采取【1、2月数据特殊处理】进行匹配;
在不同功能点下,我们会对外部数据里的1、2月进行不同的处理后进行匹配,以提高数据匹配的准确性;
【相关性-正/负相关】:1、2月数据合并至2月;
【涨跌-同涨同跌】:因为1、2月为合并数据,多为同涨,故1、2月数据不作参考进行匹配;
【拐点-全拐点】:因为1、2月为合并数据,数值较大可能会被误认为是拐点,1、2月数据不作参考进行匹配;
譬如从2012年起,国家统计制度不单独对1月份部分统计数据进行调查,1-2月份数据一起调查,一起发布。image.png


【数据偏移】:
你可能会关心数据之间的前瞻性或者滞后性,为了方便匹配到具有前瞻性或者滞后性的数据,您可以通过对【数据偏移】进行选择,从而对数熵数据库里的数据进行偏移后再匹配;

image.png
如上方数据中,分别为month(月份)、参考数据和value(值)。偏移是指month(月份)列不动,value(值)列整体向(前或者后)偏移x位。如向前偏移1位,即指value列整体向上移动一位,此时02月数据变为01月,03月数据变为02月,依次类推去与用户数据进行匹配计算;

如下方两组数据在未偏移之前,无法明显观察出明显的波峰波谷重合区间,将数据A向前偏移一位后,可以明显观察出这两组数据呈同涨同跌的趋势,同理,通过添加数据偏移的算法,我们可以算出在数据偏移的情况下与用户数据匹配的数据;

原数据数据A偏移1位后