征信之乱:一家公司黑市盗卖上亿数据,如今估值几十亿

2016年11月15日 澳洲金融圈


金融的核心,就是风险定价。


可惜,中国的征信体系一直没有建立起来。不知风险几何,又如何定价?


2013年才刚刚踏入历史正轨的征信行业,在互联网金融的倒逼下,正在变成风口行业,也因此成为各方夺利的草莽江湖。


部分征信和数据公司,直接从黑市上购买数据,甚至雇佣黑客去盗取数据,一家如此起家的公司,估值已达几十亿;


一些急于变现的公司,各地招聘代理,推销征信报告,年流水上亿;


而专门做这种备案交易的“中间人”已出现,并公开叫卖征信公司的备案。


这个敏感而核心的行业,正在经历它的野蛮时代。


1数据黑产


黑客KK最近接的一单生意,是盗取“企查查”的数据。


企查查是一家企业工商信息查询平台,其核心数据服务器放在云端。


如果直接入侵云端,对抗的是整个云端的安全系统,难度有点高。


KK擅长出奇招,“能走后门,绝不走正门”。


他收拾好电脑,藏到企查查的楼下,利用小工具强行破解公司的WiFi。


进入内网后,所有人的电脑,就如KK的掌中之物。他很快找到了登陆云端服务器的用户名和密码,将200万的公司缓存数据库拖出来。



▲ KK拖出的部分数据库截图


KK将数据出手,挣了几万元。


“这就是我的日常,隔几天干一单,挣几万到几十万不等”,KK最近两年的业务量,开始猛涨,月收入上百万。


KK认为,这和最近火了的征信风控行业有关。


尽管在1988年,国内第一家专业信用评级机构就已成立,但因为那时政府数据还未提倡公开,行业只得龟速发展。


直到2013年,《征信业管理条例》发布,可算给民间征信机构画出了跑道——对于企业征信,采取备案制;对于个人征信,采取牌照制。


目前,已有138家企业征信机构备案通过,而另外8家个人征信机构,正望眼欲穿,等待牌照下发,发令枪响。


中国的征信行业,至此才正式走上历史正轨。


在某种程度上,因为互联网金融的发展,也在倒逼征信行业尽快上道——试想,每家互联网金融公司,都得从无到有的搭建一套风控系统,成本何其高?


事实上,这个领域的玩家,远不止8家个人征信、138家企业征信。


易观高级分析师李子川称,很多所谓大数据公司,其实也在做征信公司的事,“征信和数据公司的界限并不清晰”。


也就是说,这个赛道上,涌入了三股势力:征信公司、大数据公司,以及各个金融公司的风控部门。


对于他们来说,第一步,就是获取数据。“得数据者得天下”,数据似乎拥有点石成金的魔力。


对数据的极度渴求,让黑市无限繁华。


目前,数据产业链分为两个部分,第一部分是黑客,他们负责盗取数据,是前方的入侵者。


而后端,还有一个数据商,他们作为中介,对接客户和黑客。


周晓青就是如此的一个中间商。


两年前,一个客户找到周晓青,要求购买车管所的数据。出价30多万,买400万条。


周晓青通过手下的黑客军团,很快搞到了数据。


除了车牌号码、所有人等基本信息外,连发动机号、车辆识别号、保险到期时间都有。



▲ 周晓青销售的车管所数据截图


此后,客户又多次光顾,合作购买工商、房产信息等。


“对方对我信任后,才透露自己是一家大数据公司”,周晓青称,当购买一些敏感数据时,“就让我从一家皮包公司走账”。


周晓青断断续续和他们做生意,获利几十万。


他也开始关注这家数据公司的新闻,“有意思的是,这家以黑市数据起家的公司,目前已估值几十亿。”


这绝非个案。


周晓青在两年时间内,接到大量的“订单”。


大部分都是数据公司、征信公司,或者是某公司的风控部门。


周晓青称,有几类数据最吃香:工商、身份信息、车辆、房产、电商交易、银行、运营商等。


这几乎是征信行业必备的底层数据。


一般有数据的政府部门和机构,下面都会有一两家代理商,可供需要数据的企业,申请接口。


一旦有人通过接口调取过数据,就会在接口本地缓存下来。


而这部分缓存数据,就是黑客重点进攻目标。目前黑市上交易的,大部分也是缓存数据库。


“第一,是因为代理商的安全意识不强,比较好盗取;第二,如果直接攻陷政府部门数据,有违法风险,没有必要”,周晓青称。




目前,专门靠盗取数据为生的黑客并不多,大概几千人。


而另外一部分数据的外流,来自内鬼。


但数据的中间商却多达几万人,数据的每一次流转,价值上万到百万不等,周晓青简单计算过,“地下黑市,早已形成万亿级别市场”。


2数据污染


地下黑市为何如此繁华?


如果按照正常途径获取数据,价格将极为高昂。


比如,从车管所调取一个人的数据,价格是2到3元,而黑市只需要2毛。


从银联调取数据,一个人是1到2元,黑市只需要1毛。


价格差距10倍不止,也难怪大家趋之若鹜。


尽管从商业逻辑上,有某种必然性,但黑市泥潭深不可测。


“通常黑市数据真假难辨,大家都是掺杂卖”,周晓青甚至自己都干过这种事,他把一份只有100万的银行VIP客户的数据,填充了900万的假数据。



▲ 周晓青造假后的银行数据截图


银行将活期余额超过800万的用户,称为七星级用户;超过1000万的,称为八星级用户。


“填充的,也是银行客户数据,只是级别很低,冒充高星级用户。但购买数据的公司,很难鉴别真伪”,周晓青称,一份黑市价值3万的数据,经过填充后,他卖了20万。


购买者一般事前会要求抽样检测,但数据一次销售,少则几万条,多则上亿,不可能完全鉴别真伪。


这个行业最大的隐患,其实来自“被污染的数据”。


周晓青除了接“盗数据”的活,也会接“放数据”的活。


曾经一家保险公司,将一部分篡改后的数据放出,“故意将一些高净值用户,加入骗保的黑名单,将一些骗保的人,加入高净值用户名单,以搅乱市场上其他竞争对手的视线”。


就像往数据流中不断注入污水,通过层层渗透,干净的数据也会被污染、发臭。


“我的任务,就是把这部分数据销售给其他保险公司,他们甚至愿意出比购买数据更高的价格推广污染数据”,商业战场上,人们似乎喜欢花更多的钱,去“损人不利己”。




黑市上交易的数据,完全没有进行过“脱敏”。


“你很难想象,根据现在的数据,我了解你的程度,可能超过你本人”,在黑产网络中,每一个人都被扒了底裤,毫无隐私可言。


就在两日前,《中华人民共和国网络安全法》通过,里面明确指出,任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息。


这也意味着,地下黑产卖的各种数据,未经授权,没有资质,都不可碰。


3征信模型


流窜在黑市中的数据流,鱼龙混杂、臭气熏天,在这个基础上建立的所谓的“大数据征信”或“风控模型”,又有几分可信度?


基础不稳,何以建高楼?


除了数据不干净,数据的同质化,也是征信行业发展缓慢的掣肘。


目前,市面上有三个数据库比较有意思:


一个是支付宝的芝麻信用分,来源于用户的淘宝交易记录和行为数据;


一个是腾讯,来源社交数据。


最后一个是前海征信,拥有平安集团的数据。


除此之外,大部分的征信机构手里的数据大体雷同。 




“数据存在大量的噪音,需要进行数据清洗、挖掘,才可以使用”,李子川称,数据并非点石成金,而是在一堆沙子中淘金。


“其实,现在大部分的征信公司,只是数据的集合地,并没有所谓模型”,某互联网金融公司负责人曾和很多征信公司合作,他觉得目前征信行业能提供的价值,极为有限。


互联网金融平台会给征信公司,提供一些借贷用户的信息,对方出一份《个人征信报告》。


报告中,除了一些正常信息外,还有几个维度,比如,是否是公司法人、诉讼信息、各大电商是否购物等。


“给我们就是一堆原始数据,并没有做任何衍生和关联性”,该负责人称,这对于风控起的作用有限。


由于缺少征信模型,征信公司提供的服务只能算差强人意。但打磨一个好的征信模型,又极其艰难。


“模型的验证需要很长时间”,春晓资本高级投资经理张磊表示,“需要把它放到一个5到10年的产品周期中观察。”


比如,房贷的周期是30年,车贷5年,没有跑完整个借贷周期,并不能判断这个模型的准确性。


“验证只是第一步,还需要持续地对模型进行迭代优化。” 


这是一个漫长过程,即使是周期比较短的消费金融,也需要重复验证、修正的阶段。


“这类服务节省了客户查询时间,有些进一步整理了各种数据的关联性,不能说没有意义”,易观高级分析师李子川表示,“但是这只是初级阶段,目前征信机构普遍没有提供更复杂产品的能力。”


今年年初,央行征信中心对各个银行进行调研。反馈的意见之一便是,希望在征信报告外,能够提供更深度、增值的产品。 


4备案变现


张磊认为,目前民间征信面临三大问题:数据源不充分、处理技术不优秀、产品落地场景不清晰。


因为征信公司提供的价值有限,一些确实没有核心竞争力的公司,开始采取一些“有意思”的方式来变现。


专做企业征信的绿盾征信,其模式就备受诟病。他们在全国招代理人,帮他们推销征信报告。


绿盾征信员工小星透露,目前绿盾已在全国发展了800多位代理,分成方式是“二八”,代理商拿大头,可获得80%的佣金提成。


小星称,目前要成为他们的市级代理,需要给绿盾一次性缴费50万,县级代理,20万。


而对县市级别代理人的唯一要求:在当地有点人脉。“企业资源、政府资源很重要,有企业资源,就可以直接销售,而政府资源,可以指定要这家的征信报告。这才值得合作”。


“一年就回本了”,小星称,一般市级代理一年能卖出几十万的流水。


如果按照800家代理,平均每个人缴纳30万代理费,绿盾征信已获利2亿元以上。


而平均每个代理商销售20万的话,每年的流水也上亿元。


他们所谓的征信报告,主要是6个维度:工商、行业、金融借贷、媒体、企业运营、市场反馈。


售价倒不贵,注册资本小于等于500万的,800元一次;大于500万的,1800元一次。




“但这个报告只针对单次,比如某次的企业合作、政府招投标等,一家企业一年可能需要几十份”,小星称。


然而这样的报告,到底有多少价值?


小星透露,征信报告的6个维度,其实都可以从网上查询到,无非是政府公开信息的汇总。


某征信行业的负责人称,绿盾征信倒是做了一个“不错”的生意,相当于用政府授予的“备案”资质套利。


一家被被处罚多年的制药企业,一度成为绿盾征信示范企业,不仅颁发优秀企业榜样牌匾,还成为绿盾官网的“信用楷模”。




这意味着,一些有“污点”的企业,将绿盾征信作为背书、洗白的途径。


《北京地区企业征信机构监管存在的问题及建议》也指出,个别征信机构夸大宣传,大量在异地发展代理业务,实质是“为了收取代理费,不惜损害相关主体权益”。


实际上,政府部门也注意到这一趋势,今年初,央行要求各家征信机构如实上报自己线下代理情况,尤其是代理机构业务风险情况。


而另一种隐秘的变现方式是——卖备案资质。


目前,专门做这种备案交易的“中间人”已经出现,他们的服务范围包括,帮助企业申请备案,也能帮助购买已有备案资质的公司。


报价是,北京地区征信牌照在100万以上,其他地区在80万左右。


手续费已到如此价位,备案的价格将何其高?


目前,支付牌照市面的售价已高达6亿,征信备案和牌照,是否会重复第三方支付牌照的激情与疯狂?



今年,央行已放慢了企业征信备案的审批速度。


这意味这,属于征信行业的野蛮时代,即将结束。


“它需要沉下心来,”李子川说,他并不希望这个行业走得太快。


作为金融中最核心的征信、风控行业,未来将成为行业的基础砖瓦,恐怕容不下一丝浮躁和怠慢。


(以上是一本财经风控系列深度连载第一期,敬请关注第二期,关于风控模型的那些内幕故事…)




往期深度稿件


催收江湖:黑客、暴力、色情争抢的万亿市场

风控之乱:零经验者,跳槽3次,年薪50万

不良资产价值万亿,互联网玩家如何夺食?

获客成本飙升千元的时代,他只需要2块多…

 苏宁、国美、迪信通在布局同一件事,价值万亿……

供应链金融在掀起怎样的风暴?大多数人并不懂……

金融圈闯入“猎杀者”,传统金融机构面临革命…

区块链在中国,为什么火不起来?

政府“狙击”,投资人却热衷无比的“网络互助”,怎么玩?

  欢迎关注金融科技第一深度新媒体  

收藏 已赞