中证报专访数据堂:专注数据 构建行业发展基石

  2011年,数据堂成立的时候,大数据概念仍未明。五年后的今天,大数据产业在中国百花齐放,数据堂已经成为一家市值超过25亿元的新三板公司,成为国内数据资源运营商中的排头兵。

  近日,数据堂CEO齐红威接受中国证券报记者表示,未来大数据行业聚集效应会越来越强,吸附性很强,发展趋势会类似电商行业。在大数据生态圈中,数据堂专注数据本身,定位于数据资源运营商,在整个行业中属于基石企业。

  定位数据资源运营商

  中国证券报:大数据行业的生态圈是怎样的?

  齐红威:2014年是大数据的商用元年,许多行业开始利用大数据真正地产生价值,现在很像电商井喷式发展前的2006年、2007年,市场培育已经完成,生态圈初具规模,商业模式逐渐成熟。价值万亿的大数据市场的大门已经打开。

  目前,大数据生态圈划分为云计算服务商、数据提供商、数据服务商和数据应用商四部分。其中,云计算服务商主要负责提供计算、存储和带宽等基础能力;数据提供商则提供各种数据,包括政府大数据、行业大数据、互联网大数据以及线下大数据等;数据服务商提供处理后的可应用的数据原料,给政府、行业等数据提供者提供统一服务,并利用自身的分析处理能力将大数据处理融合创造价值;数据应用商则利用经过初步处理的大数据开发各类应用,例如征信、个性化旅游和交通服务等。

  对比国外发现,国外的大数据生态圈在数据应用层下面有服务器技术,例如图像处理、语音处理;还有做基础技术的,有流式计算、分布式计算;再往下就是云计算,做基础架构的。整体上非常均匀,包括企业数量,每家企业的规模,上市公司的数量都很均匀。反观国内的,主要集中在应用层,基础层面就非常少了,产业链发展不均衡。

  中国证券报:数据堂在大数据行业中的功能定位是怎样的?

  齐红威:数据堂定位于数据资源运营商,在整个行业中属于基石企业。一方面,数据堂通过合作、购买的方式,从各个领域的数据提供商那里获取数据,然后将这些数据整合、融合起来,将产生1+ 1大于2的价值,实现数据增值;另一方面,通过对数据进行初步分析、过滤和分类,形成各种各样的数据产品,满足不同数据应用商的需求。因此,在大数据行业中,数据堂这样的企业是大数据变现闭环形成的关键,起到关键支撑的重要作用。

  打造数据领域中石化

  中证报:数据堂的商业模式是怎样的?

  齐红威:数据堂的商业模式可以形象地比喻成数据领域的中石化。我们通过各种渠道获取大数据资源,就像中石化四处获取原油;获取数据后,通过筛选、去重、脱敏等技术手段处理,将数据标准化形成各种数据产品,就像中石油对原油进行提炼,生产出97号、93号等不同品质的成品油;最后,给客户提供数据产品安全、方便、快捷的API接口服务,就像中石化建设加油站提供服务。虽然商业模式相同,但数据是可以无限复制的,石油却是不可再生的,这就是数据运营的魅力所在。

  中国证券报:数据堂数据来源的途径有哪些?

  齐红威:一类是纯线下数据,这类数据在现实世界中不是成规模存在的,需要一点点采集上来;第二类是行业数据,全国有3000多万家企业,企业在经营过程中会产生很多数据,数据对于企业是副产品,我们与这些企业合作,去创造价值;第三类是政府数据,政府有独特数据,我们现在也跟国家部委有合作。数据堂从成立以来,就是一个纯内资公司,同时我们也是这一领域做得最好的公司,充分获得政府机关的认可;第四类是互联网数据,这部分数据是大家都能得到的,这些公开数据价值有限,噪音比较大。因此,我们的主要数据源是前三类。

  中国证券报:数据堂数据资源优势在哪里?

  齐红威:数据堂的数据资源优势在线下数据。虽然互联网数据的规模很大,但是里面无用的信息也很大,同时内容又很单一。在对事物进行分析的时候,单靠线上数据很难完成。而线下数据收集起来很难,需要花费大量的人工、时间和资本才能从无到有完成一定量的积累,这正是线下数据的价值。

  数据堂的线下数据主要体现在人工智能数据和行业数据。人工智能数据包括图像数据、语音数据和文本数据,这些数据的量大,且在互联网上难以大规模获取。数据堂通过众包的方式,五年来共累计了50万全球众客(信息采集员),可以线下快速获取语音、图像、文本等数据。然后,通过筛选,去重,脱敏等技术手段处理,将数据标准化,以数据包的形式出售给客户。我们在AI领域的数据可以应用到无人驾驶、人脸识别、智能家居、人机交互、安防监控、智能电商等领域。

  从2015年开始,我们开始布局行业数据。由于大数据概念开始落地,有数据源的企业开始认识到数据价值,愿意合作了。目前,数据堂的数据涵盖了科技、信用、交通和医疗等数十大领域,主要用于金融征信、精准营销和智慧交通。

  跨业整合、异业应用,是数据堂行业大数据产品一大特色。跨业整合就是将多个行业的数据整合在一起,并找出它们之间的关联,形成数据产品。比如:征信,光靠基本身份信息是无法评估信用的,需要把在线交易等多种数据整合起来,才能评估个人信用。异业应用就是将一个行业的数据应用到另一个行业上,而不服务本行业。比如,数据堂的高速公路数据不运用在交通行业,而是运用在保险、旅游等行业。

  目前我们整合的数据,约有45000套,一套数据是可以解决用户一个需求,数据总规模超过2PB。

  行业未来聚集效应加强

  中国证券报:怎么看待大数据行业未来的发展趋势?

  齐红威:未来大数据行业聚集效应会越来越强,吸附性很强,这种发展路径特别像电商。电商实际做的是平台,并没有任何产品。大数据行业的问题是有数据的一方,数据种类非常单一,需要和更多领域的结合才能发挥更大的价值。数据获取并非难事,关键是如何整合,将各个数据源打通,这才有价值。

  以电商为例,从2003年-2005年,国内电商只有卓越和当当,大家也看不懂市场空间有多大。但到2006-2008年,涌现出很多电商,其中有很多是垂直电商、区域电商。经过几轮行业洗牌,已经基本发展成熟,能看出整个行业在进行最后整合,可能最后就剩下两家独大:B2B和B2C。

  大数据行业也是类似,2011年我们刚开始做的时候,资本方也觉得市场空间不大。到现在出现很多大数据公司,有综合的、垂直行业的,我认为未来发展趋势会类似电商行业。

  中国证券报:大数据行业面临哪些挑战?

  齐红威:我个人觉得,大数据行业最大的挑战有点像互联网金融,有一些作恶的企业把这个行业毁了,这是我现在最担心的一件事。我们知道有一些企业是属于“运作”型的,或者是用非正规的手段做事情的,这些企业会把行业毁掉。大数据是一个慢工出细活的行业,不说百年,至少几十年这个行业的发展是没问题的,就怕出现个别这样的企业,最后导致政府对整个行业进行“一刀切”式整顿。

  此外,大数据行业不能用原来2C的烧钱模式来做,2B模式下烧钱是烧不出来的。因为对我们的客户,补贴的意义不大。对数据堂来说,在数据源上会投入很大。数据相当于是我们的原材料,我们在原材料的购买和储备上要花很多钱。第二个要花钱的地方是人才引进,也就是研发。

2016-11-09 14:22:13         来源:海峡风     编辑:bj001
分享到:
更多

增值电信业务经营许可证    互联网新闻信息服务许可证    国际联网备案

   视听节目制作许可证  互联网药品信息服务资格证书   互联网出版机构 闽ICP备160236913号-1

海峡风网 版权 所有©1997-2017

未经书面授权禁止复制或建立镜像    举报邮箱:jubao@123777.net.cn