链家为顶级程序设计大赛开放真实房屋大数据

中国经济网2017-08-14 09:41

国内顶级程序设计赛事——链家算法大赛暨2017计蒜之道总决赛于8月13日在链家总部开赛。为此次赛事,链家特地开放了多年积累的庞大、真实的房屋数据,选手们通过特征工程和模型算法的训练研发,对房屋价格进行估算,展现了一场房地产与大数据的精彩碰撞。

开放数据,理论联系实际生活

此次算法大赛主要面向爱好计算机科学的大、中、小学生以及社会人士,意在为计算机科学的学习者们提供一个竞技、交流的平台。

此次大赛侧重比赛内容的实用价值——对当下公众普遍关注的房屋价格进行预估。比赛的试题全部来源于链家2016年下半年至2017年8月上旬期间在北京成交的部分房源的真实数据,在对房源信息做了脱敏处理之后,要求参赛者根据房屋朝向、居室、挂牌价等公开数据进行特征工程和模型算法的训练研发,产生机器学习算法模型,分别从多个角度对一套房屋的市场价格进行预估。最终,以准确率更高的算法胜出,加入到链家房屋智能评估系统的实际算法应用中去。

大赛现场,链家技术副总裁惠新宸在致辞中表示,链家此次举办算法大赛,开放真实的房源数据,就是希望能让专业领域的学生在学习过程中突破理论,与实际生活相结合。同时,链家也期望有更多优秀的程序设计人才加入企业,一起将数据背后的价值挖掘出来。

在技术驱动的信息时代,顶尖算法和程序设计人才已经成为行业乃至社会创新的新动力。计蒜之道程序设计大赛自2015年举办以来,不仅为国内外计算机科学爱好者提供一个竞技交流的平台,同时携手业界知名科技企业一同挖掘优秀人才,微软、滴滴和链家先后成为这个优秀赛事的主办方。

真实应用,推动大数据产品化

此次算法大赛是基于链家房屋智能评估系统,系统在买家,卖家,经纪人三方的交易中扮演着价值信息锚点的作用。

房屋智能评估系统基于链家多年积累的海量真实成交数据、挂牌数据,带看数据和楼盘字典数据,通过系列机器学习算法,智能估算房子成交时的可能市场成交价格,以方便所有使用者平等便捷地得到完全中立的房屋价值信息。

模型使用了房子的基本特征、周边属性,也加入了对市场的洞察。

从使用上来说,用户可以直接输入具体的房屋地址然后便捷地进行价值评估,也可以只告诉系统所需评估房源的基本信息,系统就会实时给出这套房子在未来的靠谱的可能的成交价格。

估价系统背后是一系列的子模型,通过STACKING的方式结合起来进行联合预测。每个子模型考虑了不同的特征组合,分别从多个角度来拟合房屋的价格;每个子模型的算法也不尽相同,其中包括了ANN,GBDT, RANDOM FOREST 和HEDONIC等经典的机器学习算法。简而言之,就是通过模型组合方式进行联合预测。

链家的房屋智能评估系统的准确率目前处于国际领先水平,已支持多个城市的房屋估价功能,包括北京,南京,深圳,天津,成都,杭州等。

可以说,链家房屋智能评估系统是人工智能和大数据技术在二手房交易领域的一次成功的应用。

技术附能,提升品质化服务

作为年交易规模超过16万亿元的中国第二大行业,房地产服务还有很大的优化空间。对消费者而言,交易过程中,信息的真实可靠直接决定交易感受,甚至会影响决策。这就对数据提供了高要求:数据更准确,定位更精准。

致力于打造“住”的入口的链家,一直在通过数据不断提升服务品质。

作为以数据驱动的全价值链房产服务平台,链家集房产交易平台、房产信息平台和服务者生态平台为一体。按照链家集团CEO彭永东的设想,“哪些房子更有可能拿出来卖,什么样的房子成交的可能性更高,这些都可以通过数据进行相应的分析。”

链家拥有业内独有的海量真实数据,无论是通过真房源系统辨别真假房源,利用房屋智能评估系统评估房屋价值,还是依靠可视化服务掌握交易流程,无一不说明链家独有的数据实力。

目前,链家拥有业内独有的房屋数据、人群数据、交易数据。从2008年开始建立“楼盘字典”,目前已囊括全国36个城市7500万套房屋的标准信息,拥有1200TB数据量,每套房屋由300个字段描述,还用107个维度定义用户,125个维度定义经纪人,在此基础上形成的包括带看、交易在内的行为数据,每天超过30G。链家依靠“楼盘字典”打造出“地图找房”、“房屋智能估价系统”等大数据产品,为提升交易效率、改善用户体验、升级服务品质不断努力和尝试。

通过交易流程的可视化、信息无差别分享以及安心服务承诺等保障每位消费者的权益,链家“链接人与服务”, 让每个买房人、卖房人、经纪人顺畅交互,不断提高服务效率、提升服务体验,为用户提供更安全、更便捷、更舒心的综合房产服务。

正文已结束,您可以按alt+4进行评论