第十届中国R会议(兰州)
暨西北地区数据科学会议

陈江

人工智能化大数据

NA

陈江教授是美国雪城大学管理学院财务金融系和 Kiebach International Business Research Center的荣誉退休教授,目前担任美国Scientific Computing Associates Corp.的首席数据科学家、中国人力资源与社会保障部智力引进专家,参与指导政策仿真实验室的建设和运行,另外是山东省科学院战略所经济产业研究室的智库人才专家,是国内在学术及应用方面都经验丰富的跨领域专家。陈江教授的研究方向为时间数列分析预测方法, 金融风险管理,科技管理,中国经济转型区域经济比较,临床医学实证研究,大数据分析应用。

谢佳标

大数据挖掘利器—R语言

R语言作为一个可进行交互式数据分析和探索的强大平台,起着举足轻重的作用,R语言的免费开源使得很多公司用来它处理数据、展示数据、分析数据、完成模型。本主题将快速带领大家体验R语言在数据挖掘方面的便捷及强大,最后对基于R的企业级大数据分析平台--Microsoft R Server各功能进行介绍。

资深R语言用户,有十年以上数据挖掘工作实战经验,多次在中国R语言大会上作主题演讲。撰写书籍《R语言与数据挖掘》、《数据实践之美》和《R语言游戏数据分析与挖掘》在各大网店有售。

汤辉

GrpString:一个分析和比较字符串组的R包

GrpString是2017年发布的用于处理和分析字符串组的R包,侧重于两组字符串的定量比较和统计分析。它为研究人员和数据分析人员提供了如下工具:由事件序列来准备字符串,从字符串中提取共同模式以及比较字符串组之间的模式。用这个R包还可以计算字符串的转换矩阵和复杂度,获得字符串的聚类信息,并检查两组字符串之间的统计差异。除了介绍包的主要函数,还将用实例演示如何使用此包分析眼动扫描途径数据。

美国俄克拉荷马大学化学博士。目前在佐治亚大学化学系从事科学教育研究,主要方向是眼追踪的应用及眼动数据分析方法、教育数据挖掘和分析。有五年R经验。近年致力于介绍和推广R在美国化学教育研究中的应用,包括发表相关文章和会议演讲。

翁称誉

北京遇上西雅图—心理学遇上大数据

翁经理的演讲分六部分:美国与中国不同的地方;最古老的大数据应用;心理学在大数据的实践;数据的价值在哪里, 数据创造解决方案还是解决方案决定数据来源;最性感的解决方案;未来的发展方向。

翁称誉先生,毕业于中欧国际工商学院MBA ,目前任职于微软(中国) 有限公司,担任大数据与人工智能解决方案部行业解决方案高级经理,曾任职于苹果(中国)与仁宝电脑,是制造业与零售业, 专案管理, 与物联网与人工智能等领域有丰富的行业经验。人有一双眼,一眼回顾过去,一眼放眼未来,现今人人都知道大数据是目前企业最宝贵的资产,但是数据之所以有价值的原因,在古老的历史都已经印证。

李吉元

人工智能化大数据分析

电信运营商大数据相关工作介绍,包括数据源,大数据处理技术,大数据系统架构,大数据应用等。

甘肃移动高级IT技术专家,从事经营分析及大数据相关技术工作多年。

张耀南

地学科学大数据体系建设思考

本次演讲内容主要是关于地学科学大数据体系建设的系统思考。

张耀南,博士,研究员,博士生导师。现任中国科学院寒区旱区环境与工程研究所计算机网络室主任,甘肃省高性能网格计算中心主任,中国高性能计算专业委员会委员,甘肃省互联网络协会常务理事,中科院研究生院网络数据库兼职教授,中科院资源环境科学信息中心学位评定委员会委员。研究方向为地图学与地理信息系统(陆面数据同化、陆面定量遥感、寒旱区遥感、寒旱区地理信息系统、地学e-science)。

罗立辉

R语言与地学建模:从函数到可视化

本演讲以罗立辉先生最新开发的PIC(Permafrost Indices Computing)模型为例,从简单的方程构建到复杂的多层次的函数计算,在从多点到空间的模拟、统计分析和可视化,系统的介绍基于R语言的地学建模。

罗立辉,中国科学院西北生态环境资源研究院副研究员、中欧联合培养博士、硕士生导师。先后主持了国家自然科学青年基金、中科院青年人才成长基金、中国博士后面上基金、中国博士后特别资助等项目。在国际和国内杂志发表论文10多篇,并担任《Science of the Total Environment》、《科研信息化技术与应用》等多个期刊的审稿人。指导的硕士研究生开发的“机器人艺术家”获得了2016年微创客高校挑战赛三等奖,开发的多套科学计算软件在Github上共享。

成慧敏

数据融合与信用风险评估

面向小微商户以及个人消费的小微信贷是当前互联网金融的重要发展方向,并且正在经历爆发式增长。在这个增长过程中,如何在没有实物抵押的情况下,通过互联网大数据分析,实现快速准确征信是一个非常重要的问题。为此,不同的数据都可以做出一定的贡献。研究过追踪用户手机行为数据,利用R软件建立互联网征信的信用评分模型。研究表明,用户手机行为对于用户信用评估具有重大作用。本次分享主要基于考拉征信信用评分模型,介绍利用R软件进行模型设计和数据处理的一般流程。

成慧敏,中央财经大学统计与数学学院硕士,曾在电信、金融、互联网等领域从事数据分析工作。对数据分析成果在业务和产品上的应用有浓厚兴趣,擅长数据集成与治理、用户行为画像研究、信用风险建模。

黄恒君

R语言与互联网数据价值发现

本次分享主要结合科研、教学实例,说明R语言在互联网数据(包括数字、文本、地理信息和图像)采集与分析中的应用。

黄恒君,兰州财经大学统计学院副院长,副教授,硕士生导师,入选陇原创新人才扶持计划;中国统计教育学会理事、高等教育分会常务理事;甘肃经济发展数量研究中心特聘研究员。研究兴趣为异源异构数据整合、聚类算法、函数型数据分析,应用领域主要涉及统计名录库构建及其数据质量问题。