一、课程缘起与目标:

政府资料开放给民间利用以产生庞大经济利益,已经是全球最新的次世代国家级信息战略,随着开放数据趋势崛起,企业日益看重如何从政府开放数据与民间巨量数据中,挖掘能够转化成为商业价值的数据,甚至盼能预测未来、优化决策,因此,如何取得与运用数据、使得数据可以比较容易为人所理解将会是重要的关键,本课程将藉由国际标竿应用的细部拆解分析,带给学员的实务分享。

二、课程特色:

透过实机演练与讲解的方式,带领学员深入了解国际Open Data的应用方式,了解国际数据撷取、数据可视化与探勘的实务做法,以及在导入前中后的任务执行与注意重点。实作上将运用国际Open Data来做为应用之练习,使学员具备使用Open Data开拓市场或解决问题的能力。

三、适合对象:

  • 具备数据处理分析基础知识,欲了解实务流程者
  • 企业管理、营运与运用有兴趣者
  • 负责企业规划与导入之人员
  • 参与本课程需具基本R programming背景。
时间 主要内容
Day 1 国际Open Data开放现况与应用案例
  • 国际Open Data数据集内容
  • 国际Open Data应用案例
Day 2 国际Open Data应用(Part 1)- 数据取得
  • 网页数据撷取与API接口数据
  • 数据导出与各种数据库链接
  • 本地数据的处理
  • 特别类型数据的处理
  • RStudio Server云端多人协作程序设计与代码版本控制
  • 实例操作:抓取网页上的htmlTable,对 接流行的API,分析facebook,linkedin 与twitter资料
Day 3 国际Open Data应用(Part 2)- 数据运用
  • 资料整理、辨识、分类,合并与综整资料
  • 基于knitr的自动化报告开发
  • 整合R语言开发web应用程序
    • 案例1:开发每日天气APP
    • 案例2:用shiny开发小型BI系统
  • Amazon云端Hadoop cluster的设置
  • 大数据的处理方法,Hadoop架构与Rhadoop
  • 实例操作:使用纽约的共享数据citi bike来看季节性的共享脚踏车使用情况;设置 个人亚马逊Hadoop cluster进行map reduce工作。
Day 4 国际Open Data应用(Part 3)- 数据可视化
  • 各种数据可视化的应用工具,如Tableau、D3.js、dc.js、Echarts等。
    • 利用R、D3.js进行可视化。
  • 实例操作:纽约Knicks球队的赛季表现分析, 并可视化;
  • Tableau结合R进行集群数据挖掘分析与可视化
Day 5 交互式资料探勘竞赛
  • 学员各自选择项目进行实际开发,并由讲师与助理辅导协助学员具体操作,最后由各组学员进行成果分享与交流。
  • 学员表现合格将获得纽约资料科学学院的Open Data Practice证书。
本课程曾于2014年10月21~29日在台北开课,查看详情

联系我们

如果对我们的培训感兴趣,想了解更多详情,请与我们联系,我们会为您提供更深入的讲解。

    400-0711-370

    contact@supstat.com.cn