美国哈佛大学科研实习营—数据分析方向 带你走进超牛实验室

方案特色

SEER Program癌症统计项目、基于Python&Pandas的微软和苹果股票分析、Interactive visualization失业率分析三个子项目,将根据学生的兴趣进行任务分工与合作。本实习中,学生将针对实际数据进行分析,并学习从中获取有用信息和进行信息预测的科学方法。此课题领域为计算机科学与统计科学的交叉。指导老师将全程带领学生,结合流行的数据分析方法,通过实际的数据分析案例,掌握如下五个重要的数据分析技术与方法。


· 数据整理、数据选择、数据采样、数据清理等数据技术

· 提供可针对大量数据进行快速、可靠访问的数据存储与管理技术

· 掌握能产生有效假设和洞见的数据探索与分析技术

· 基于统计的回归、分类、聚类等数据预测技术

· 实践可有效增强数据分析结果的直观性和可读性的数据可视化方法

适合人群

大二以上优秀本科生,计划申请数据分析、金融、计算机、统计、自动化等相关专业,为了让学生可以更好的完成科研项目,项目组会以笔试和面试的形式对学生进行筛选。

参与流程


想要申请美国理工科硕士的同学都知道,美国名校除了标化成绩之外非常看重科研经历。但是,大部分同学的科研可选择余地非常小,往往是相关专业的导师在做什么研究你就去参加,有时候这些经历其实和所申请专业的要求相去甚远。为此,天道针对理工科学生的这个需求,特推出了哈佛大学科研实习营项目,学生可以进入哈佛做研究,并获得相关证书。相信这段高能科研经历可以为你的申请助力!


项目简介

此实习项目专门为计划申请数据分析、金融、计算机、统计、自动化的学生所设计。学生将跟随哈佛大学博士后一同工作,实际进行数据预处理、数据管理、数据探索与分析、回归与分类、数据可视化等工作。实习结束后,导师会根据学生表现出具推荐信。


子项与内容

SEER Program癌症统计项目、基于Python&Pandas的微软和苹果股票分析、Interactive visualization失业率分析三个子项目,将根据学生的兴趣进行任务分工与合作。本实习中,学生将针对实际数据进行分析,并学习从中获取有用信息和进行信息预测的科学方法。此课题领域为计算机科学与统计科学的交叉。指导老师将全程带领学生,结合流行的数据分析方法,通过实际的数据分析案例,掌握如下五个重要的数据分析技术与方法。

√ 数据整理、数据选择、数据采样、数据清理等数据技术

√ 提供可针对大量数据进行快速、可靠访问的数据存储与管理技术

√ 掌握能产生有效假设和洞见的数据探索与分析技术

√ 基于统计的回归、分类、聚类等数据预测技术

√ 实践可有效增强数据分析结果的直观性和可读性的数据可视化方法

申请策略

项目收获

·学生将针对实际数据进行分析,并学习从中获取有用信息和进行信息预测的科学方法。

·指导老师将全程带领学生,结合流行的数据分析方法,通过实际的数据分析案例,掌握重要的数据分析技术与方法。

·实习结束后,导师会根据学生表现出具推荐信。

  

申请策略end 留学案例

常见问题

师资背景

任职教师是哈佛医学科学博士后学术项目在生物医学信息学方向的唯一华人, 担任哈佛大学项目组助理研究员。作为教学组成员,参与哈佛数据科学课程的教学工作。从统计分析到数据管理,从数据的聚类、分类到建立相应的模型,从数据预 测到可视化,拥有丰富且成功的研究和时间经历和经验。从事超过7年的数据挖掘,机器学习,统计分析研究,参与NIH 1R01LM011566关于基因相关的精准医疗数据分析。曾组建并领导过专业的数据分析团队,并成功创办一家盈利多年的商业数据分析公司。


行程安排

8月17日-8月30日

项目进度 相关

   抵达波士顿,入住酒店


   破冰活动


   城市速览,参观游览MIT校园,参观哈佛大学科技博物馆和实验室


   软硬件平台调试


   项目开题概述

   Python 编程

   统计初步与数据管理

   数据预处理技术:数据整理、数据选择、数据采样、数据清理

   SQL编程

   数据存储与数据访问

   数据探索与分析——提出有效的问题和假设

   方差与统计计算

   统计分析与应用

   针对高维大量数据的数据特征提取

   PCA、LDA、MDS

   数据特征提取算法

   重要的数据处理技术:数据聚类

   Hierarchical clustering,K-means

   聚类算法及应用

   游览波士顿自由之路


   参与哈佛校园活动,与哈佛学子面对面交流


   重要的数据处理技术:数据分类

   KNN,SVM

   分类算法及应用,Cross    Validation

   重要的数据处理技术:数据回归

   linear & logistic regression, SVM

   回归方法与应用

   数据可视化技术

   Data Visualization

   如何通过可视化增强数据分析结果的可读性

   美国总统选举预测数据案例分析

   Lab:Let’s be Nate Silver

   案例分析实践

   项目结题


   总结与展望


   Farewell Party,颁发毕业证书


   搭乘飞机返回北京


备注:实际行程安排顺序可能会根据机票或者天气等原因进行调整

版权声明:本文内容转载自网络,该文观点仅代表作者本人。登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。如发现本站有涉嫌抄袭侵权/违法违规的内容,请联系本站举报,一经查实,本站将立刻删除。