培训受众:
大数据研究者,大型企业公司,网络工作者
课程收益:
深入详细的分析大数据,结合实际分析大数据与商业结合。
课程大纲:
任务0
1. 大数据的定义,科学发展渊源;
2. 如何科学看待大数据?
3. 如何把握大数据,分别从“知著”、“显微”、“晓义”三个层面阐述科学的大数据观.
任务1
1. 大数据与云计算;
2. 私有云计算平台经济的解决方案:如何集成OpenStack,Xen,Hadoop,MongoDB,Nutch等开源项目搭建最经济的云计算
平台,实现大数据的基础技术架构平台
3. 大数据存储架构、大数据并行计算平台、大数据应用系统构建。
任务2
1. 通用搜索引擎与大数据垂直业务的矛盾
2. 大数据精准搜索的基本技术:快速增量在线倒排索引、结构化与非机构化数据融合、大数据排序算法、语义关联、自动缓存与优化机制;
3. 大数据精准搜索语法:邻近搜索、复合搜索、情感搜索、精准搜索;
4. 大数据精准搜索应用案例:中国邮政搜索、国家标准搜索、内网文档搜索、舆情搜索;
任务3
1. 语义理解基础:ICTCLAS与汉语分词
2. 内容关键语义自动标引与词云自动生成;
3. 大数据聚类;
4. 大数据分类与信息过滤;
5. 大数据去重、自动摘要;
任务4大数据搜索与挖掘平台工具实训
1. 学员采用大数据搜索与挖掘进行实战演练
2. 大数据与新型电子商务
3. 电子商务基于大数据技术的推荐系统
4. 电商如何应对大数据时代的挑战?
任务5
1. 电子政务平台的大数据特性
2. 公文的主题词自动标引
3. 北京外事办典型电子政务平台的大数据应用案例分享
任务6
1. 微博大数据宏观特性挖掘
2. 微博微观行为建模
3. 微博大数据监控系统应用案例