请选择 进入手机版 | 继续访问电脑版

大道数据社区

 找回密码
 立即注册
查看: 38|回复: 0

大数据讲座 - 序

[复制链接]

82

主题

87

帖子

481

积分

管理员

荣誉管理

发表于 2020-2-13 04:41:59 | 显示全部楼层 |阅读模式
基础课程
副标题: -

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
关于大数据的讲座是我们公司计划中今年的第一个任务,但是录到一半忽然发现如果没有关系型数据库的基础,很多大数据的理论 (比如SQL) 是很难说清楚的,所以就先做完了关系型数据库讲座的录制,再开始这门大数据录制。
除了Patrick 认真录制每一期节目外,我也非常感谢我的同事 Frank 重新安装测试了分布式的数据环境,这个成就使得我们的在线学习环境更加有效和贴近真实的企业级应用的场景,所以我们在教学中就充分领路到 Spark 在分布式应用环境中的性能。这个分布式系统的安装和配置本身就是一门很好的学习课程,在这个基础入门之后,我们考虑把分布式系统的安装和配置再介绍给大家。
基于实际的实践,一直是我们教学的目标,而不是把我们所擅长的包装一下再冠宇一个似乎不落伍的技术。比如,在很多大数据培训班里,你总是会发现我的同行们在不停的介绍Java 甚至 .NET,虽然这也是我们技术的基本功,但把编程语言与大数据联系起来,似乎偏离了实际应用的主轴。
我们在知乎上经常看到问题 (很遗憾我已经不能上知乎回答国内朋友的问题了,因为我没有国内的电话号码可以绑定到我的账号,所以我只能看而不能提供任何帮助), 大数据从哪个方向入门好,学习什么工具等类似的问题。其实这个问题没有标准的答案,任何工具或者说软件都各有千秋,各有适合的场景,即使这样对一个初学者或者准备转行大数据的人来说,学一个入流的,不容易被淘汰的,市场或者就业情景乐观的技术和工具仍然是很重要的,毕竟我们的精力有限。对以上或者类似的问题,我们的回答基本上这样的:
1)服务器:Linux,架构:分布环境 Distribution
2)语言:首先 Python, SQL
3) 关系型数据库: MySQL, SQL, Oracle, PostgreSQL
4) NoSQL
5) Cloud: AWS
以上只是大致的和粗浅的答案,这不是我本人独有的技术特长,而是时代发展的选择。具体为什么说这些都是很重要和主流的技术,在我们各种技术讲座中都有提及和比较。当然你如果能看到我的这篇贴文,说明你已经有了跟我类似的选择。
关于这门课的视频,正向你所看到的我们的其他视频一样,都是以实际的操作演示为主,再结合理论的实用的精华。而这些理论的精华,往往是求职面试中的问题。虽然我把这门课叫做入门,但它的起点其实是很有挑战性的,比如说最起码你已经有了关系型数据库的知识,和相当的计算机理论,否则每听十分钟你就会去花大量的时间去理解这十分钟都讲了什么。一下是这门课的大纲和摘要:
1)大数据计算和分析简介,SQL 和 NoSQL 的区别
2)  Python 和 Spark 简介
3)Python 和 Spark 在Linux 下的安装和配置
4)  Python 大数据基础
5)Data Analysis with Spark
6)  NoSQL 与大数据
7)Sparking Programming
8)  PySpark
9)  SparkSQL
10)  Python Libaries: NumPy, SciPy, Pandas, Matplotib 等
11) 数据存储与传输

这门课仍然由 Patrick 老师主讲,他是我们中口齿最清晰的。 他的背景我就不多做介绍了,大家可以到LinkedIn 上去看的工作经历。

这门课的视频长度大约有30小时左右,当然我们也会根据学习进度和普遍关心的问题,增加必要的讲解时间。同时我们也会像其他课程那样,定期开直播直接回答学生的问题。

课程费用: $399
报名:info@bridata.ca
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|大道数据社区

GMT+8, 2020-2-22 15:38 , Processed in 0.097023 second(s), 24 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表