实验 1
出租车数据分析
知识点: 1.SparkDataFrame操作 2.SparkSQL的API查询 3.SparkMLlib的KMeans算法应用
实验 2
数据分析进阶:数据可视化
知识点: 1.百度地图开放服务的使用 2.d3js数据可视化API的使用 3.简单网页的编写
出租车是我们生活中经常乘坐的一种交通工具,但打车难的问题也限制了我们更好地利用这种交通方式。在哪些地方出租车更容易打到?在什么时候更容易打到出租车?本课程将基于某市的出租车行驶轨迹数据,带你学习如何应用Spark SQL和机器学习相关技巧,并且通过数据可视化手段展现分析结果。
知识点: 1.SparkDataFrame操作 2.SparkSQL的API查询 3.SparkMLlib的KMeans算法应用
知识点: 1.百度地图开放服务的使用 2.d3js数据可视化API的使用 3.简单网页的编写
齐川同学 成都华为技术有限公司 共发布过 11 门课程
查看老师的所有课程 >
卡德要死
可以隐藏桌面之后看文档
左边实验文档太窄了,看不清楚哦
cd ~/kmResult cat part-* >> kmresult.csv sed 's/^.//' kmresult.csv >> tmp1.csv 实验2这个命令不就是生产csv文件的吗?
您可以在实验环境中点击提问按钮,或者在讨论区提问,并附上代码和报错的截图,能更高效地得到答案。
实验1的kmRDD2储存在kmResult里面,到了实验2使用kmResult时,没有发现kmResult.csv这个文件,只有part-0000X之类的文件,求解?
你好,实验1的kmRDD2储存在kmResult里面,到了实验2使用kmResult时,没有发现kmResult.csv这个文件,只有part-0000X之类的文件,求解?
实验1的kmRDD2储存在kmResult里面,到了实验2使用kmResult时,没有发现kmResult.csv这个文件,只有part-0000X之类的文件,求解?
很好的实验平台,赞一个!!!
完成数据实验
有些问题没解决,还有就是太卡了
感谢您的反馈。本实验基于1.6.1版本的Spark制作,考虑到目前大多数企业的实际情况,我们将适时更新到2.0+版本。
实验不错,但有些spark安装没有交代清楚, databricks save功能过期,已经是write了,其他可能有疑问的可以参考我的实验报告
good
还不错,就是中间除了小问题。